
第四章 完全信息动态博弈的基本理论.docx
8页第四章完全信息动态博弈的基本理论一•回顾如何用标准型表述、刻画博弈?回顾如何用扩展型表述、刻画博弈?二. 信息集1. 观察下列两个扩展型博弈在结构上有什么区别?1) 0) _1) 3)1) 0) -1) 3)2. 参与人i的信息集是指由这样一些决策节点组成的集合,第一,i的信息集中每个节点都 是i的决策节点,即如果博弈进行到这一步,轮到i行动;第二,当博弈到达i的某个信息 集,参与人i并不知道自己究竟已经到了信息集中的哪个节点3. 对信息集的进一步理解A信息集用于表示博弈参与人在轮到他行动时所掌握的信息B信息集定义的第二点意味着在同一个信息集的节点有着相同的可行的行动集(思考:为什 么?)C同一个信息集的节点不能相互构成前续节点与后续节点的关系4. 思考:画出下列博弈的博弈树或扩展型表示第一步,参与人甲从行动集(L,R)中进行选择;第二步,参与人乙观察到参与人甲的行 动选择后从自己的行动集(M,N)中进行选择;最后一步,参与人甲只能观察到过去的选 择是否是(R,N),并从行动集(V,W)中进行选择5. 完全完美信息(complete and perfect)博弈与完全不完美信息(complete and imperfect) 博弈(1) 完全信息与不完全信息:区分完全信息与否的标准就看每个博弈参与人的支付函数是 否是博弈的公共知识。
2) 完美信息与不完美信息:区分完美信息与否的标准就看该博弈的每个信息集是否都是 单点的(singleton)完美信息意味着该博弈的每个信息集都是单点集思考:完美信息 博弈意味着博弈参与人对所参与的博弈究竟知道些什么?意味着在博弈的每个行动时刻轮 到行动的参与人知道博弈迄今为止的全部历史3)不完全信息也意味着不完美信息;完美信息必定也是完全信息的三. 行动(action )与策略1. 在博弈的扩展型表示中,每个决策节点的一根“树枝”就代表着该参与人在此时的一个 可供选择的行动2. 参与人i的策略是指参与人i的一个完整的行动计划,即它规定了参与人i在每一个要求 他行动的contingency之下所采取的可行的行动,即参与人i在每一个要求他行动的信息集 之下所采取的可行的行动3. 思考:写出动态夫妻博弈中夫妻双方的所有策略4. 思考:为什么参与人的策略必须对似乎好不可能出现的博弈情形也规定如何选择行动? 因为不这么做,就无法找出参与人针对对手策略的最优反应以及运用纳什均衡四. 完全信息静态博弈与完全信息动态博弈的标准型表示与扩展型表示1. 思考:如何用扩展型表示囚徒困境与静态夫妻博弈?如何用标准型表示动态夫妻博弈?3,13,10,00,0-1,-11,31,3-1,-1FFFBBBBF2. 结论与启示:(1) 任何博弈既可以用标准型表示,也可以用扩展型表示;不过,标准型更适合表示静态 博弈,扩展型更适合表示动态博弈。
2) 识别静态博弈的真正标准不是物理时间上的同时,而是关于行动的信息,即每个参与 人是否知道对手过去的行动选择3) 标准型表示与扩展型表示的优点标准型能够清晰地展示出每个参与人的策略集;扩展型能够清晰地展示出参与人在每个博 弈阶段的信息状况3. 求解动态夫妻博弈的纳什均衡并思考:这些纳什均衡之间有哪些不同?您认为哪些纳什 均衡是合理的?哪些是不合理的?一个结论与启示:动态夫妻博弈存在多重纳什均衡,其中有些纳什均衡包含着不可信的承诺(commitment,包括威胁 threat和允 promise两种形式)承诺的可信性是动态博弈的核心问题,由于博弈存在动态结构,于是就可以研究参与人关 于未来行为的威胁与允诺对其他参与人当前行为选择的影响五. 子博弈(subgame)1. 子博弈是指始于某个单点信息集上决策节点的所有后续节点,而且不能分割或破坏原博 弈的信息结构原博弈也是自身的一个子博弈,但本课以后所说的子博弈均是小于原博弈的子博弈2. 找出下列博弈的子博弈(略)3. 思考:为什么子博弈不能分割或破坏原博弈的信息结构?理由有两条,一是因为一旦破 坏了原博弈的信息结构,就无法利用子博弈分析原博弈;二是因为只有这样才能保证该子 博弈之前的博弈历史成为所有子博弈参与人的公共知识。
六. 子博弈完美(subgame perfect)纳什均衡 完全信息动态博弈的解1. 子博弈完美纳什均衡是指这样的一些纳什均衡,该策略组合在每一个子博弈均构成纳什 均衡2. 子博弈完美纳什均衡有助于在完全信息动态博弈中剔除包含不可置信承诺的纳什均衡; 它是博弈论对完全信息博弈提出的解概念,是对纳什均衡概念的进一步提炼,这是理性原 则在动态博弈中彻底运用的结果3. 逆向归纳 一寻找子博弈完美纳什均衡的有效方法(1) 逆向归纳法(backward induction)的基本做法是从求解最后一个子博弈的纳什均衡开 始,不断向后推,直至到初始决策节点,以求解整个博弈的纳什均衡以这种方法找出的 纳什均衡必定是子博弈完美纳什均衡2) 思考完全信息动态博弈的基本思路是:向前展望一一以寻找出原博弈的子博弈;向后 推理——以求解原博弈七. 前向归纳法1. 如果某博弈是一个更大博弈的一部分,则小博弈的均衡策略就可能依赖于大博弈2. 前向归纳法(forward induction)(1) 例子:博士学习计划(故事略)(2) 前向归纳法:参与人通过其他参与人早期的、过去的决策推断出一些信息,以帮助求 解动态博弈。
前向归纳法与逆向归纳法之间并没有冲突,而是相互补充八. 完全信息无限期讨价还价理论1 .什么是讨价还价讨价还价是指各方具有共同的合作利益,但对合作利益如何分配却存在分歧可以描述为: 有一块大小一定的蛋糕要在若干人中间分配,各方就如何分割蛋糕进行讨价还价,每一方 都试图最大化自己的蛋糕份额,如果无法达成分配协议,则谁也不能分享这块蛋糕;如果 达成了协议,则各方按照协议的规定进行分配2.完全信息无限期讨价还价的非合作博弈研究核心成果是Rubinstein的两人无穷期讨价还价博弈,该博弈唯一的子博弈完美均衡结局是: 假设蛋糕的大小为,参与人风险中性,以及无协议时双方的报酬为0,则双方获得的蛋糕份额为:第一个开价的的人(A )获得:一^兀,第二个开价的人(B )获得:一4^兀r + r r + r这个结论告诉我们:谁相对更加有耐心,谁的讨价还价力量就相对更大;这个结果与纳什 讨价还价解等价总结与回顾:(1)前面所分析的所有博弈,不论是静态的还是动态的,具有一个共同的特 点:所有的博弈都是一次性的2)第二章思考的社会困境解决办法总是求助于外在的强 制与约束力量,能否存在其他的解决机制?(3)如果相同的博弈多次重复,是否会因为存 在未来惩罚不合作行为与奖励对手合作行为的机会,而有助于博弈各方的合作?九. 重复博弈1. 重复博弈的一些例子2. 重复博弈是指相同的参与人重复地进行相同的博弈,而且在进行某阶段的博弈时,前面 所有阶段的博弈结局是所有参与人的公共知识。
这个被重复进行的博弈就被称之为阶段博 弈(stage game)3. 有限重复博弈(0)有限重复博弈:给定阶段博弈G,G (T)表示阶段博弈G重复T次的有限重复博弈, 其中第t次阶段博弈开始时,对全体博弈参与人来说,所有t-1次阶段博弈的结局都是可 观测的,是博弈的公共知识假设不存在贴现因素,重复博弈G (T)的支付就是所有T次 阶段博弈的支付的简单加总1)情形1:阶段博弈具有唯一的纳什均衡A例子甲乙就双方的合作达成了协议,协议订立后双方均面临两个选择:违约或守约我们称这 个博弈为守约博弈博弈问题1:该博弈的纳什均衡是什么?问题2:如果甲乙双方的博弈 关系持续两期,也就是说,甲乙两人的守约博弈重复进行两次,请问,该重复博弈的最终 结局是什么?甲 违约守约B结论:如果阶段博弈G有唯一的纳什均衡,那么,对任意的有限次数丁,重复博弈G (T) 有唯一的子博弈完美结局(outcome):在每个博弈阶段,参与人均重复阶段博弈的纳什均 衡C进一步的理解:通过上面的例子可以看出,完全信息重复博弈其实也是完全信息动态博弈, 故同样使用子博弈完美纳什均衡作为重复博弈的解(值得注意的是,动态博弈本身也是可 以重复的)D思考:为什么说“在每个博弈阶段,参与人均重复阶段博弈的纳什均衡”只是重复博弈的 子博弈完美结局,而不说它是子博弈完美均衡? (2)情形2:阶段博弈具有多重(multiple)纳什均衡A例子1有阶段博弈如下1,15,00,00,54, 40,00,00,03,3R122M12L1甲问题1:请问阶段博弈的纳什均衡是什么?问题2:如果该阶段博弈重复两次,请问您能否想出一个办法,使得(4, 4)这个结局成为 第一阶段博弈的子博弈完美结局? 结论:如果完全信息阶段博弈G具有多重纳什均衡,则重复博弈G(T)存在子博弈完美结 局:对任意的t 之所以如此,在于阶段博弈 的多重纳什均衡为参与人在未来奖励、惩罚对手提供了可信的允诺与威胁,这说明对未来 行为的可信的允诺或威胁会对当前的行为产生影响B例子2有阶段博弈如下乙L M R P Q甲问题1:上述阶段博弈的纳什均衡是什么?问题2:如果上述阶段博弈重复两次,博弈参与人预期第二阶段的结局如下,如果第一阶段 的结局是(M,M),则第二阶段的结局是(R,R);如果第一阶段的结局是(M,1 2 1 2 1W),其中W为M2以外的任何行动选择,则第二阶段的结局是(匕,P2)如果第一阶段 的结局是(x,M2),其中x为M1以外的任何行动选择,则第二阶段的结局是(Q1,Q2); 如果第一阶段的结局是除上述情形以外的其他情形,则第二阶段的结局为(£,R2)请 问,在上述预期下,重复博弈的子博弈完美结局是什么?问题3:请将例子2的子博弈完美结局与例子1的子博弈完美结局进行比较,看看二者惩罚 第一阶段不合作行为的机制有什么不同?或者说,谁的惩罚威胁是更加可信的? 结论:可信的承诺应该要求在该承诺之下参与人不存在再协商(renegotiation)的可能或 积极性,否则,承诺的可信程度就会大打折扣4. 无限重复博弈(i nfinitely repeated game)(1) 无限重复博弈:给定阶段博弈G,G ( 8 )表示阶段博弈G重复无限次的无限重复博弈, 其中当前的阶段博弈开始时,所有以前的阶段博弈的结局都是可观测的,是博弈的公共知 识。 2) 无限重复博弈中参与人支付的计算A给定贴现因子5,无穷支付序列丸,丸,丸……的贴现值为:丸+ 8丸+ 5 2丸+……1 2 3 1 2 3=产&-1气所谓贴现因子就是指下一期的一块钱在今天(即现期)的价值,5 = 1-- t=1其中r为每一期的利率B 一个有用的公式:1+ 5 + 5 2 +……=(3) 例子:有阶段博弈如下甲 竞争合作假设该博弈被无限地重复下去; 现在又假设两个参与人均采取触发策略( trigger strategy),即:在博弈的第一阶段,我总是合作如果所祢-1阶段对手都是合作,那么 在第t阶段,我也会继续合作;否则,我将永远不与对方合作请问:在上述策略组合下, 该重复博弈的子博弈完美结局是什么?双方采取触发策略能够构成该无限重复博弈的子博 弈完美纳什均衡吗?重要的提示:A要证明某一策略组合是否构成纳什均衡,通用的方法就是给定对。












