您所在位置：网站首页 > 办公文档 > 活动策划 > 第四章完全信息动态博弈的基本理论

第四章完全信息动态博弈的基本理论.docx

8页

卖家[上传人]：壹****1

文档编号：448752278

上传时间：2023-09-09

文档格式：DOCX

文档大小：58.18KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15金贝

下载

/ 8 举报版权申诉马上下载

文本预览

下载提示

常见问题

第四章完全信息动态博弈的基本理论一•回顾如何用标准型表述、刻画博弈？回顾如何用扩展型表述、刻画博弈?二. 信息集1. 观察下列两个扩展型博弈在结构上有什么区别？1) 0) _1) 3)1) 0) -1) 3)2. 参与人i的信息集是指由这样一些决策节点组成的集合，第一，i的信息集中每个节点都是i的决策节点，即如果博弈进行到这一步，轮到i行动；第二，当博弈到达i的某个信息集，参与人i并不知道自己究竟已经到了信息集中的哪个节点3. 对信息集的进一步理解A信息集用于表示博弈参与人在轮到他行动时所掌握的信息B信息集定义的第二点意味着在同一个信息集的节点有着相同的可行的行动集（思考：为什么？）C同一个信息集的节点不能相互构成前续节点与后续节点的关系4. 思考：画出下列博弈的博弈树或扩展型表示第一步，参与人甲从行动集（L，R）中进行选择；第二步，参与人乙观察到参与人甲的行动选择后从自己的行动集（M，N）中进行选择；最后一步，参与人甲只能观察到过去的选择是否是（R，N），并从行动集（V，W）中进行选择5. 完全完美信息（complete and perfect）博弈与完全不完美信息（complete and imperfect）博弈（1）完全信息与不完全信息：区分完全信息与否的标准就看每个博弈参与人的支付函数是否是博弈的公共知识。

2）完美信息与不完美信息：区分完美信息与否的标准就看该博弈的每个信息集是否都是单点的（singleton）完美信息意味着该博弈的每个信息集都是单点集思考：完美信息博弈意味着博弈参与人对所参与的博弈究竟知道些什么？意味着在博弈的每个行动时刻轮到行动的参与人知道博弈迄今为止的全部历史3）不完全信息也意味着不完美信息；完美信息必定也是完全信息的三. 行动（action ）与策略1. 在博弈的扩展型表示中，每个决策节点的一根“树枝”就代表着该参与人在此时的一个可供选择的行动2. 参与人i的策略是指参与人i的一个完整的行动计划，即它规定了参与人i在每一个要求他行动的contingency之下所采取的可行的行动，即参与人i在每一个要求他行动的信息集之下所采取的可行的行动3. 思考：写出动态夫妻博弈中夫妻双方的所有策略4. 思考：为什么参与人的策略必须对似乎好不可能出现的博弈情形也规定如何选择行动？因为不这么做，就无法找出参与人针对对手策略的最优反应以及运用纳什均衡四. 完全信息静态博弈与完全信息动态博弈的标准型表示与扩展型表示1. 思考：如何用扩展型表示囚徒困境与静态夫妻博弈？如何用标准型表示动态夫妻博弈？3，13，10，00，0-1，-11，31，3-1，-1FFFBBBBF2. 结论与启示：（1）任何博弈既可以用标准型表示，也可以用扩展型表示；不过，标准型更适合表示静态博弈，扩展型更适合表示动态博弈。

2）识别静态博弈的真正标准不是物理时间上的同时，而是关于行动的信息，即每个参与人是否知道对手过去的行动选择3）标准型表示与扩展型表示的优点标准型能够清晰地展示出每个参与人的策略集；扩展型能够清晰地展示出参与人在每个博弈阶段的信息状况3. 求解动态夫妻博弈的纳什均衡并思考：这些纳什均衡之间有哪些不同？您认为哪些纳什均衡是合理的？哪些是不合理的？一个结论与启示：动态夫妻博弈存在多重纳什均衡，其中有些纳什均衡包含着不可信的承诺（commitment，包括威胁 threat和允 promise两种形式）承诺的可信性是动态博弈的核心问题，由于博弈存在动态结构，于是就可以研究参与人关于未来行为的威胁与允诺对其他参与人当前行为选择的影响五. 子博弈（subgame）1. 子博弈是指始于某个单点信息集上决策节点的所有后续节点，而且不能分割或破坏原博弈的信息结构原博弈也是自身的一个子博弈，但本课以后所说的子博弈均是小于原博弈的子博弈2. 找出下列博弈的子博弈（略）3. 思考：为什么子博弈不能分割或破坏原博弈的信息结构？理由有两条，一是因为一旦破坏了原博弈的信息结构，就无法利用子博弈分析原博弈；二是因为只有这样才能保证该子博弈之前的博弈历史成为所有子博弈参与人的公共知识。

六. 子博弈完美（subgame perfect）纳什均衡完全信息动态博弈的解1. 子博弈完美纳什均衡是指这样的一些纳什均衡，该策略组合在每一个子博弈均构成纳什均衡2. 子博弈完美纳什均衡有助于在完全信息动态博弈中剔除包含不可置信承诺的纳什均衡；它是博弈论对完全信息博弈提出的解概念，是对纳什均衡概念的进一步提炼，这是理性原则在动态博弈中彻底运用的结果3. 逆向归纳一寻找子博弈完美纳什均衡的有效方法（1）逆向归纳法（backward induction）的基本做法是从求解最后一个子博弈的纳什均衡开始，不断向后推，直至到初始决策节点，以求解整个博弈的纳什均衡以这种方法找出的纳什均衡必定是子博弈完美纳什均衡2）思考完全信息动态博弈的基本思路是：向前展望一一以寻找出原博弈的子博弈；向后推理——以求解原博弈七. 前向归纳法1. 如果某博弈是一个更大博弈的一部分，则小博弈的均衡策略就可能依赖于大博弈2. 前向归纳法（forward induction）（1）例子：博士学习计划（故事略）（2）前向归纳法：参与人通过其他参与人早期的、过去的决策推断出一些信息，以帮助求解动态博弈。

前向归纳法与逆向归纳法之间并没有冲突，而是相互补充八. 完全信息无限期讨价还价理论1 .什么是讨价还价讨价还价是指各方具有共同的合作利益，但对合作利益如何分配却存在分歧可以描述为: 有一块大小一定的蛋糕要在若干人中间分配，各方就如何分割蛋糕进行讨价还价，每一方都试图最大化自己的蛋糕份额，如果无法达成分配协议，则谁也不能分享这块蛋糕；如果达成了协议，则各方按照协议的规定进行分配2.完全信息无限期讨价还价的非合作博弈研究核心成果是Rubinstein的两人无穷期讨价还价博弈，该博弈唯一的子博弈完美均衡结局是：假设蛋糕的大小为，参与人风险中性，以及无协议时双方的报酬为0，则双方获得的蛋糕份额为：第一个开价的的人（A ）获得：一^兀，第二个开价的人（B ）获得：一4^兀r + r r + r这个结论告诉我们：谁相对更加有耐心，谁的讨价还价力量就相对更大；这个结果与纳什讨价还价解等价总结与回顾：（1）前面所分析的所有博弈，不论是静态的还是动态的，具有一个共同的特点：所有的博弈都是一次性的2）第二章思考的社会困境解决办法总是求助于外在的强制与约束力量，能否存在其他的解决机制？（3）如果相同的博弈多次重复，是否会因为存在未来惩罚不合作行为与奖励对手合作行为的机会，而有助于博弈各方的合作？九. 重复博弈1. 重复博弈的一些例子2. 重复博弈是指相同的参与人重复地进行相同的博弈，而且在进行某阶段的博弈时，前面所有阶段的博弈结局是所有参与人的公共知识。

这个被重复进行的博弈就被称之为阶段博弈（stage game）3. 有限重复博弈（0）有限重复博弈：给定阶段博弈G，G （T）表示阶段博弈G重复T次的有限重复博弈，其中第t次阶段博弈开始时，对全体博弈参与人来说，所有t-1次阶段博弈的结局都是可观测的，是博弈的公共知识假设不存在贴现因素，重复博弈G （T）的支付就是所有T次阶段博弈的支付的简单加总1）情形1：阶段博弈具有唯一的纳什均衡A例子甲乙就双方的合作达成了协议，协议订立后双方均面临两个选择：违约或守约我们称这个博弈为守约博弈博弈问题1：该博弈的纳什均衡是什么？问题2：如果甲乙双方的博弈关系持续两期，也就是说，甲乙两人的守约博弈重复进行两次，请问，该重复博弈的最终结局是什么？甲违约守约B结论：如果阶段博弈G有唯一的纳什均衡，那么，对任意的有限次数丁，重复博弈G （T）有唯一的子博弈完美结局（outcome）：在每个博弈阶段，参与人均重复阶段博弈的纳什均衡C进一步的理解：通过上面的例子可以看出，完全信息重复博弈其实也是完全信息动态博弈，故同样使用子博弈完美纳什均衡作为重复博弈的解（值得注意的是，动态博弈本身也是可以重复的）D思考：为什么说“在每个博弈阶段，参与人均重复阶段博弈的纳什均衡”只是重复博弈的子博弈完美结局，而不说它是子博弈完美均衡？（2）情形2：阶段博弈具有多重（multiple）纳什均衡A例子1有阶段博弈如下1，15，00，00，54, 40，00，00，03，3R122M12L1甲问题1：请问阶段博弈的纳什均衡是什么？问题2：如果该阶段博弈重复两次，请问您能否想出一个办法，使得（4, 4）这个结局成为第一阶段博弈的子博弈完美结局？结论：如果完全信息阶段博弈G具有多重纳什均衡，则重复博弈G（T）存在子博弈完美结局：对任意的t

之所以如此，在于阶段博弈的多重纳什均衡为参与人在未来奖励、惩罚对手提供了可信的允诺与威胁，这说明对未来行为的可信的允诺或威胁会对当前的行为产生影响B例子2有阶段博弈如下乙L M R P Q甲问题1：上述阶段博弈的纳什均衡是什么？问题2：如果上述阶段博弈重复两次，博弈参与人预期第二阶段的结局如下，如果第一阶段的结局是（M，M），则第二阶段的结局是（R，R）；如果第一阶段的结局是（M，1 2 1 2 1W），其中W为M2以外的任何行动选择，则第二阶段的结局是（匕，P2）如果第一阶段的结局是（x，M2），其中x为M1以外的任何行动选择，则第二阶段的结局是（Q1，Q2）；如果第一阶段的结局是除上述情形以外的其他情形，则第二阶段的结局为（£，R2）请问，在上述预期下，重复博弈的子博弈完美结局是什么？问题3：请将例子2的子博弈完美结局与例子1的子博弈完美结局进行比较，看看二者惩罚第一阶段不合作行为的机制有什么不同？或者说，谁的惩罚威胁是更加可信的？结论：可信的承诺应该要求在该承诺之下参与人不存在再协商（renegotiation）的可能或积极性，否则，承诺的可信程度就会大打折扣4. 无限重复博弈（i nfinitely repeated game）（1）无限重复博弈：给定阶段博弈G，G （ 8 ）表示阶段博弈G重复无限次的无限重复博弈，其中当前的阶段博弈开始时，所有以前的阶段博弈的结局都是可观测的，是博弈的公共知识。

2）无限重复博弈中参与人支付的计算A给定贴现因子5，无穷支付序列丸，丸，丸……的贴现值为：丸+ 8丸+ 5 2丸+……1 2 3 1 2 3=产&-1气所谓贴现因子就是指下一期的一块钱在今天(即现期)的价值，5 = 1-- t=1其中r为每一期的利率B 一个有用的公式：1+ 5 + 5 2 +……=(3) 例子：有阶段博弈如下甲竞争合作假设该博弈被无限地重复下去；现在又假设两个参与人均采取触发策略( trigger strategy),即：在博弈的第一阶段，我总是合作如果所祢-1阶段对手都是合作，那么在第t阶段，我也会继续合作；否则，我将永远不与对方合作请问：在上述策略组合下，该重复博弈的子博弈完美结局是什么？双方采取触发策略能够构成该无限重复博弈的子博弈完美纳什均衡吗？重要的提示：A要证明某一策略组合是否构成纳什均衡，通用的方法就是给定对。

点击阅读更多内容

第四章 完全信息动态博弈的基本理论.docx

第四章完全信息动态博弈的基本理论.docx