
第12讲完美贝叶斯均衡ppt课件.ppt
97页Lecture 12:: perfect Bayesian equilibrium1.0.引言引言1.完美完美贝叶斯均衡的要求叶斯均衡的要求2.完美完美贝叶斯均衡的初步解叶斯均衡的初步解释2.1 两方两两方两阶段不完全信息段不完全信息动态博弈博弈2.2 三方三三方三阶段不完全信息段不完全信息动态博弈博弈20.引言引言3完全且完美信息的二手完全且完美信息的二手车交易模型交易模型11122好好不好不好卖不不卖不不卖卖买不不买买不不买(0,,0)(2,,1)(0,,0)(1,,-1)(-1,,0)(0,,0)完全且完美信息的二手完全且完美信息的二手车交易模型交易模型4完全但不完美信息的二手完全但不完美信息的二手车交易模型交易模型1112好好差差卖不不卖不不卖卖买不不买买不不买(0,,0)(2,,1)(0,,0)(1,,-1)(-1,,0)(0,,0)完全但不完美信息的二手完全但不完美信息的二手车交易模型交易模型5由于完全但不完美信息由于完全但不完美信息动态博弈中存在博弈中存在““多多节点信息集点信息集””,因此子博,因此子博弈概念的理解和逆推弈概念的理解和逆推归纳法的法的应用都需要作一些修正。
用都需要作一些修正不完美信息不完美信息动态博弈的博弈的扩展形必然包含多展形必然包含多节点信息集,至少部分点信息集,至少部分阶段段不构成子博弈不构成子博弈6均衡策略均衡策略组合合对任何种任何种类博弈的分析都是关博弈的分析都是关键,,对不完美信息不完美信息动态博博弈也不例外弈也不例外对一个一个动态博弈来博弈来讲,,““可信性可信性””始始终是均衡的一个中心是均衡的一个中心问题,理想,理想的均衡必的均衡必须能能够排除任何不可信的威排除任何不可信的威胁或承或承诺7核心均衡概念核心均衡概念−完全信息静完全信息静态博弈:博弈:纳什均衡什均衡−完全且完美信息完全且完美信息动态博弈:博弈:子博弈完美子博弈完美纳什均衡什均衡−完全但不完美信息完全但不完美信息动态博弈:博弈:完美完美贝叶斯均衡叶斯均衡8完美完美贝叶斯均衡叶斯均衡((perfect Bayesian equilibrium))9贝叶斯(叶斯(Bayes)公式:)公式:−设{{A1,,…,,An}}为必然事件的一个分割,必然事件的一个分割,P(Ai)>0,,i=1,,…,,n又设P(B)>0,,则−注意(贝叶斯公式是专门用来计算后验概率的):注意(贝叶斯公式是专门用来计算后验概率的): (1)(1)条件概率条件概率P(AP(Ai i|B)|B),,……,,P(AP(An n|B)|B)称为称为A A1 1,,……,,A An n的的后验概率后验概率,因为它们是,因为它们是在知道事件在知道事件B B发生之后,事件发生之后,事件A A1 1,, ……,,A An n发生的概率。
发生的概率 (2)(2)对应地,对应地,P(AP(A1 1) ),,……,,P(AP(An n) )称为称为A A1 1,,……,,A An n的的先验概率先验概率 (3)(3)由于由于B B的发生提供了新的信息,因而产生了从先验概率到后验概率的变化的发生提供了新的信息,因而产生了从先验概率到后验概率的变化10完全但不完美信息的二手完全但不完美信息的二手车交易模型交易模型−““逆推逆推归纳法法””的分析的分析结果果(设p(g)≠0,,1)::((1)若)若卖方(博弈方方(博弈方1)在)在车况况““差差””时选择““卖””的概率的概率p(s|b)
1/2,此,此时博弈方博弈方2在第三在第三阶段段总是是选择““买””,博弈方,博弈方1在第在第二二阶段段总是是选择““卖””;;博弈方博弈方1是主是主动选择和理性行和理性行为的,因此概率分布的,因此概率分布p(s|g)和和 p(s|b)取决于取决于博弈方博弈方1的理性策略。
的理性策略1112好好差差卖不不卖不不卖卖买不不买买不不买(0,,0)(2,,1)(0,,0)(1,,-1)(-1,,0)(0,,0)11 ((2)若)若卖方(博弈方方(博弈方1)在)在车况况““差差””时选择““卖””的概率的概率p(s|b)>p(g)/[1-- p(g)],那么,那么买方(博弈方方(博弈方2))对卖方(博弈方方(博弈方1)决定)决定卖车时车况况““好好””的的““判断判断””p(g|s)<1/2,此,此时博弈方博弈方2在第三在第三阶段段总是是选择““不不买””,博弈方,博弈方1在在第二第二阶段段总是是选择““不不卖”” 博弈方博弈方1是主是主动选择和理性行和理性行为的,因此概率分布的,因此概率分布p(s|g)和和 p(s|b)取决于博弈方取决于博弈方1的理性策略的理性策略1112好好差差卖不不卖不不卖卖买不不买买不不买(0,,0)(2,,1)(0,,0)(1,,-1)(-1,,0)(0,,0)121.完美完美贝叶斯均衡的要求叶斯均衡的要求13完美完美贝叶斯均衡的要求叶斯均衡的要求−要求要求1:在每个信息集,:在每个信息集,轮到到选择的博弈方必的博弈方必须具有一个关于博弈达到具有一个关于博弈达到该信息信息集中每个集中每个节点可能性的点可能性的““判断判断””((Belief)。
(a)(a)对于多节点信息集,对于多节点信息集, “ “判断判断””就是博弈达到该信息集中各个节点可能性就是博弈达到该信息集中各个节点可能性的概率分布;的概率分布; (b)(b)对于单节点信息集,则可理解为对于单节点信息集,则可理解为““判断判断””博弈达到该节点的概率为博弈达到该节点的概率为1 11112好好差差卖不不卖不不卖卖买不不买买不不买(0,,0)(2,,1)(0,,0)(1,,-1)(-1,,0)(0,,0)14−要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列理性序列理性””的 (a)(a)在各个信息集,给定轮到选择博弈方的判断和其他博弈方的在各个信息集,给定轮到选择博弈方的判断和其他博弈方的““后续策后续策略略””,该博弈方的行为及以后阶段的,该博弈方的行为及以后阶段的““后续策略后续策略””,必须使自己的得益或期望,必须使自己的得益或期望得益最大得益最大 (b)(b)此处所谓此处所谓““后续策略后续策略””即相应的博弈方在所讨论信息集以后的阶段中,即相应的博弈方在所讨论信息集以后的阶段中,针对所有可能情况如何行为的完整计划。
针对所有可能情况如何行为的完整计划1112好好差差卖不不卖不不卖卖买不不买买不不买(0,,0)(2,,1)(0,,0)(1,,-1)(-1,,0)(0,,0)15−要求要求3:在均衡路径上的信息集:在均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方的均衡和各博弈方的均衡策略决定策略决定−要求要求4:在不:在不处于均衡路径上的信息集于均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方和各博弈方在此在此处可能有的均衡策略决定可能有的均衡策略决定1112好好差差卖不不卖不不卖卖买不不买买不不买(0,,0)(2,,1)(0,,0)(1,,-1)(-1,,0)(0,,0)16完美贝叶斯均衡l要求要求1 1:在每个信息集,轮到选择的博弈方必须具有一个关于博弈达到:在每个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的该信息集中每个节点可能性的““判断判断””((BeliefBelief)l要求要求2 2:给定各博弈方的:给定各博弈方的““判断判断””,他们的策略必须是,他们的策略必须是““序列理性序列理性””的l要求要求3 3:在均衡路径上的信息集处,:在均衡路径上的信息集处,““判断判断””由贝叶斯法则和各博弈方由贝叶斯法则和各博弈方的均衡策略决定。
的均衡策略决定l要求要求4 4:在不处于均衡路径上的信息集处,:在不处于均衡路径上的信息集处,““判断判断””由贝叶斯法则和各由贝叶斯法则和各博弈方在此处可能有的均衡策略决定博弈方在此处可能有的均衡策略决定17当某策略当某策略组合及相合及相应的判断的判断满足足这样四个要求四个要求时,称,称为一个一个““完美完美贝叶斯均衡叶斯均衡””18当某策略当某策略组合及相合及相应的判断的判断满足足这样四个要求四个要求时,称,称为一个一个““完美完美贝叶斯均衡叶斯均衡””为什么称什么称这种均衡种均衡为完美完美贝叶斯均衡?叶斯均衡?19完美贝叶斯均衡l要求要求1 1:在每个信息集,轮到选择的博弈方必须具有一个关于博弈达到:在每个信息集,轮到选择的博弈方必须具有一个关于博弈达到该信息集中每个节点可能性的该信息集中每个节点可能性的““判断判断””((BeliefBelief)l要求要求2 2:给定各博弈方的:给定各博弈方的““判断判断””,他们的策略必须是,他们的策略必须是““序列理性序列理性””的l要求要求3 3:在均衡路径上的信息集处,:在均衡路径上的信息集处,““判断判断””由贝叶斯法则和各博弈方由贝叶斯法则和各博弈方的均衡策略决定。
的均衡策略决定l要求要求4 4:在不处于均衡路径上的信息集处,:在不处于均衡路径上的信息集处,““判断判断””由贝叶斯法则和各由贝叶斯法则和各博弈方在此处可能有的均衡策略决定博弈方在此处可能有的均衡策略决定20当某策略当某策略组合及相合及相应的判断的判断满足足这样四个要求四个要求时,称,称为一个一个““完美完美贝叶斯均衡叶斯均衡””为什么称什么称这种均衡种均衡为完美完美贝叶斯均衡?叶斯均衡?21为什么称什么称这种均衡种均衡为完美完美贝叶斯均衡?叶斯均衡?首先,因首先,因为它的第二个要求它的第二个要求““序列理性序列理性””,与子博弈完美,与子博弈完美纳什均衡什均衡中的子博弈完美性要求相似;中的子博弈完美性要求相似;2223−要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列理性序列理性””的 (a)(a)即,在各个信息集,给定轮到选择博弈方的判断和其他博弈方的即,在各个信息集,给定轮到选择博弈方的判断和其他博弈方的““后后续策略续策略””,该博弈方的行为及以后阶段的,该博弈方的行为及以后阶段的““后续策略后续策略””,必须使自己的得益,必须使自己的得益或期望得益最大。
或期望得益最大 (b)(b)此处所谓此处所谓““后续策略后续策略””即相应的博弈方在所讨论信息集以后的阶段中,即相应的博弈方在所讨论信息集以后的阶段中,针对所有可能情况如何行为的完整计划针对所有可能情况如何行为的完整计划1112好好差差卖不不卖不不卖卖买不不买买不不买(0,,0)(2,,1)(0,,0)(1,,-1)(-1,,0)(0,,0)23为什么称什么称这种均衡种均衡为完美完美贝叶斯均衡?叶斯均衡?首先,因首先,因为它的第二个要求它的第二个要求““序列理性序列理性””,与子博弈完美,与子博弈完美纳什均衡什均衡中的子博弈完美性要求相似;中的子博弈完美性要求相似;其次,因其次,因为要求要求3和要求和要求4规定定““判断判断””的形成必的形成必须符合符合贝叶斯法叶斯法则24−要求要求3:在均衡路径上的信息集:在均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方的均衡和各博弈方的均衡策略决定策略决定−要求要求4:在不:在不处于均衡路径上的信息集于均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方和各博弈方在此在此处可能有的均衡策略决定。
可能有的均衡策略决定1112好好差差卖不不卖不不卖卖买不不买买不不买(0,,0)(2,,1)(0,,0)(1,,-1)(-1,,0)(0,,0)25完全且完美信息完全且完美信息动态博弈:子博弈完美博弈:子博弈完美纳什均衡什均衡完全但不完美信息完全但不完美信息动态博弈:完美博弈:完美贝叶斯均衡叶斯均衡2627子博弈完美子博弈完美纳什均衡是完美什均衡是完美贝叶斯均衡在完全且完美信息叶斯均衡在完全且完美信息动态博弈中博弈中的特例28子博弈完美子博弈完美纳什均衡是完美什均衡是完美贝叶斯均衡在完全且完美信息叶斯均衡在完全且完美信息动态博弈中博弈中的特例即,在完全且完美信息即,在完全且完美信息动态博弈中,完美博弈中,完美贝叶斯均衡就是子博弈完叶斯均衡就是子博弈完美美纳什均衡29完美完美贝贝叶斯均衡叶斯均衡l要求要求1:在每个信息集,:在每个信息集,轮到到选择的博弈方必的博弈方必须具有一个关于博弈达具有一个关于博弈达到到该信息集中每个信息集中每个节点可能性的点可能性的““判断判断””((Belief)l要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列理性序列理性””的。
的l要求要求3:在均衡路径上的信息集:在均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈和各博弈方的均衡策略决定方的均衡策略决定l要求要求4:在不:在不处于均衡路径上的信息集于均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和和各博弈方在此各博弈方在此处可能有的均衡策略决定可能有的均衡策略决定30子博弈完美子博弈完美纳什均衡是完美什均衡是完美贝叶斯均衡在完全且完美信息叶斯均衡在完全且完美信息动态博弈中博弈中的特例序列理性在子博弈中就是子博弈完美性,再在整个博弈中就是纳什均序列理性在子博弈中就是子博弈完美性,再在整个博弈中就是纳什均衡,而在完全且完美信息动态博弈中,所有轮到选择博弈方的信息集衡,而在完全且完美信息动态博弈中,所有轮到选择博弈方的信息集都是单节点的,他们对博弈到达该节点的都是单节点的,他们对博弈到达该节点的““判断判断””都是概率等于都是概率等于1 1,这,这些判断当然都是满足贝叶斯法则和以其他博弈方的后续策略为基础的些判断当然都是满足贝叶斯法则和以其他博弈方的后续策略为基础的31更更进一步,完美一步,完美贝叶斯均衡在静叶斯均衡在静态博弈中就是博弈中就是纳什均衡。
什均衡32完美完美贝贝叶斯均衡叶斯均衡l要求要求1:在每个信息集,:在每个信息集,轮到到选择的博弈方必的博弈方必须具有一个关于博弈达具有一个关于博弈达到到该信息集中每个信息集中每个节点可能性的点可能性的““判断判断””((Belief)l要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列理性序列理性””的l要求要求3:在均衡路径上的信息集:在均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈和各博弈方的均衡策略决定方的均衡策略决定l要求要求4:在不:在不处于均衡路径上的信息集于均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和和各博弈方在此各博弈方在此处可能有的均衡策略决定可能有的均衡策略决定3333332.完美完美贝叶斯均衡的初步解叶斯均衡的初步解释2.1 两方两两方两阶段不完全信息段不完全信息动态博弈博弈2.2 三方三三方三阶段不完全信息段不完全信息动态博弈博弈34对四个条件的分析四个条件的分析““要求要求1””是解决完全但不完美信息是解决完全但不完美信息动态博弈的基本前提博弈的基本前提在多节点信息集处轮到选择的博弈方,至少必须对其中每个节点达到在多节点信息集处轮到选择的博弈方,至少必须对其中每个节点达到的可能性大小有一个基本判断,否则其决策就会失去根据,从而也不的可能性大小有一个基本判断,否则其决策就会失去根据,从而也不可能存在策略的稳定性,更谈不上均衡。
可能存在策略的稳定性,更谈不上均衡35完美完美贝贝叶斯均衡叶斯均衡l要求要求1:在每个信息集,:在每个信息集,轮到到选择的博弈方必的博弈方必须具有一个关于博弈达到具有一个关于博弈达到该信息信息集中每个集中每个节点可能性的点可能性的““判断判断””((Belief)l要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列理性序列理性””的l要求要求3:在均衡路径上的信息集:在均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方的均衡和各博弈方的均衡策略决定策略决定l要求要求4:在不:在不处于均衡路径上的信息集于均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方和各博弈方在此在此处可能有的均衡策略决定可能有的均衡策略决定36对四个条件的分析四个条件的分析““要求要求2””的序列理性相当于子博弈完美的序列理性相当于子博弈完美纳什均衡中的子博弈完美性要什均衡中的子博弈完美性要求,求,实际上在子博弈中(不完美信息上在子博弈中(不完美信息动态博弈中也可能存在子博弈)博弈中也可能存在子博弈)就是子博弈完美性,而在多就是子博弈完美性,而在多节点信息集开始的不构成子博弈的部分中,点信息集开始的不构成子博弈的部分中,序列理性通序列理性通过要求各博弈方遵守最大利益原要求各博弈方遵守最大利益原则而排除博弈方策略中不而排除博弈方策略中不可信的威可信的威胁或承或承诺。
37对四个条件的分析四个条件的分析当然,序列理性首先要求策略当然,序列理性首先要求策略组合在合在给定的各方判断下是定的各方判断下是纳什均衡38对四个条件的分析四个条件的分析序列理性要求序列理性要求对保保证完美完美贝叶斯均衡的真正叶斯均衡的真正稳定性是很重要的定性是很重要的39完美完美贝贝叶斯均衡叶斯均衡l要求要求1:在每个信息集,:在每个信息集,轮到到选择的博弈方必的博弈方必须具有一个关于博弈达到具有一个关于博弈达到该信息信息集中每个集中每个节点可能性的点可能性的““判断判断””((Belief)l要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列理性序列理性””的l要求要求3:在均衡路径上的信息集:在均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方的均衡和各博弈方的均衡策略决定策略决定l要求要求4:在不:在不处于均衡路径上的信息集于均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方和各博弈方在此在此处可能有的均衡策略决定可能有的均衡策略决定402.1 两方两两方两阶段不完全信息段不完全信息动态博弈博弈4112RM(1--p)L(p)UDUD(1,,3)(2,,1)(0,,0)(0 ,,0)(0,,1)42完美完美贝贝叶斯均衡叶斯均衡l要求要求1:在每个信息集,:在每个信息集,轮到到选择的博弈方必的博弈方必须具有一个关于博弈达具有一个关于博弈达到到该信息集中每个信息集中每个节点可能性的点可能性的““判断判断””((Belief)。
l要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列理性序列理性””的l要求要求3:在均衡路径上的信息集:在均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈和各博弈方的均衡策略决定方的均衡策略决定l要求要求4:在不:在不处于均衡路径上的信息集于均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和和各博弈方在此各博弈方在此处可能有的均衡策略决定可能有的均衡策略决定43完美完美贝叶斯均衡的初步解叶斯均衡的初步解释““要求要求1””的必要性的必要性博弈方博弈方2在多在多节点信息集点信息集处对两个两个节点,也就是两条路径的点,也就是两条路径的““判断判断””是决策的必要基是决策的必要基础,从而也是均衡策略的基,从而也是均衡策略的基础1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)44完美完美贝贝叶斯均衡叶斯均衡l要求要求1:在每个信息集,:在每个信息集,轮到到选择的博弈方必的博弈方必须具有一个关于博弈达到具有一个关于博弈达到该信息信息集中每个集中每个节点可能性的点可能性的““判断判断””((Belief)。
l要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列理性序列理性””的l要求要求3:在均衡路径上的信息集:在均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方的均衡和各博弈方的均衡策略决定策略决定l要求要求4:在不:在不处于均衡路径上的信息集于均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方和各博弈方在此在此处可能有的均衡策略决定可能有的均衡策略决定45““要求要求2””的必要性的必要性如果没有如果没有““要求要求2””,只要求,只要求满足足纳什均衡和子博弈完美性,什均衡和子博弈完美性,则博弈博弈方方2有一个可有一个可为自己争取到最大利益自己争取到最大利益3,但包含不可信承,但包含不可信承诺的均衡的均衡策略1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)46““要求要求2””的必要性的必要性即,博弈方即,博弈方2威威胁在在轮到自己到自己选择时将唯一地只将唯一地只选D。
1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)47““要求要求2””的必要性的必要性即,博弈方即,博弈方2威威胁在在轮到自己到自己选择时将唯一地只将唯一地只选D如果博弈方如果博弈方2采取采取这个策略,博弈方个策略,博弈方1的最佳的最佳对策就是第一策就是第一阶段段选择R从而使博弈从而使博弈结束,双方得益是(束,双方得益是(1,,3)1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)48““要求要求2””的必要性的必要性策略策略组合:博弈方合:博弈方2威威胁在在轮到自己到自己选择时将唯一地只将唯一地只选D;博弈;博弈方方1在第一在第一阶段段选择R上述策略上述策略组合合显然是一个然是一个纳什均衡,由于本博弈没有子博弈,什均衡,由于本博弈没有子博弈,因此子博弈完美性要求自因此子博弈完美性要求自动满足,它也是一个子博弈完美足,它也是一个子博弈完美纳什什均衡。
均衡1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)49““要求要求2””的必要性的必要性但是,博弈方但是,博弈方2在博弈方在博弈方1不不选择R的情况下只的情况下只选D的策略,在博弈的策略,在博弈方方1选L的概率很大的概率很大时明明显是一个不可信的威是一个不可信的威胁,因,因为这时博弈方博弈方2选择D的期望得益比的期望得益比选U的要小得多,的要小得多,选D不符合最大利益原不符合最大利益原则1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)50““要求要求2””的必要性的必要性因此,因此,““要求要求2””对于保于保证不完美信息不完美信息动态博弈的均衡策略中没有不博弈的均衡策略中没有不可信的威可信的威胁或承或承诺具有关具有关键作用1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)51““要求要求2””的必要性的必要性““要求要求2””保保证各个博弈方在各个博弈方在单节点信息集和多点信息集和多节点信息集点信息集处都会按都会按照最大利益原照最大利益原则选择。
1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)52““要求要求2””的必要性的必要性因此当博弈方因此当博弈方2在博弈方在博弈方1第一第一阶段没有段没有选R的情况下,的情况下,““判断判断””博博弈方弈方1选L的概率的概率p大于大于选M的概率的概率1-p时,博弈方,博弈方2必必须选择U而非而非D这时,博弈方,博弈方1在第一在第一阶段的段的选择就就应该是是L而非而非M,也非,也非R1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)53““要求要求2””的必要性的必要性博弈方博弈方1第一第一阶段段选L,博弈方,博弈方2在博弈方在博弈方1第一第一阶段未段未选R的情况下的情况下选择U,加上博弈方,加上博弈方2对博弈方博弈方1选L、、M的概率判断的概率判断p和和1-p( p ≥1-p ),构成一个满足序列理性要求的策略组合。
1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)54−要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列理性序列理性””的(a)即,在各个信息集,即,在各个信息集,给定定轮到到选择博弈方的判断和其他博弈方博弈方的判断和其他博弈方的的““后后续策略策略””,,该博弈方的行博弈方的行为及以后及以后阶段的段的““后后续策略策略””,必,必须使自己的得益或期望得益最大使自己的得益或期望得益最大(b)此此处所所谓““后后续策略策略””即相即相应的博弈方在所的博弈方在所讨论信息集以后的信息集以后的阶段中,段中,针对所有可能情况如何行所有可能情况如何行为的完整的完整计划55完美完美贝贝叶斯均衡叶斯均衡l要求要求1:在每个信息集,:在每个信息集,轮到到选择的博弈方必的博弈方必须具有一个关于博弈达到具有一个关于博弈达到该信息信息集中每个集中每个节点可能性的点可能性的““判断判断””((Belief)。
l要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列理性序列理性””的l要求要求3:在均衡路径上的信息集:在均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方的均衡和各博弈方的均衡策略决定策略决定l要求要求4:在不:在不处于均衡路径上的信息集于均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方和各博弈方在此在此处可能有的均衡策略决定可能有的均衡策略决定56““要求要求3””和和““要求要求4””有有““均衡路径均衡路径””和和““非均衡路径非均衡路径””一一对概念在完全且完美信息在完全且完美信息动态博弈中,所博弈中,所谓在均衡路径上的信息集是指如在均衡路径上的信息集是指如果博弈按照均衡策略果博弈按照均衡策略进行,行,则该信息集一定会达到,不在均衡路径信息集一定会达到,不在均衡路径上的信息集上的信息集则肯定不会达到肯定不会达到57““要求要求3””和和““要求要求4””有有““均衡路径均衡路径””和和““非均衡路径非均衡路径””一一对概念在不完美信息博弈中,由于至少在不完美信息博弈中,由于至少对一个博弈方一个博弈方阶段来段来说,博弈,博弈实际达到何达到何处是无法看到的,因此即使按均衡策略是无法看到的,因此即使按均衡策略进行博弈,某些信息行博弈,某些信息集是否一定达到也不确定。
集是否一定达到也不确定58““要求要求3””和和““要求要求4””有有““均衡路径均衡路径””和和““非均衡路径非均衡路径””一一对概念所以,在不完美信息博弈中所所以,在不完美信息博弈中所谓““在均衡路径上在均衡路径上””的信息集意味着的信息集意味着如果博弈按照均衡策略如果博弈按照均衡策略进行,行,则该信息集会以正的概率达到,而信息集会以正的概率达到,而““不在均衡路径上不在均衡路径上””的信息集就意味着博弈按均衡策略的信息集就意味着博弈按均衡策略进行行时绝不可不可能达到,或者达到的概率能达到,或者达到的概率为059““要求要求3””的必要性的必要性假假设:均衡策略:均衡策略组合是合是““博弈方博弈方1在第一在第一阶段段选择L,博弈方,博弈方2在第在第二二阶段段选择U””1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)60““要求要求3””的必要性的必要性假假设:均衡策略:均衡策略组合是合是““博弈方博弈方1在第一在第一阶段段选择L,博弈方,博弈方2在第在第二二阶段段选择U””。
首先,因首先,因为该博弈中只有博弈方博弈中只有博弈方2有一个两有一个两节点信息集,因此要点信息集,因此要求求3实际上上针对的就是博弈方的就是博弈方2在其两在其两节点信息集点信息集处的的““判断判断””1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)61““要求要求3””的必要性的必要性假假设:均衡策略:均衡策略组合是合是““博弈方博弈方1在第一在第一阶段段选择L,博弈方,博弈方2在第在第二二阶段段选择U””其次,本博弈两博弈方的其次,本博弈两博弈方的选择都是主都是主动选择,因此不需要,因此不需要额外外信息帮助信息帮助““判断判断””1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)62““要求要求3””的必要性的必要性假假设:均衡策略:均衡策略组合是合是““博弈方博弈方1在第一在第一阶段段选择L,博弈方,博弈方2在第在第二二阶段段选择U””。
第三,在本博弈中博弈方第三,在本博弈中博弈方2的的““判断判断””是直接是直接针对博弈方博弈方1的上的上期期选择的,因此不存在条件概率的,因此不存在条件概率问题,,贝叶斯法叶斯法则自自动满足1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)63““要求要求3””的必要性的必要性假假设:均衡策略是:均衡策略是““博弈方博弈方1在第一在第一阶段段选择L,博弈方,博弈方2在第二在第二阶段段选择U””第四,第四,““要求要求3””要求博弈方要求博弈方2对博弈方博弈方1的上期的上期选择的的““判断判断””,符合各博弈方的均衡策略,在,符合各博弈方的均衡策略,在这里就是符合博弈方里就是符合博弈方1第一第一阶段段的的选择和博弈方和博弈方2自己本自己本阶段的段的选择1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)64““要求要求3””的必要性的必要性假假设:均衡策略:均衡策略组合是合是““博弈方博弈方1在第一在第一阶段段选择L,博弈方,博弈方2在第在第二二阶段段选择U””。
由于博弈方由于博弈方1的均衡策略在第一的均衡策略在第一阶段段选择的是的是L,因此只有博弈,因此只有博弈方方2的的““判断判断””是是““博弈方博弈方1选择L的概率的概率p==1””才与博弈方才与博弈方1的的策略相符合,而且策略相符合,而且这种判断也与博弈方种判断也与博弈方2自己在本自己在本阶段的段的选择U相符合,因此相符合,因此该判断正是博弈方判断正是博弈方2决策和双方策略均衡的决策和双方策略均衡的稳定基定基础65““要求要求3””的必要性的必要性假假设:均衡策略:均衡策略组合是合是““博弈方博弈方1在第一在第一阶段段选择L,博弈方,博弈方2在第在第二二阶段段选择U””如果博弈方如果博弈方2““判断判断””p=0.75,,则首先与博弈方首先与博弈方1的的选择不完全符不完全符合,而且合,而且这种判断种判断对博弈方博弈方2选U的信心有不良影响,从而均衡的信心有不良影响,从而均衡就有不就有不稳定性1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)66““要求要求3””的必要性的必要性假假设:均衡策略:均衡策略组合是合是““博弈方博弈方1在第一在第一阶段段选择L,博弈方,博弈方2在第在第二二阶段段选择U””。
如果博弈方如果博弈方2““判断判断””p=0.25,,则与所与所设均衡策略均衡策略组合合““博弈方博弈方1在第一在第一阶段段选择L,博弈方,博弈方2在第二在第二阶段段选择U””是完全矛盾的,是完全矛盾的,因因为该判断下博弈方判断下博弈方2的最佳的最佳选择不是不是U而是而是D,而博弈方,而博弈方1也不也不会会选择L而而选择R,因此,因此““判断判断””与策略之与策略之间的矛盾会完全破坏的矛盾会完全破坏策略的均衡,策略的均衡,这时候上述策略候上述策略组合根本不可能是真正的均衡合根本不可能是真正的均衡 67““要求要求3””的必要性的必要性在不完美信息博弈中,在不完美信息博弈中,““判断判断””和均衡策略之和均衡策略之间的相互依存关系,的相互依存关系,只有两者是一致的、只有两者是一致的、协调的,才可能是真正的均衡的,才可能是真正的均衡68完美完美贝贝叶斯均衡叶斯均衡l要求要求1:在每个信息集,:在每个信息集,轮到到选择的博弈方必的博弈方必须具有一个关于博弈达到具有一个关于博弈达到该信息信息集中每个集中每个节点可能性的点可能性的““判断判断””((Belief)l要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列理性序列理性””的。
的l要求要求3:在均衡路径上的信息集:在均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方的均衡和各博弈方的均衡策略决定策略决定l要求要求4:在不:在不处于均衡路径上的信息集于均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方和各博弈方在此在此处可能有的均衡策略决定可能有的均衡策略决定69““要求要求4””的必要性的必要性首先,首先,对于均衡策略于均衡策略组合合““博弈方博弈方1在第一在第一阶段段选择L,博弈方,博弈方2在在第二第二阶段段选择U””来来说,因,因为博弈方博弈方2的多的多节点信息集在均衡路径上,点信息集在均衡路径上,不存在不在均衡路径上的需要不存在不在均衡路径上的需要““判断判断””的信息集,因此要求的信息集,因此要求4自自动满足1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)70““要求要求4””的必要性的必要性假假设纳什均衡策略什均衡策略组合:合:““博弈方博弈方1第一第一阶段段选择R,博弈方,博弈方2第二第二阶段段选择D””。
在在该均衡策略下,博弈方均衡策略下,博弈方2的两的两节点信息集就是不在均衡路径上点信息集就是不在均衡路径上的信息集的信息集1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)71““要求要求4””的必要性的必要性假假设纳什均衡策略什均衡策略组合:合:““博弈方博弈方1第一第一阶段段选择R,博弈方,博弈方2第二第二阶段段选择D””““要求要求4””要求博弈方要求博弈方2此此时在两在两节点信息集的判断,也要点信息集的判断,也要满足足贝叶斯法叶斯法则和双方的均衡策略和双方的均衡策略1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)72““要求要求4””的必要性的必要性假假设纳什均衡策略什均衡策略组合:合:““博弈方博弈方1第一第一阶段段选择R,博弈方,博弈方2第二第二阶段段选择D””。
同于同于““要求要求3””,,贝叶斯法叶斯法则自自动满足,因此我足,因此我们只需要只需要讨论博博弈方弈方2的的““判断判断””与双方在此与双方在此处可能有的均衡策略的一致性可能有的均衡策略的一致性1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)73““要求要求4””的必要性的必要性假假设纳什均衡策略什均衡策略组合:合:““博弈方博弈方1第一第一阶段段选择R,博弈方,博弈方2第二第二阶段段选择D””我我们只需要只需要讨论博弈方博弈方2的的““判断判断””与双方在此与双方在此处可能有的均衡可能有的均衡策略的一致性策略的一致性如果万一博弈方如果万一博弈方1在第一在第一阶段偏离了上述均衡策略段偏离了上述均衡策略R,博弈方,博弈方2““判断判断””博弈方博弈方1选择L的概率的概率p==1是不符合要求是不符合要求4的,因的,因为这与博弈方与博弈方2自己的均衡策略自己的均衡策略D不符合因此博弈方不符合因此博弈方2此此时的的判断只能是博弈方判断只能是博弈方1选择M的概率的概率1-p=1,,这样博弈方博弈方2的的““判判断断””就与自己的策路相一致了。
就与自己的策路相一致了74““要求要求4””的必要性的必要性假假设纳什均衡策略什均衡策略组合:合:““博弈方博弈方1第一第一阶段段选择R,博弈方,博弈方2第二第二阶段段选择D””我我们只需要只需要讨论博弈方博弈方2的的““判断判断””与双方在此与双方在此处可能有的均衡可能有的均衡策略的一致性策略的一致性但是,博弈方但是,博弈方2““判断判断””1-p=1,意味着博弈方,意味着博弈方1肯定肯定选择了了M这显然是有然是有问题的,因的,因为对于博弈方于博弈方1来来说,,M既是相既是相对于于R的下策,也是相的下策,也是相对于于L的下策,即使他不愿的下策,即使他不愿选R,也只会,也只会选L而不而不选M75““要求要求4””的必要性的必要性假假设纳什均衡策略什均衡策略组合:合:““博弈方博弈方1第一第一阶段段选择R,博弈方,博弈方2第二第二阶段段选择D””我我们只需要只需要讨论博弈方二的博弈方二的““判断判断””与双方在此与双方在此处可能有的均可能有的均衡策略的一致性衡策略的一致性因此,博弈方因此,博弈方2的的““判断判断””1-p=1虽然可以与自己的策略然可以与自己的策略D相相符合,但却无法与博弈方符合,但却无法与博弈方1在此在此处可能有的均衡策略相符合,可能有的均衡策略相符合,这意味着意味着该““判断判断””也不也不满足要求足要求4。
1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)76““要求要求4””的必要性的必要性假假设纳什均衡策略什均衡策略组合:合:““博弈方博弈方1第一第一阶段段选择R,博弈方,博弈方2第二第二阶段段选择D””事事实上,在上述得益上,在上述得益结构下,构下,该博弈不可能存在与均衡策略博弈不可能存在与均衡策略组合合““博弈方博弈方1第一第一阶段段选择R,博弈方,博弈方2第二第二阶段段选择D””相符合相符合的不在均衡路径上的博弈方的不在均衡路径上的博弈方““判断判断””,,这实际上就意味着上就意味着该策策略略组合不可能是合不可能是该博弈具有真正博弈具有真正稳定性的完美定性的完美贝叶斯均衡叶斯均衡1 12 2R RM(1M(1----p p) )L(L(p p) )U UD DU UD D(1(1,,,,3)3)(2(2,,,,1)1)(0(0,,,,0)0)(0 (0 ,,,,0)0)(0(0,,,,1)1)77完美完美贝贝叶斯均衡叶斯均衡l l要求要求要求要求1 1:在每个信息集,:在每个信息集,:在每个信息集,:在每个信息集,轮轮到到到到选择选择的博弈方必的博弈方必的博弈方必的博弈方必须须具有一个关于博弈达到具有一个关于博弈达到具有一个关于博弈达到具有一个关于博弈达到该该信息信息信息信息集中每个集中每个集中每个集中每个节节点可能性的点可能性的点可能性的点可能性的““““判断判断判断判断””””((((BeliefBelief)。
l l要求要求要求要求2 2::::给给定各博弈方的定各博弈方的定各博弈方的定各博弈方的““““判断判断判断判断””””,他,他,他,他们们的策略必的策略必的策略必的策略必须须是是是是““““序列理性序列理性序列理性序列理性””””的l l要求要求要求要求3 3:在均衡路径上的信息集:在均衡路径上的信息集:在均衡路径上的信息集:在均衡路径上的信息集处处,,,,““““判断判断判断判断””””由由由由贝贝叶斯法叶斯法叶斯法叶斯法则则和各博弈方的均衡和各博弈方的均衡和各博弈方的均衡和各博弈方的均衡策略决定策略决定策略决定策略决定l l要求要求要求要求4 4:在不:在不:在不:在不处处于均衡路径上的信息集于均衡路径上的信息集于均衡路径上的信息集于均衡路径上的信息集处处,,,,““““判断判断判断判断””””由由由由贝贝叶斯法叶斯法叶斯法叶斯法则则和各博弈方和各博弈方和各博弈方和各博弈方在此在此在此在此处处可能有的均衡策略决定可能有的均衡策略决定可能有的均衡策略决定可能有的均衡策略决定782.2 三方三三方三阶段不完全信息段不完全信息动态博弈博弈79三方三三方三阶段不完全信息段不完全信息动态博弈博弈−第一第一阶段博弈方段博弈方1有有F和和B两种两种选择,他的,他的选择博弈方博弈方2和博弈方和博弈方3都能看到。
都能看到−第二第二阶段博弈方段博弈方2有有L和和R两种两种选择,跟在后面的博弈方,跟在后面的博弈方3却看不却看不见他的他的选择−博弈方博弈方3在第三在第三阶段有段有U和和D两种两种选择,他的信息集,他的信息集为一两一两节点信息集点信息集(1)这反映了博弈方反映了博弈方3的的信息不完美性信息不完美性(2)假假设博弈方博弈方3“判断判断””博弈方博弈方2选择L和和R的概率分的概率分别为p和和1--p123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)80三方三三方三阶段不完全信息段不完全信息动态博弈博弈(利用逆推(利用逆推归纳法的思路分析)法的思路分析)−首先,考首先,考虑博弈方博弈方3的的选择,,则他他(1) 选择U的期望得益的期望得益为p·1++(1--p)·2==2--p;;(2) 选择D的期望得益的期望得益为p·3++(1--p)·1==1+2p(3)因此,当因此,当p<1/3时他他选择U,当,当p>1/3时他他选择D,当,当p=1/3时选U,,D或或者混合策略都可以。
者混合策略都可以123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)81−其次,考其次,考虑博弈方博弈方2的的选择,,则(1)博弈方博弈方2的的选择必然是策略必然是策略L;;(2)因因为L是博弈方是博弈方2的的严格上策;格上策;(3)博弈方博弈方2无需考无需考虑博弈方博弈方3在第三在第三阶段的段的选择−此此时,再回,再回头看博弈方看博弈方3的的““判断判断””::(1)判断判断““p>1/3”是符合博弈方是符合博弈方2的策略的;的策略的;(2)更精确地更精确地讲,完全符合博弈方,完全符合博弈方2均衡策略的博弈方均衡策略的博弈方3的的““判断判断””是是p=1(3)因此,博弈方因此,博弈方3肯定肯定选择D123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)82−最后,考最后,考虑博弈方博弈方1的的选择,,则(1)博弈方博弈方1知道从博弈方知道从博弈方2的的选择开始的子博弈的均衡策略开始的子博弈的均衡策略组合必然合必然为((L,,D););(2)那么,博弈方那么,博弈方1选择F可以可以获得得3单位得益,位得益,选择B可以可以获得得2单位得益;位得益;(3)因此,博弈方因此,博弈方1的均衡策略是的均衡策略是F。
123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)83三方三三方三阶段不完全信息段不完全信息动态博弈博弈−利用利用逆推逆推归纳法法的分析的分析结果果总结::博弈存在一个均衡策略博弈存在一个均衡策略组合(合(F,,L,,D),以及与之相),以及与之相应的博弈方的博弈方3的的““判判断断””p==1−??该均衡策略均衡策略组合是否符合合是否符合完美完美贝叶斯均衡叶斯均衡的要求的要求123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)84完美完美贝叶斯均衡的要求叶斯均衡的要求−要求要求1:在每个信息集,:在每个信息集,轮到到选择的博弈方必的博弈方必须具有一个关于博弈达到具有一个关于博弈达到该信息信息集中每个集中每个节点可能性的点可能性的““判断判断””((Belief)(a)对于多于多节点信息集,点信息集,““判断判断””就是博弈达到就是博弈达到该信息集中各个信息集中各个节点可能性点可能性的概率分布;的概率分布;(b)对于于单节点信息集,点信息集,则““判断判断””就是博弈达到就是博弈达到该节点的概率点的概率为1。
博弈存在一个均衡策略博弈存在一个均衡策略博弈存在一个均衡策略博弈存在一个均衡策略组组合(合(合(合(F F,,,,L L,,,,D D),以),以),以),以及与之相及与之相及与之相及与之相应应的博弈方的博弈方的博弈方的博弈方3 3的的的的““““判断判断判断判断””””p p====1 1123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)85−要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列理性序列理性””的(a)即在各个信息集,即在各个信息集,给定定轮到到选择博弈方的判断和其他博弈方的博弈方的判断和其他博弈方的““后后续策略策略””,,该博弈方的行博弈方的行为及以后及以后阶段的段的““后后续策略策略””,必,必须使自己的得益或期使自己的得益或期望得益最大望得益最大(b)此此处所所谓““后后续策略策略””即相即相应的博弈方在所的博弈方在所讨论信息集以后的信息集以后的阶段中,段中,针对所有可能情况如何行所有可能情况如何行为的完整的完整计划。
划博弈存在一个均衡策略博弈存在一个均衡策略博弈存在一个均衡策略博弈存在一个均衡策略组组合(合(合(合(F F,,,,L L,,,,D D),以),以),以),以及与之相及与之相及与之相及与之相应应的博弈方的博弈方的博弈方的博弈方3 3的的的的““““判断判断判断判断””””p p====1 1123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)86−要求要求3:在均衡路径上的信息集:在均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方的均衡和各博弈方的均衡策略决定策略决定博弈存在一个均衡策略博弈存在一个均衡策略博弈存在一个均衡策略博弈存在一个均衡策略组组合(合(合(合(F F,,,,L L,,,,D D),以),以),以),以及与之相及与之相及与之相及与之相应应的博弈方的博弈方的博弈方的博弈方3 3的的的的““““判断判断判断判断””””p p====1 1123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)87要求要求4:在不:在不处于均衡路径上的信息集于均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方和各博弈方在此在此处可能有的均衡策略决定。
可能有的均衡策略决定博弈存在一个均衡策略博弈存在一个均衡策略博弈存在一个均衡策略博弈存在一个均衡策略组组合(合(合(合(F F,,,,L L,,,,D D),以),以),以),以及与之相及与之相及与之相及与之相应应的博弈方的博弈方的博弈方的博弈方3 3的的的的““““判断判断判断判断””””p p====1 1123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)88?““要求要求4” 的必要性的必要性−考考查策略策略组合(合(B,,L,,U),及相关的博弈方),及相关的博弈方3“判断判断””p==0J首先,首先,该策略策略组合是一个合是一个纳什均衡:什均衡:(1)因因为,没有博弈方可以通,没有博弈方可以通过单独改独改变自己的策略而改善得益;自己的策略而改善得益;(2)事事实上,当博弈方上,当博弈方1选择B之后,其他两博弈方根本没有之后,其他两博弈方根本没有选择的机会,而的机会,而对博弈方博弈方1来来说,当其他两方的策略是(,当其他两方的策略是(L,,U))时,当然是,当然是选择B合算123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)89J其次,其次,该策略策略组合合满足要求足要求1。
要求要求要求要求1 1:在每个信息集,:在每个信息集,:在每个信息集,:在每个信息集,轮轮到到到到选择选择的博的博的博的博弈方必弈方必弈方必弈方必须须具有一个关于博弈达到具有一个关于博弈达到具有一个关于博弈达到具有一个关于博弈达到该该信信信信息集中每个息集中每个息集中每个息集中每个节节点可能性的点可能性的点可能性的点可能性的““““判断判断判断判断””””((((BeliefBelief) (a)(a)对对于多于多于多于多节节点信息集,点信息集,点信息集,点信息集,““““判断判断判断判断””””就就就就是博弈达到是博弈达到是博弈达到是博弈达到该该信息集中各个信息集中各个信息集中各个信息集中各个节节点可能点可能点可能点可能性的概率分布;性的概率分布;性的概率分布;性的概率分布; (b)(b)对对于于于于单节单节点信息集,点信息集,点信息集,点信息集,则则““““判断判断判断判断””””就就就就是博弈达到是博弈达到是博弈达到是博弈达到该节该节点的概率点的概率点的概率点的概率为为1 1123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)90J然后,在博弈方然后,在博弈方3对博弈方博弈方2的的““判断判断””是是p==0时,(,(B,,L,,U)是序列理性)是序列理性的,因此的,因此满足要求足要求2。
要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列序列理性理性””的 (a)即在各个信息集,即在各个信息集,给定定轮到到选择博弈方的判断和其他博弈博弈方的判断和其他博弈方的方的““后后续策略策略””,,该博弈方博弈方的行的行为及以后及以后阶段的段的““后后续策策略略””,必,必须使自己的得益或期使自己的得益或期望得益最大望得益最大 (b)此此处所所谓““后后续策略策略””即即相相应的博弈方在所的博弈方在所讨论信息集信息集以后的以后的阶段中,段中,针对所有可能所有可能情况如何行情况如何行为的完整的完整计划123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)91J最后,因最后,因为在均衡路径上没有需要判断的信息集,因此要求在均衡路径上没有需要判断的信息集,因此要求3自自动满足要求要求要求要求3 3:在均衡路径上的:在均衡路径上的:在均衡路径上的:在均衡路径上的信息集信息集信息集信息集处处,,,,““““判断判断判断判断””””由由由由贝贝叶斯法叶斯法叶斯法叶斯法则则和各博弈方和各博弈方和各博弈方和各博弈方的均衡策略决定。
的均衡策略决定的均衡策略决定的均衡策略决定123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)92J小小结::(1) 策略策略组合(合(B,,L,,U)及相关的博弈方)及相关的博弈方3“判断判断””p==0是是满足完美足完美贝叶斯均衡的要求叶斯均衡的要求1--3的(2)但但该结果果实现的得益的得益组合合为((2,,0,,0),是比),是比较差的差的结果(3)原因在于:原因在于:该策略策略组合不合不满足要求足要求4• •要求要求要求要求4 4:在不:在不:在不:在不处处于均衡路径上于均衡路径上于均衡路径上于均衡路径上的信息集的信息集的信息集的信息集处处,,,,““““判断判断判断判断””””由由由由贝贝叶叶叶叶斯法斯法斯法斯法则则和各博弈方在此和各博弈方在此和各博弈方在此和各博弈方在此处处可能可能可能可能有的均衡策略决定有的均衡策略决定有的均衡策略决定有的均衡策略决定123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)93J“要求要求4”的作用:的作用:(1) 要求要求4强制博弈方制博弈方3即使在不均衡路径上的信息集即使在不均衡路径上的信息集处的的““判断判断””也必也必须符合各方的均衡策略。
符合各方的均衡策略(2)在上述均衡策略在上述均衡策略组合下博弈方合下博弈方3的信息集正是不在均衡路径上的信息集,的信息集正是不在均衡路径上的信息集,但博弈方但博弈方3在此在此处的的““判断判断””p==0,,显然与博弈方然与博弈方2的策略的策略L不相符,因此上述不相符,因此上述策略策略组合和合和““判断判断””不能构成完美不能构成完美贝叶斯均衡叶斯均衡(3)这就把(就把(B,,L,,U)排除出了完美)排除出了完美贝叶斯均衡的范畴,从而使得完美叶斯均衡的范畴,从而使得完美贝叶斯均衡是更加可靠、叶斯均衡是更加可靠、稳定和合理的均衡概念定和合理的均衡概念• •要求要求要求要求4 4:在不:在不:在不:在不处处于均衡路径上于均衡路径上于均衡路径上于均衡路径上的信息集的信息集的信息集的信息集处处,,,,““““判断判断判断判断””””由由由由贝贝叶叶叶叶斯法斯法斯法斯法则则和各博弈方在此和各博弈方在此和各博弈方在此和各博弈方在此处处可能可能可能可能有的均衡策略决定有的均衡策略决定有的均衡策略决定有的均衡策略决定123FBRLUDUD(2, 0, 0)(1, 2, 1)(3, 3, 3)(0 ,1, 2)(0, 1, 1)94完美完美贝叶斯均衡的四个要求:叶斯均衡的四个要求:−要求要求1:在每个信息集,:在每个信息集,轮到到选择的博的博弈方必弈方必须具有一个关于博弈达到具有一个关于博弈达到该信信息集中每个息集中每个节点可能性的点可能性的““判断判断””。
−要求要求2::给定各博弈方的定各博弈方的““判断判断””,他,他们的策略必的策略必须是是““序列理性序列理性””的−要求要求3:在均衡路径上的信息集:在均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈方的均和各博弈方的均衡策略决定衡策略决定−要求要求4:在不:在不处于均衡路径上的信息集于均衡路径上的信息集处,,““判断判断””由由贝叶斯法叶斯法则和各博弈和各博弈方在此方在此处可能有的均衡策略决定可能有的均衡策略决定J四个要求是判断(四个要求是判断(检验)完全)完全但不完美信息但不完美信息动态博弈中,各博弈中,各博弈方的策略博弈方的策略组合和相合和相应““判判断断””是否具有真正是否具有真正稳定性的关定性的关键标准J要求要求3和要求和要求4特特别体体现了在了在这种均种均衡概念中衡概念中““判断判断””的重要性,的重要性,““判判断断””与策略的同等地位;与策略的同等地位;J对于完美于完美贝叶斯均衡来叶斯均衡来说,一个均衡,一个均衡不再不再仅仅由每个博弈方的一个策略由每个博弈方的一个策略组合构成,也必合构成,也必须包括各博弈方在需要包括各博弈方在需要他他们选择的信息集(主要是多的信息集(主要是多节点信点信息集)息集)处的合理判断。
的合理判断95完美完美贝叶斯均衡的叶斯均衡的类型:型:根据有私人信息博弈根据有私人信息博弈方的行方的行为特征特征J合并均衡;合并均衡;J分开均衡;分开均衡;J部分合并均衡部分合并均衡根据市根据市场情况和效率差异情况和效率差异J市市场完全失完全失败;;J市市场完全成功;完全成功;J市市场部分成功;部分成功;J市市场接近失接近失败 二手二手车交易交易模型是不完模型是不完美信息美信息动态博弈的博弈的经典典模型J单一价格的一价格的模型;模型;J双价模型;双价模型;J有退款保有退款保证的模型−这些模型都有重要的意些模型都有重要的意义::J理解不完全信息理解不完全信息动态模型的原理和完模型的原理和完美美贝叶斯均衡的意叶斯均衡的意义;;J揭示信息不完美的市揭示信息不完美的市场交易中人交易中人们的的行行为规律、均衡的性律、均衡的性质和特点;和特点;J改善市改善市场秩序和提高市秩序和提高市场效率的条件效率的条件和意和意义,,960.引言引言1.完美完美贝叶斯均衡的要求叶斯均衡的要求2.完美完美贝叶斯均衡的初步解叶斯均衡的初步解释2.1 两方两两方两阶段不完全信息段不完全信息动态博弈博弈2.2 三方三三方三阶段不完全信息段不完全信息动态博弈博弈97。












