
纳什均衡的扩展与精炼博弈理论及其应用.ppt
135页博弈论及其应用:纳什均衡的扩博弈论及其应用:纳什均衡的扩展与精炼展与精炼第第3章章纳什均衡的扩展与精炼纳什均衡的扩展与精炼•主要内容:主要内容:§3.1 不完全信息的静态博弈不完全信息的静态博弈 §3.2 完全且完美信息动态博弈完全且完美信息动态博弈 §3.3 重复博弈重复博弈 §3.4 不完全信息的动态博弈不完全信息的动态博弈 §3.1 不完全信息的静态博弈不完全信息的静态博弈§3.1.1 不完全信息博弈与海萨尼转换不完全信息博弈与海萨尼转换§3.1.2 规范式表述和贝叶斯纳什均衡规范式表述和贝叶斯纳什均衡§3.1.3 贝叶斯静态博弈的典型模型贝叶斯静态博弈的典型模型§3.1.1 不完全信息博弈与海萨尼转换不完全信息博弈与海萨尼转换不完全信息的含义与形式不完全信息的含义与形式海萨尼转换海萨尼转换 例例 3.1.1 不完全信息的行业博弈不完全信息的行业博弈不完全信息的含义不完全信息的含义不完全信息博弈中的不完全信息具有特定含义,不完全信息博弈中的不完全信息具有特定含义,它专指一种博弈局势中局中人对其他局中人与该种博弈它专指一种博弈局势中局中人对其他局中人与该种博弈局势有关的局势有关的事前信息事前信息了解不充分,而不是博弈中产生的了解不充分,而不是博弈中产生的与局中人实际策略选择有关的信息。
这里所谓的与局中人实际策略选择有关的信息这里所谓的事前信事前信息息是指关于在博弈实际开始之前局中人所处地位或者状是指关于在博弈实际开始之前局中人所处地位或者状态的信息,这种地位与状态对于博弈局势会产生影响态的信息,这种地位与状态对于博弈局势会产生影响不完全信息的形式不完全信息的形式博弈中的不完全信息具有多种形式,如局中博弈中的不完全信息具有多种形式,如局中人对其他局中人人对其他局中人(或自己或自己)所掌握的自然资源、人力资源、所掌握的自然资源、人力资源、商业经验、决策能力的了解不充分,对其他局中人偏好商业经验、决策能力的了解不充分,对其他局中人偏好与品位的了解不完全,对其他局中人可用策略的了解不与品位的了解不完全,对其他局中人可用策略的了解不完全对处于同一种博弈局势的局中人的具体数目了解完全对处于同一种博弈局势的局中人的具体数目了解不完全,等等在理论上,这些多种多样的不完全信息不完全,等等在理论上,这些多种多样的不完全信息情形在博弈论分析中可以统归为一种不完全信息:情形在博弈论分析中可以统归为一种不完全信息:局中局中人对其他局中人的支付函数的不完全了解人对其他局中人的支付函数的不完全了解。
静态博弈中的不完全信息静态博弈中的不完全信息※※ 静态博弈中的不完全信息静态博弈中的不完全信息在静态博弈中,我们把各种不完全信息归结在静态博弈中,我们把各种不完全信息归结为对对局中人的各种不同的类型若局中人对参加为对对局中人的各种不同的类型若局中人对参加博弈的每一个局中人的类型都了解,则对各个局势博弈的每一个局中人的类型都了解,则对各个局势(即策略组合)下的收益(支付函数)就知道了即策略组合)下的收益(支付函数)就知道了※※ 对这种种设想,我想,我们引入海引入海萨尼尼转换海萨尼转换海萨尼转换•((1)引入一个)引入一个虚拟的局中人虚拟的局中人——“自然自然”(nature)或者说是或者说是“上帝上帝”(God),他不用考虑自己的得失,他,他不用考虑自己的得失,他的唯一作用就是赋予博弈中各局中人的类型向量的唯一作用就是赋予博弈中各局中人的类型向量 其中其中属于可行类型空间属于可行类型空间( 为局中人的特征的完备描述为局中人的特征的完备描述);;•((2)自然只把局中人)自然只把局中人i 的真实的类型的真实的类型告诉局中人告诉局中人i 本人,却不让其他局中人知道。
但本人,却不让其他局中人知道但“自然自然”将把在将把在上的上的概率分布概率分布告告诉每一个局中人;诉每一个局中人;海萨尼转换(续)海萨尼转换(续)•((3)所有局中人同时行动,局中人)所有局中人同时行动,局中人 i 从自己的从自己的策略策略空间空间中选择策略中选择策略 ;其中局中人;其中局中人的策略空间的策略空间与局中人与局中人的类型有关,一般记为的类型有关,一般记为•((4)各局中人除)各局中人除“自然自然”外的外的支付函数支付函数为为例例 3.1.1 不完全信息的行业博弈不完全信息的行业博弈 假定行业内有一个在位者(局中人假定行业内有一个在位者(局中人1)和一个潜在)和一个潜在的进入者(局中人的进入者(局中人2)。
局中人)局中人1 决定是否在某地建立决定是否在某地建立一个新工厂,同时局中人一个新工厂,同时局中人2 决定是否在该地进入该行业决定是否在该地进入该行业假定局中人假定局中人2不知道局中人不知道局中人1建厂的成本是高还是低,建厂的成本是高还是低,但局中人但局中人1自己知道这个博弈的收益如下表所示局自己知道这个博弈的收益如下表所示局中人中人2的收益取决于局中人的收益取决于局中人1是否建厂,而不是直接取是否建厂,而不是直接取决于局中人决于局中人1的成本当且仅当局中人的成本当且仅当局中人1不建厂时,局不建厂时,局中人中人2进入才有利可图进入才有利可图例例 3.1.1 不完全信息的行业博弈不完全信息的行业博弈(续续)例例 3.1.1 不完全信息的行业博弈(续)不完全信息的行业博弈(续)在这个例子中,进入者似乎是在与两个不同的在在这个例子中,进入者似乎是在与两个不同的在位者博弈,一个是高成本的在位者,另一个是低成本的位者博弈,一个是高成本的在位者,另一个是低成本的在位者一般地,如果在位者有在位者一般地,如果在位者有T种可能的不同成本函种可能的不同成本函数,进入者就似乎是在与数,进入者就似乎是在与T个不同的在位者博弈。
在个不同的在位者博弈在1967年以前,博弈论专家认为这样的不完全信息博弈是年以前,博弈论专家认为这样的不完全信息博弈是没法分析的,因为当没法分析的,因为当—个局中人并不知道他在与谁博弈个局中人并不知道他在与谁博弈时,博弈的规则是没有定义的直到时,博弈的规则是没有定义的直到1967年,海萨尼提年,海萨尼提出了海萨尼转换解决了这个问题出了海萨尼转换解决了这个问题例例 3.1.1 不完全信息的行业博弈(续)不完全信息的行业博弈(续)有了海萨尼转换,我们知道在例有了海萨尼转换,我们知道在例3.1.13.1.1中,自然决定了局中中,自然决定了局中人人ⅠⅠ有两种类型,有两种类型,“高成本高成本”和和“低成本低成本”自然决定了局中人自然决定了局中人ⅡⅡ有一种类型若局中人有一种类型若局中人ⅠⅠ属于属于“高成本高成本”类型,而局中人类型,而局中人ⅡⅡ只有一只有一种类型,则构成表种类型,则构成表3.1.13.1.1中左边一个标准的完全信息下的静态博弈中左边一个标准的完全信息下的静态博弈若局中人若局中人ⅠⅠ属于属于“低成本低成本”类型而局中人类型而局中人ⅡⅡ只有一种类型,则构成只有一种类型,则构成表表3.1.13.1.1中左边一个标准的完全信息下的静态博弈。
局中人中左边一个标准的完全信息下的静态博弈局中人ⅠⅠ知道知道自己的类型,而局中人自己的类型,而局中人ⅡⅡ则不知道局中人则不知道局中人ⅠⅠ的类型,但两个局中人的类型,但两个局中人对对“自然自然”决定的局中人决定的局中人ⅠⅠ的类型的概率分布具有一致的判断不的类型的概率分布具有一致的判断不妨妨设设,,下节讨论下节讨论§3.1.2规范式表述和贝叶斯纳什均衡规范式表述和贝叶斯纳什均衡定义定义3.1.1 不完全信息的静态博弈不完全信息的静态博弈 定义定义3.1.2 贝叶斯纳什均衡贝叶斯纳什均衡贝叶斯纳什均衡与一般纳什均衡的区别贝叶斯纳什均衡与一般纳什均衡的区别不完全信息的静态博弈定义不完全信息的静态博弈定义 不完全信息静态博弈包括如下不完全信息静态博弈包括如下4个要素。
个要素•局中人集合局中人集合•每个局中人有个每个局中人有个类型空间类型空间以及在全以及在全体类型空间体类型空间上的上的概率分布概率分布•每个局中人有(与自身的类型每个局中人有(与自身的类型相关的)相关的)策略集策略集且策略集且策略集与其它局中人的类型无与其它局中人的类型无关关 •每一个局中人都有其每一个局中人都有其收益函数收益函数,即收益函数不仅依赖于策略组合,即收益函数不仅依赖于策略组合,也依赖,也依赖于自身的类型于自身的类型。
不完全信息的静态博弈定义(续)不完全信息的静态博弈定义(续)以上以上4个因素都是个因素都是共同知识共同知识局中人在以上局中人在以上情况下同时选择策略以追求自身收益最大化情况下同时选择策略以追求自身收益最大化这种博弈称为这种博弈称为不完全信息的静态博弈不完全信息的静态博弈,也称,也称为为贝叶斯静态博弈贝叶斯静态博弈,记为,记为 贝叶斯纳什均衡的定义贝叶斯纳什均衡的定义在贝叶斯静态博弈在贝叶斯静态博弈中,若中,若是一个策略组合,且对每一是一个策略组合,且对每一个个和和都有:都有:((3.1.3))则称策略组合则称策略组合是一个是一个贝叶斯纳什均贝叶斯纳什均衡。
衡混合策略混合策略贝叶斯叶斯纳什均衡的定什均衡的定义在在贝叶斯静叶斯静态博弈博弈中,中,若若是一个策略是一个策略组合,且合,且对每一个每一个和和都有:都有:((3.1.3))则称混合策略称混合策略组合合是一个是一个混合策略贝叶斯纳什均衡。
混合策略贝叶斯纳什均衡 这里的里的 E 是指是指对混合策略混合策略下局中人下局中人 i 的收益的收益u i 期望混合策略下混合策略下贝叶斯叶斯纳什均衡的定理什均衡的定理在在贝叶斯静叶斯静态博弈博弈中,中,是混合是混合策略策略组合合贝叶斯纳什均衡贝叶斯纳什均衡的的充分充分必要条件必要条件为::对每一个每一个和和都有:都有:这里的里的s i 是局中人是局中人i的一个的一个纯策略,即特殊的混合策略,即特殊的混合策略(策略(0,…,0,1,0,…,0)。
贝叶斯纳什均衡与一般纳什均衡的贝叶斯纳什均衡与一般纳什均衡的不同点不同点•((1))贝叶斯纳什均衡贝叶斯纳什均衡用用贝叶斯公式贝叶斯公式得到的,以概率分布作得到的,以概率分布作为依据,考虑自己的期望收益贝叶斯静态博弈中的期望收为依据,考虑自己的期望收益贝叶斯静态博弈中的期望收益是对其它局中人不同类型下的期望收益,而不是自己类型益是对其它局中人不同类型下的期望收益,而不是自己类型下的期望收益下的期望收益•((2))贝叶斯纳什均衡贝叶斯纳什均衡研究的是研究的是局中人的策略选择局中人的策略选择,并且这,并且这种策略选择依赖于自身的类型,当类型不同时,它们选择的种策略选择依赖于自身的类型,当类型不同时,它们选择的策略就不一样策略就不一样贝叶斯纳什均衡存在贝叶斯纳什均衡存在性性•定义定义3.1.2只给出了贝叶斯纳什均衡的定义,但未给出只给出了贝叶斯纳什均衡的定义,但未给出在在什么条件下贝叶斯纳什均衡一定存在什么条件下贝叶斯纳什均衡一定存在类似于完全类似于完全信息静态博弈中纯策略纳什均衡的存在性讨论,我们信息静态博弈中纯策略纳什均衡的存在性讨论,我们给出下面一些概念和定理给出下面一些概念和定理。
贝叶斯纳什均衡存在贝叶斯纳什均衡存在性(性(续))在第二章定义2.2.2中,我们定义了拟凹函数拟凹函数显然,一个凹函数一定是拟凹函数贝叶斯纳什均衡存在贝叶斯纳什均衡存在性(性(续))贝叶斯纳什均衡存在贝叶斯纳什均衡存在性(性(续))贝叶斯纳什均衡存在贝叶斯纳什均衡存在性(性(续))贝叶斯纳什均衡存在贝叶斯纳什均衡存在性(性(续))贝叶斯纳什均衡存在贝叶斯纳什均衡存在性(性(续))•将定理将定理3.1.2和定理和定理2.2.3相比较,显然定理相比较,显然定理3.1.2的的条件更强些其条件更强些其原因在于原因在于在贝叶斯博弈中,局中在贝叶斯博弈中,局中人人的收益是纯策略下的期望收益(见的收益是纯策略下的期望收益(见3.1.2)或局)或局中人中人的收益函数的收益函数可以随着类型的变化而变可以随着类型的变化而变化当是是的凹函数,则其凸组合的凹函数,则其凸组合也是也是的凹函数,这就保证了贝叶斯纳什均衡点的存在的凹函数,这就保证了贝叶斯纳什均衡点的存在。
但是若但是若是拟凹函数,则它的凸组合不能保证是拟是拟凹函数,则它的凸组合不能保证是拟凹函数贝叶斯纳什均衡存在贝叶斯纳什均衡存在性(性(续))•上面讨论都是对贝叶斯博弈在纯策略的情况下介绍的上面讨论都是对贝叶斯博弈在纯策略的情况下介绍的类似于完全信息静态博弈,我们也类似于完全信息静态博弈,我们也对局中人的策略集对局中人的策略集是有限情况下是有限情况下讨论其混合策略讨论其混合策略贝叶斯纳什均衡存在贝叶斯纳什均衡存在性(性(续))贝叶斯纳什均衡存在贝叶斯纳什均衡存在性(性(续))• 在贝叶斯静态博弈在贝叶斯静态博弈中,若中,若是一个混合策略组合,且对每一是一个混合策略组合,且对每一个个和对任意的和对任意的都有都有则称混合策略组合则称混合策略组合是一个是一个混合策略下的贝叶混合策略下的贝叶斯纳什均衡斯纳什均衡。
贝叶斯纳什均衡存在贝叶斯纳什均衡存在性(性(续))•定义定义3.1.4显然是对定义显然是对定义3.1.2在混合策略下的一种直在混合策略下的一种直接扩展对混合策略下的贝叶斯纳什均衡的存在性,接扩展对混合策略下的贝叶斯纳什均衡的存在性,有类似于完全信息下静态博弈中的两个定理有类似于完全信息下静态博弈中的两个定理贝叶斯纳什均衡存在贝叶斯纳什均衡存在性(性(续))•定理定理3.1.3 在贝叶斯静态博弈在贝叶斯静态博弈中,中,是是的一个混合策略下的贝的一个混合策略下的贝叶斯纳什均衡的充分必要条件是:对每一个局中人和叶斯纳什均衡的充分必要条件是:对每一个局中人和每一个纯策略每一个纯策略有:有: 该定理的作用也与定理该定理的作用也与定理2.3.1一样,通过有限的纯策略一样,通过有限的纯策略的比较,去验证或者是去求解混合策略下的的比较,去验证或者是去求解混合策略下的贝叶斯纳什均衡。
贝叶斯纳什均衡贝叶斯纳什均衡存在贝叶斯纳什均衡存在性(性(续))•定理定理3.1.4 在贝叶斯静态博弈中,必有混合策略下的贝在贝叶斯静态博弈中,必有混合策略下的贝叶斯纳什均衡叶斯纳什均衡 •下面,我们对例下面,我们对例3.1.1进行正式的求解讨论由于纯策进行正式的求解讨论由于纯策略的贝叶斯纳什均衡包含在混合策略下的贝叶斯纳什略的贝叶斯纳什均衡包含在混合策略下的贝叶斯纳什均衡之中,我们采用定义均衡之中,我们采用定义3.1.4和定理和定理3.1.3进行求解讨进行求解讨论例例3.1.1•在位者(局中人1)有两种类型,代表高成本,代表低成本及在位者(局中人2)只有1种类型,若自然决定了局中人类型上的概率分布为例例3.1.1(续)(续)•设局中人设局中人1在高成本时在高成本时代表建厂,代表建厂,表表示不建厂局中人示不建厂局中人1此时采用此时采用策略的概率为策略的概率为,采用,采用策略策略的概率为的概率为,,。
局中人局中人1在低成本时,在低成本时,代表建厂,代表建厂,代表不建厂局中人代表不建厂局中人1此时采用策略此时采用策略的的概率为概率为,采用策略策略,采用策略策略的概率为的概率为,,例例3.1.1(续)(续)•局中人局中人2只有一种类型,只有一种类型,,,代表进入,代表进入,代表不进入局中人代表不进入局中人2此时采用策略此时采用策略的概率为的概率为,,采用策略采用策略的概率为的概率为,,局中人1在高成本时在高成本时期望收益记为期望收益记为,在低成本时的期望收益为,在低成本时的期望收益为,局中,局中人人2的期望收益记为的期望收益记为 例例3.1.1(续)(续)•由(由(3.1.2)式有:)式有:例例3.1.1(续)(续)•设设是混合策略下的贝叶斯纳什均衡,是混合策略下的贝叶斯纳什均衡,由定理由定理3.1.3,应满足下列不等式,应满足下列不等式化简化简例例3.1.1(续)(续)•由以化简所得不等式可进一步得其等价关系为:由以化简所得不等式可进一步得其等价关系为:例例3.1.1(续)(续)由以上不等式组(由以上不等式组(I),只能得到),只能得到。
将将带入带入不等式组不等式组有:有:例例3.1.1(续)(续)•为求解不等式组为求解不等式组和和 类似双矩阵博弈的求解方法类似双矩阵博弈的求解方法 可以作图:可以作图:•在图在图3.1.1中,满足不等式组中,满足不等式组和和不等式组不等式组的的解为解为A点和点和BC线段线段因此,原博弈的贝叶斯纳什均衡集为:因此,原博弈的贝叶斯纳什均衡集为:例例3.1.1(续)(续)以上混合策略贝叶斯纳什均衡包含以上混合策略贝叶斯纳什均衡包含两个纯策略贝叶斯纳什均衡两个纯策略贝叶斯纳什均衡•((1)在位者为高成本和低成本都不建厂,而进入者建)在位者为高成本和低成本都不建厂,而进入者建厂•((2)在位者为高成本时不建厂,为低成本时建厂,而)在位者为高成本时不建厂,为低成本时建厂,而进入者不建厂进入者不建厂•另有无穷多个组合策略下的贝叶斯纳什均衡:在位者另有无穷多个组合策略下的贝叶斯纳什均衡:在位者为高成本时不建厂,为低成本时建厂,进入者以为高成本时不建厂,为低成本时建厂,进入者以的的概率进入,以概率进入,以的概率不进入,的概率不进入,。
例例3.1.1(续)(续)•读者可以验证,以上的贝叶斯纳什均衡与在考虑在位读者可以验证,以上的贝叶斯纳什均衡与在考虑在位者为高成本时,只考虑在位者是低成本与进入者之间者为高成本时,只考虑在位者是低成本与进入者之间的双矩阵博弈纳什均衡是有差异的,其原因在于在位的双矩阵博弈纳什均衡是有差异的,其原因在于在位者为高成本时的策略选择对进入者是有者为高成本时的策略选择对进入者是有威慑作用威慑作用的§3.1.3 贝叶斯静态博弈的应用贝叶斯静态博弈的应用 ※※ 例例3.1.2不完全信息下的古诺模型不完全信息下的古诺模型※※例例3.1.3 酒商与顾客的博弈酒商与顾客的博弈※※例例3.1.4独立私人价值下的一级密封拍卖独立私人价值下的一级密封拍卖※※例例3.1.5双向拍卖双向拍卖不完全信息下的古诺模型不完全信息下的古诺模型设市场上有设市场上有1、、2两个厂商,生产同一种产品厂商两个厂商,生产同一种产品厂商1、、2生产的商品的数量分别为生产的商品的数量分别为和和他们有不同的不变边际成本。
厂他们有不同的不变边际成本厂商商1的边际成本为的边际成本为,厂商,厂商2有两种边际成本,低成本为有两种边际成本,低成本为高成本为高成本为但厂商2的边际成本是低成本还是高成本,只的边际成本是低成本还是高成本,只有厂商有厂商2自己知道,厂商自己知道,厂商1不知道即厂商不知道即厂商2有自己成本的私人信息有自己成本的私人信息厂商厂商1对厂商对厂商2的成本是高还是低有一个判断信念,即高成本的可的成本是高还是低有一个判断信念,即高成本的可能性为能性为,低成本的可能性为,低成本的可能性为,这里假定,这里假定这个判断信这个判断信念得到厂商念得到厂商1和厂商和厂商2的共同认同同时,市场的逆需求函数的共同认同同时,市场的逆需求函数是大于边际成本的一个常数,这里取是大于边际成本的一个常数,这里取两个厂商在没有任。
两个厂商在没有任何协议和约定的情况下,同时分别决定生产产量,以追求市场利何协议和约定的情况下,同时分别决定生产产量,以追求市场利润最大化润最大化古诺模型的求解古诺模型的求解按照对不完全信息博弈海萨尼转换的方法,可以按照对不完全信息博弈海萨尼转换的方法,可以视为视为“自然自然”决定厂商类型,厂商决定厂商类型,厂商1有有1种类型,厂商种类型,厂商2有有两种类型两种类型,,表示低成本,表示低成本,表示高成本自然将表示高成本自然将厂商厂商2的类型通知了厂商的类型通知了厂商2,并且给出了在类型空间上的概,并且给出了在类型空间上的概率分布:率分布:是一个确定常数,这里取是一个确定常数,这里取该博弈的局中人集该博弈的局中人集,厂商的策略空间,厂商的策略空间与例与例2.5一样。
一样古诺模型的求解(续)古诺模型的求解(续)这时厂商这时厂商2在低成本类型下生产在低成本类型下生产时的收益函数为:时的收益函数为:(3.1.18) 厂商厂商2在高成本类型在高成本类型 生产生产时的收益函数为:时的收益函数为:(3.1.19)厂商厂商1只有一种类型,而对厂商只有一种类型,而对厂商2的两种类型,由(的两种类型,由(3.1.3)式,)式,它生产的期望收益为:它生产的期望收益为:• (3.1.20)古诺模型的求解(续)古诺模型的求解(续) 显然,上述三个函数对自身变量显然,上述三个函数对自身变量都是凹函数,分别求都是凹函数,分别求、、并令为并令为0,有,有求解有:求解有: 即厂商即厂商1生产产量为生产产量为,厂商,厂商2在低成本类型时生产产量为在低成本类型时生产产量为,在,在高成本类型时生产产量为高成本类型时生产产量为。
3.1.22)古诺模型的求解(续)古诺模型的求解(续)将题中给的具体数字将题中给的具体数字 ::代入(代入(3.1.22)式)式有:有:再代回到(再代回到(3.1.18)()(3.1.19)和()和(3.1.20)式)式有有例例3.1.3 酒商与顾客的博弈酒商与顾客的博弈有一商人到某城镇去卖酒该商人可能是有一商人到某城镇去卖酒该商人可能是诚实诚实的,的,卖出的酒是好酒也可能是卖出的酒是好酒也可能是不诚实不诚实的,卖出的酒掺了假的,卖出的酒掺了假他有两个策略,一是加强宣传他有两个策略,一是加强宣传卖高价卖高价,一是一般卖出只,一是一般卖出只卖低价卖低价而该城镇中的消费者也有两类,一类是有饮酒而该城镇中的消费者也有两类,一类是有饮酒的的嗜好嗜好,一类,一类无此嗜好无此嗜好。
消费者对所卖的酒也有两个策消费者对所卖的酒也有两个策略:一是略:一是买酒买酒,一是,一是不买酒不买酒商人不知道来买酒的消费商人不知道来买酒的消费者是有嗜好还是无嗜好的;而消费者也不知道商人是诚者是有嗜好还是无嗜好的;而消费者也不知道商人是诚实还是不诚实的,各种情况下商人和消费者的效用值如实还是不诚实的,各种情况下商人和消费者的效用值如下表例例3.1.3 酒商与顾客的博弈酒商与顾客的博弈消消费者者有有 嗜嗜 好好(B 1)无无 嗜嗜 好好(B 2)买酒酒不不买酒酒买酒酒不不买酒酒酒酒商商诚实(A 1)高价高价3,3-4,-23,2-4,0低价低价2,5-2,-42,4-2,-4不不诚实(A 2)高价高价4,-3-3,04,-3-3,1低价低价1,0-1,11,0-1,0酒商与顾客的博弈求解酒商与顾客的博弈求解显然商人的类型有两种显然商人的类型有两种,诚实记为,诚实记为,,不诚实记为不诚实记为,而消费者类型也有两种,而消费者类型也有两种,有嗜,有嗜好的消费者记为好的消费者记为,无嗜好的消费者记为,无嗜好的消费者记为。
并记商并记商人的策略集为人的策略集为,高价卖酒记为,高价卖酒记为,低价卖酒记为,低价卖酒记为,并记消费者的策略集为,并记消费者的策略集为买酒记为买酒记为不买酒不买酒记为记为根据该城镇历年来的记载有如下的情况:根据该城镇历年来的记载有如下的情况:嗜酒者遇到诚实商人的概率为嗜酒者遇到诚实商人的概率为0.2::嗜酒者遇到不诚实商人的概率为嗜酒者遇到不诚实商人的概率为0.4::不嗜酒者遇到诚实商人的概率为不嗜酒者遇到诚实商人的概率为0.1::不嗜酒者遇到不诚实商人的概率为不嗜酒者遇到不诚实商人的概率为0.3:: 那么商人和消费者各自采取什么策略呢?那么商人和消费者各自采取什么策略呢?酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)根据贝叶斯法则根据贝叶斯法则同理有同理有酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)•设酒商在类型为设酒商在类型为时混合策略为时混合策略为•在类型为在类型为时混合策略为时混合策略为•设消费者在类型为设消费者在类型为时的混合策略为时的混合策略为•在类型为在类型为时的混合策略为时的混合策略为•从表从表3.1.2可知,酒商为类型可知,酒商为类型时,面对两种类型的时,面对两种类型的消费者,其收益矩阵分别是:消费者,其收益矩阵分别是:酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)•在上述规定下的混合策略,酒商为类型在上述规定下的混合策略,酒商为类型时的期望收时的期望收益为:益为:•由定理由定理3.1.3,,是贝叶斯纳什均衡的充分必要条件为:是贝叶斯纳什均衡的充分必要条件为:酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)•上面两个不等式的等价不等式组为上面两个不等式的等价不等式组为•酒商为类型酒商为类型时,面对两种类型消费者,其收益矩阵时,面对两种类型消费者,其收益矩阵分别是:分别是: 酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)在上述规定的混合策略下,酒商为类型在上述规定的混合策略下,酒商为类型时的期望收益:时的期望收益:由定理由定理3.1.3,,是贝叶斯纳什均衡的充分必要条件是贝叶斯纳什均衡的充分必要条件为:为:酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)•上面两个不等式的等价不等式组为上面两个不等式的等价不等式组为•消费者为类型消费者为类型时,面对两种类型的酒商,其收益矩时,面对两种类型的酒商,其收益矩阵分别为:阵分别为:酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)在上述规定的混合策略下,消费者为类型在上述规定的混合策略下,消费者为类型时的期望收益时的期望收益是贝叶斯纳什均衡的充分必要条件为是贝叶斯纳什均衡的充分必要条件为 酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)•上面两个不等式的等价不等式组为:上面两个不等式的等价不等式组为:•消费者类型为消费者类型为时,面对两种类型的酒商,其收益矩时,面对两种类型的酒商,其收益矩阵分别是:阵分别是: 酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)•在上述规定的混合策略下,消费者为类型在上述规定的混合策略下,消费者为类型的期望收益的期望收益•是贝叶斯纳什均衡的充分必要条件为是贝叶斯纳什均衡的充分必要条件为 酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)•上面两个不等式的等价不等式组为上面两个不等式的等价不等式组为 •若若是该博弈的贝叶斯纳什均是该博弈的贝叶斯纳什均衡,其衡,其充分必要条件充分必要条件是满足由是满足由((I)、()、(II)、)、(III)和和((IV))组成的不等式组。
对应这组成的不等式组对应这4个不等式组联合求个不等式组联合求解,可以采取如下方法进行解,可以采取如下方法进行酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)•先将先将可能的可能的9种组合情况分别列出:种组合情况分别列出:•然后就这然后就这9种组合情况分别讨论是否有符合不等式组种组合情况分别讨论是否有符合不等式组((I)、()、(II)、)、(III)和(和(IV)都成立的共同解都成立的共同解酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)•对第(对第(1)种组合情况)种组合情况: 此时由不等式组此时由不等式组(III)和(和(IV)可知,此时只有)可知,此时只有,但,但不满不满足不等式组(足不等式组(I)中:当)中:当由此可以由此可以排除第(排除第(1)种)种组合情况组合情况•对第(对第(5)种组合情况)种组合情况: 这时由不等式组这时由不等式组((I)和()和(II),要求),要求和和满足满足但上面方程组解为:但上面方程组解为:。
显然不符合要求显然不符合要求由此可以由此可以排除第(排除第(5)种)种组合情况组合情况酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)以上以上9种组合情况中种组合情况中,,1、、3、、4、、5、、6、、7、、8都可以排除都可以排除 考察组合情况(考察组合情况(2):):由不等式组由不等式组(III)和(和(IV),),只能是只能是综合考察综合考察对不等式组(对不等式组(I)、()、(II)、)、(III)和(和(IV)都满足因此,由因此,由可以组成贝叶斯纳什可以组成贝叶斯纳什均衡酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)•考察组合情况(考察组合情况(9):):由不等式组(由不等式组(IV)可知,)可知,再返回到不等式组(再返回到不等式组(I),只有),只有和和满足不等式组(满足不等式组(I)和()和(II))再将和放到不等式组再将和放到不等式组(III)中,则要求中,则要求综合考察:综合考察:对不等式组(对不等式组(I)、()、(II)、)、(III)和(和(IV)均满足,)均满足,因此因此可以组成贝叶斯纳什均衡。
可以组成贝叶斯纳什均衡酒商与顾客的博弈求解(续)酒商与顾客的博弈求解(续)•综上所述,该博弈的贝叶斯纳什均衡为:综上所述,该博弈的贝叶斯纳什均衡为:•即酒商为即酒商为诚实诚实时,将以概率时,将以概率卖高价,卖高价,的概率卖的概率卖低价,低价,•当酒商为当酒商为不诚实不诚实时,一定采用卖高价策略时,一定采用卖高价策略•消费者中对酒有嗜好的将买酒,而无嗜好的将不买酒消费者中对酒有嗜好的将买酒,而无嗜好的将不买酒例例3.1.4 独立私人价值下的一级密封拍卖独立私人价值下的一级密封拍卖首先考虑有两个竞标人的情况,竞标人首先考虑有两个竞标人的情况,竞标人1和竞标人和竞标人2 ,即,即令竞标人令竞标人对拍卖物的估价为对拍卖物的估价为,出价为,出价为这时这时可视为竞标人可视为竞标人的类型,只有竞标人的类型,只有竞标人自己知道自己知道是多是多少。
少为投标人的策略,即为投标人的策略,即(显然没有一个理智的投标人会(显然没有一个理智的投标人会出比自己估价更高的报价)这里出比自己估价更高的报价)这里“自然自然”确定了投标人确定了投标人的类的类型型,并给出了,并给出了的概率分布两个竞标人都知道自己的估价的概率分布两个竞标人都知道自己的估价,并假定,并假定都是都是[0,1]上的独立均匀分布上的独立均匀分布独立私人价值下的一级密封拍卖(续)独立私人价值下的一级密封拍卖(续)上述情况都是共同知识竞标人上述情况都是共同知识竞标人的收益函数如下:的收益函数如下:根据(根据(3.1.2)式,竞标人)式,竞标人在自己的类型为在自己的类型为,出价为,出价为 的情况下,其期望收益为:的情况下,其期望收益为:独立私人价值下的一级密封拍卖求解独立私人价值下的一级密封拍卖求解为了下面讨论方便,我们对局中人的策略作如下规定:为了下面讨论方便,我们对局中人的策略作如下规定:,,为常数,为常数, 这里这里可视为竞标人可视为竞标人的最低标价。
局中人的最低标价局中人报价报价时,考虑到对方的策略,必有时,考虑到对方的策略,必有在上述规定下,在上述规定下,也是一个均匀分布的随机变量,则对也是一个均匀分布的随机变量,则对任意常数任意常数这样我们在(这样我们在(3.1.38)式中后)式中后两项均为两项均为0,不予以考虑不予以考虑独立私人价值下的一级密封拍卖求解(续)独立私人价值下的一级密封拍卖求解(续)当竞标人当竞标人在类型在类型时,其出价时,其出价的多少由(的多少由(3.1.3)式和)式和((3.1.38)、()、(3.1.39)、()、(3.1.40)式有:)式有:(3.1.41))求解(求解(3.1.41)式有:)式有:((3.1.42))将(将(3.1.42)与()与(3.1.39)比较,有:)比较,有:即:即:((3.1.43))独立私人价值下的一级密封拍卖求解(续)独立私人价值下的一级密封拍卖求解(续)((3.1.43)表明,在上述假定下,两个竞标人的出价都)表明,在上述假定下,两个竞标人的出价都为自己估价的一半。
为自己估价的一半 若(若(3.1.39)式中规定)式中规定是是的单调的单调递增连续函数,结论同样成立递增连续函数,结论同样成立若有若有个人参加竞标,可以类似的分析得到个人参加竞标,可以类似的分析得到 ((3.1.44)) 显然,显然,随随的增加而增加特别地,当的增加而增加特别地,当时,时,就是说,投标人越多,卖者能得到的价格就就是说,投标人越多,卖者能得到的价格就越高;当投标人趋于无穷时,卖者几乎得到买者价值的全越高;当投标人趋于无穷时,卖者几乎得到买者价值的全部因此,让更多的人加入竞标是卖者利益所在因此,让更多的人加入竞标是卖者利益所在例例3.1.5 双向拍卖双向拍卖下面我们考虑买方和卖方对自己的估价都存下面我们考虑买方和卖方对自己的估价都存在私人信息的情况,分析一个叫做双向拍卖的交易博在私人信息的情况,分析一个叫做双向拍卖的交易博弈,卖方确定一个卖价弈,卖方确定一个卖价,买方同时给出一个买价,买方同时给出一个买价。
如果如果则交易以则交易以的价格进行,的价格进行,如果如果,则不发生交易则不发生交易双向拍卖(续)双向拍卖(续)买方对标的商品的估价为买方对标的商品的估价为,卖方的估价为,卖方的估价为,双,双方的估价都是私人信息,并且服从方的估价都是私人信息,并且服从[0,,1]区间的均匀分区间的均匀分布如果买方以布如果买方以价格购得商品,则可获得价格购得商品,则可获得的的效用;如果交易不能进行,买方的效用为效用;如果交易不能进行,买方的效用为0如果卖方以如果卖方以价格售出商品,则可得到价格售出商品,则可得到的效的效用;如果交易不能进行,卖方的效用亦为用;如果交易不能进行,卖方的效用亦为0。
双方的双方的效用函数都是衡量因交易而带来的效用变化,如果交易效用函数都是衡量因交易而带来的效用变化,如果交易没有发生,则双方效用均没有变化没有发生,则双方效用均没有变化•(求解过程请参考课本(求解过程请参考课本P77-80))§3.2 完全且完美信息动态博弈完全且完美信息动态博弈 §3.2.1 动态博弈的特征动态博弈的特征 §3.2.2 子博弈与子博弈完美纳什均衡子博弈与子博弈完美纳什均衡 §3.2.3 完全且完美信息的动态博弈的案例完全且完美信息的动态博弈的案例 §3.2.4 完全不完美信息的两阶段博弈完全不完美信息的两阶段博弈§3.2.1 动态博弈的特征动态博弈的特征§3.2.1.1 动态博弈的特征动态博弈的特征§3.2.1.2 纳什均衡的可信性与不可信性纳什均衡的可信性与不可信性§3.2.1.1 动态博弈的特征动态博弈的特征动态博弈有以下区别于静态博弈的特征动态博弈有以下区别于静态博弈的特征 ::1. 阶段阶段2. 行动与策略行动与策略 3. 行动组合和策略组合行动组合和策略组合 4. 收益函数收益函数5. 信息信息例例1.2.3 二人取数游戏二人取数游戏有一个二人参加取数的游戏,游戏分三步进行。
第一步,局有一个二人参加取数的游戏,游戏分三步进行第一步,局中人中人1在在{0,,1}中取一个数记为中取一个数记为,并告知局中人,并告知局中人2第二步,局中第二步,局中人人2也在也在{0,,1}中取一个数记为中取一个数记为,但不告知局中人,但不告知局中人1第三步,又第三步,又轮到局中人轮到局中人1取数若局中人取数若局中人1在第一步中取在第一步中取0,则可以在,则可以在{0,,1}中中取一个数,若局中人取一个数,若局中人1在第一步中取在第一步中取1,则可以在,则可以在{0,,1,,2}中取一中取一个数,记第三步局中人个数,记第三步局中人1取得数为取得数为三步后取数结束三步后取数结束现记若 S 为偶数,则局中人为偶数,则局中人1赢赢 S记分点,局中人记分点,局中人2输输 S 记分点若记分点若S 为奇数,则局中人为奇数,则局中人1输输 S记分点,局中人记分点,局中人2赢赢 S 记分点在这个游记分点在这个游戏中,两个局中人各自采取什么行动?若你参加,你愿意当局中人戏中,两个局中人各自采取什么行动?若你参加,你愿意当局中人1还是局中人还是局中人2 。
回到:阶段回到:阶段行动与策略行动与策略行动组合和策略组合行动组合和策略组合信息信息例例1.2.3 二人取数游戏二人取数游戏经过简单计算,可以用下面的树形图表示经过简单计算,可以用下面的树形图表示阶阶段段动态博弈中,局中人是依照一定的约定规则依动态博弈中,局中人是依照一定的约定规则依次进行行动每个阶段至少有一个局中人要进行行动次进行行动每个阶段至少有一个局中人要进行行动的,这里允许一个阶段中有多人行动(可见的,这里允许一个阶段中有多人行动(可见§ 3.2.3中中的两阶段博弈)在例的两阶段博弈)在例1.2.3 中有三个阶段,分别有中有三个阶段,分别有局中人局中人1或局中人或局中人2行动行动与策略行动与策略动态博弈中,轮到局中人行动时,他在自己的行动集中选择动态博弈中,轮到局中人行动时,他在自己的行动集中选择一个行动局中人行动集一般记为一个行动局中人行动集一般记为在不同的状态下和不同的阶。
在不同的状态下和不同的阶段,局中人的行动集可能不一样如例段,局中人的行动集可能不一样如例1.2.3 中,局中人中,局中人2见到见到“0”时时,行动集是行动集是,见到,见到“1”时时,行动集行动集动态博弈的策略是指局中人在这个博弈前对自己各阶段行动态博弈的策略是指局中人在这个博弈前对自己各阶段行动的一个计划例动的一个计划例1.2.3中,局中人中,局中人2行动集是行动集是,而策略,而策略={永远取永远取0,取与见到相同的数,取与见到相反的数,永远,取与见到相同的数,取与见到相反的数,永远取取1}在静态博弈中,只有一个阶段,局中人的策略集与行动集在静态博弈中,只有一个阶段,局中人的策略集与行动集是一致的但动态博弈中策略集与行动集是不同的是一致的但动态博弈中策略集与行动集是不同的。
行动组合和策略组合行动组合和策略组合动态博弈中,每个局中人在每个阶段出一个行动动态博弈中,每个局中人在每个阶段出一个行动构成一个行动组合,而每个局中人出一个策略则构成策构成一个行动组合,而每个局中人出一个策略则构成策略组合,行动组合是策略组合的一种略组合,行动组合是策略组合的一种“精炼精炼”的表述例例1.2.3 中,行动组合:(局中人中,行动组合:(局中人1选选0,局中人,局中人2选选1,局中人,局中人1选选0)是一个行动组合这一行动组合是策略)是一个行动组合这一行动组合是策略组合((局中人组合((局中人1第一次选第一次选0,第二次选,第二次选0),局中人永),局中人永远选远选1)和((局中人)和((局中人1第一次选第一次选0,第二次选,第二次选0),局中),局中人人2选与见到的相反)两个策略的选与见到的相反)两个策略的“精炼精炼”表述行动表述行动组合的个数小于策略组合的个数组合的个数小于策略组合的个数收益函数收益函数在动态博弈中,为了分析方便,局中人的收益函在动态博弈中,为了分析方便,局中人的收益函数是所有行动组合到实数集的映射。
如果博弈的局中人数是所有行动组合到实数集的映射如果博弈的局中人为为n个人,则每个行动组合对应一个个人,则每个行动组合对应一个n维实数向量但若维实数向量但若动态博弈是用策略式表示,其收益函数仍是策略组合到动态博弈是用策略式表示,其收益函数仍是策略组合到实数集的映射实数集的映射在完全信息动态博弈中,博弈的收益函数是一在完全信息动态博弈中,博弈的收益函数是一个共同知识个共同知识信信息息在动态博弈中,当每个局中人行动时,它对此前各局中在动态博弈中,当每个局中人行动时,它对此前各局中人的行动组合是完全了解和知道的,称为有完美信息博弈,反之,人的行动组合是完全了解和知道的,称为有完美信息博弈,反之,则称为不完美信息博弈不完美信息下,至少一个局中人在自己则称为不完美信息博弈不完美信息下,至少一个局中人在自己的行动选择时,不知道此前其它局中人采取了什么行动,自己是的行动选择时,不知道此前其它局中人采取了什么行动,自己是在什么状态下去选择自己的行动在什么状态下去选择自己的行动例例1.2.3 中,局中人中,局中人2在第二阶段行动。
此时他已知在第二阶段行动此时他已知道局中人道局中人1在第一阶段的选择但局中人在第一阶段的选择但局中人1在第三阶段行动时,则在第三阶段行动时,则不知道第二阶段局中人不知道第二阶段局中人2是选择了是选择了0还是还是1,但他必须行动这时,但他必须行动这时的博弈是不完美信息博弈的博弈是不完美信息博弈§3.2.1.2 纳什均衡的可信性与不可信性纳什均衡的可信性与不可信性举例说明举例说明例例3.2.1 借债与还债问题借债与还债问题该博弈中有该博弈中有2个局中人个局中人第一阶段第一阶段,局中人,局中人2向局中人向局中人1借借款款2万元,并承诺一年后还给局中人万元,并承诺一年后还给局中人1连本带息共连本带息共3万元局中万元局中人人1面临借款还是不借钱给局中人面临借款还是不借钱给局中人2若局中人若局中人1答应借钱给局答应借钱给局中人中人2,则博弈进行到,则博弈进行到第二个阶段第二个阶段这时,局中人这时,局中人2靠这笔钱共靠这笔钱共赚到赚到4万元他面临着到底履行诺言还是不履行诺言若不履万元他面临着到底履行诺言还是不履行诺言若不履行诺言,则博弈进入到行诺言,则博弈进入到第三阶段第三阶段,这时局中人,这时局中人1是将局中人是将局中人2告告上法庭还是不告上法庭。
若告上法庭,则局中人上法庭还是不告上法庭若告上法庭,则局中人1可以要回自可以要回自己己2万元,而局中人万元,而局中人2则分文得不到若不告上法庭,则局中人则分文得不到若不告上法庭,则局中人2独占独占4万元在这个博弈中,局中人万元在这个博弈中,局中人1和局中人和局中人2分别应采取什分别应采取什么策略呢?么策略呢?例例3.2.1 借债与还债问题(续借债与还债问题(续1))这是一个这是一个完全且完美信息的动态博弈完全且完美信息的动态博弈该博弈用规范式表示为:该博弈用规范式表示为:用第二章的划线法可知,有三个纯策略纳什均衡(这里暂不考用第二章的划线法可知,有三个纯策略纳什均衡(这里暂不考虑混合策略),分别是((借,上告),履行诺言),((不借,虑混合策略),分别是((借,上告),履行诺言),((不借,上告),不履行诺言),((不借,不告),不履行诺言)上告),不履行诺言),((不借,不告),不履行诺言)例例3.2.1 借债与还债问题(续借债与还债问题(续2))下面对这三个纯策略纳什均衡下面对这三个纯策略纳什均衡可信性和不可信性进行分析可信性和不可信性进行分析。
为了可以有更直观的认识,为了可以有更直观的认识,按第按第1章中介绍的扩展式章中介绍的扩展式将这一问题进行表述如为:将这一问题进行表述如为:这三个纳什均衡的第二个((不借,上告),不履行诺言)这三个纳什均衡的第二个((不借,上告),不履行诺言)是是不可信任不可信任的纳什均衡因为一旦出现局中人的纳什均衡因为一旦出现局中人1要上告,局中人要上告,局中人2的行动一定是会履行诺言的第三个纳什均衡((不借,不告),的行动一定是会履行诺言的第三个纳什均衡((不借,不告),不履行诺言)也是不履行诺言)也是不可信任不可信任的纳什均衡因为一旦出现局中人的纳什均衡因为一旦出现局中人2不履行诺言,局中人不履行诺言,局中人1采取的行动一定是上告只有第一个纳什采取的行动一定是上告只有第一个纳什均衡((借,上告),履行诺言)是均衡((借,上告),履行诺言)是可信任可信任的 例例3.2.1 借债与还债问题(续借债与还债问题(续3))从上例中可以看出,在动态博弈中,采用静态从上例中可以看出,在动态博弈中,采用静态博弈的方法求出来的纳什均衡,并不一定是可信的。
必博弈的方法求出来的纳什均衡,并不一定是可信的必须对其进行须对其进行“精炼精炼”,求出可信的纳什均衡求出可信的纳什均衡从该例可以看出,对简单的动态博弈,我们使从该例可以看出,对简单的动态博弈,我们使用博弈的扩展式,可以使分析问题的思路和理解有更好用博弈的扩展式,可以使分析问题的思路和理解有更好的帮助因此在本节中,我们尽可能地使用扩展式来分的帮助因此在本节中,我们尽可能地使用扩展式来分析一个博弈析一个博弈 §3.2.2 子博弈与子博弈完美纳什均衡子博弈与子博弈完美纳什均衡§ 3.2.2.1 动态博弈的扩展型表述动态博弈的扩展型表述§ 3.2.2.2 子博弈与子博弈完美纳什均衡子博弈与子博弈完美纳什均衡§ 3.2.2.3 子博弈完美纳什均衡的逆向归纳子博弈完美纳什均衡的逆向归纳法法§3.2.2.1 动态博弈的扩展型表述动态博弈的扩展型表述定义定义3.2.1 扩展式表述扩展式表述※※ 扩展式表示的一个例子扩展式表示的一个例子定义定义3.2.1 扩展式表述扩展式表述•定义定义3.2.1 一个一个动态博弈的扩展式动态博弈的扩展式包括:包括:•((1)博弈中的)博弈中的局中人局中人,必要时包括,必要时包括“自然自然”局中人;局中人;•((2)局中人的)局中人的行动顺序行动顺序;;•((3)局中人的)局中人的行为空间行为空间(行动集),若(行动集),若“自然自然”局中人的行动,局中人的行动,即它赋予其它局中人不同类型,则同时应给出不同行动的概率分即它赋予其它局中人不同类型,则同时应给出不同行动的概率分布;布;•((4)每次轮到某一局中人行动时,他所了解的)每次轮到某一局中人行动时,他所了解的信息信息;;•((5)对局中人可能选择的每一行动组合相对应的各局中人的)对局中人可能选择的每一行动组合相对应的各局中人的收收益益。
(由于本节仅研究完全信息下的动态博弈,因而未考虑(由于本节仅研究完全信息下的动态博弈,因而未考虑“自然自然”对类型的赋予,以及对类型的概率分布的赋予对类型的赋予,以及对类型的概率分布的赋予定义定义3.2.1 扩展式表述扩展式表述(续续)•上述定义中,(上述定义中,(2)、()、(3)和()和(4)是博弈规范式表示在动态博)是博弈规范式表示在动态博弈中的具体体现以上各要点均是弈中的具体体现以上各要点均是共同知识共同知识•本大节讨论的完全且完美信息的动态博弈,无本大节讨论的完全且完美信息的动态博弈,无“自然自然”局中人 对于博弈的扩展式描述,我们通过对于博弈的扩展式描述,我们通过树形图树形图来表示,也称来表示,也称博弈树博弈树博弈树用于表述动态博弈是非常方便的,它一博弈树用于表述动态博弈是非常方便的,它一目了然地显示出局中人行动的先后次序,每位局中人可目了然地显示出局中人行动的先后次序,每位局中人可选择的行动,及不同行动组合下的支付水平由于博弈选择的行动,及不同行动组合下的支付水平由于博弈树在通常情况下更便于表示和分析,因此在分析动态博树在通常情况下更便于表示和分析,因此在分析动态博弈时,人们大多采用博弈树的方式表示。
弈时,人们大多采用博弈树的方式表示扩展式表示的一个例子扩展式表示的一个例子这个博弈树始于局中人这个博弈树始于局中人1的一个决策结点,的一个决策结点,这时这时1要从要从L和和R中作出选择,如果局中人中作出选择,如果局中人1选选择择L,其后就到达局中人,其后就到达局中人2的一个决策结点,的一个决策结点,这时,局中人这时,局中人2要从要从L′和和R′中作出选择中作出选择类似地,如果局中人类似地,如果局中人1选择选择R,,则将到达局中人则将到达局中人2的另一个决策结点的另一个决策结点这时局中人这时局中人2从从L′和和R′中选择行动中选择行动无论局中人无论局中人2选择了哪一个,选择了哪一个,都将到达终结点都将到达终结点 (即博弈结束即博弈结束)且两局中人分别得到相应终点节下面的收益关于博弈树更详细地介绍请看第且两局中人分别得到相应终点节下面的收益关于博弈树更详细地介绍请看第1章章在扩展式表示的博弈中,我们更多关心的是各局中人在阶段中的行动,在扩展式表示的博弈中,我们更多关心的是各局中人在阶段中的行动,因此也称其为因此也称其为行为博弈行为博弈。
对应地,将使用行动、行动组合、行动组合上的收益对应地,将使用行动、行动组合、行动组合上的收益函数等概念函数等概念§3.2.2.2 子博弈与子博弈完美纳什均衡子博弈与子博弈完美纳什均衡定义定义3.2.2 子博弈子博弈定义定义3.2.3 子博弈纳什均衡子博弈纳什均衡子博弈完美纳什均衡两点说明子博弈完美纳什均衡两点说明 定义定义3.2.2扩展式博弈中,满足下面三个条件的博弈,称为该博弈扩展式博弈中,满足下面三个条件的博弈,称为该博弈的一个的一个子博弈子博弈:: ( (a)始于)始于单节信息集单节信息集的决策结点的决策结点n(但不包括博弈的第但不包括博弈的第一个决策结点一个决策结点);; ( (b)包含博弈树中)包含博弈树中n之下之下所有的决策结点和终结点所有的决策结点和终结点(但但不在不在n下面的除外下面的除外);; ( (c))没有对任何信息集形成分割没有对任何信息集形成分割即如果博弈树中即如果博弈树中n之下有一个决策结点之下有一个决策结点n′,则和,则和n′处于同一信息集的其他处于同一信息集的其他决策结点也必须在决策结点也必须在n之下,从而也必须包含于该子博弈之下,从而也必须包含于该子博弈中。
中) 举例说明子博弈的一个例子子博弈的一个例子图图3.2.2中,存在着两个子博弈,中,存在着两个子博弈,分别始于局中人分别始于局中人2的两个决策集的两个决策集图图3.2.2很好地说明了很好地说明了定义中的前两个条件(定义中的前两个条件(a)和()和(b)为了说明定义的第三个条件(为了说明定义的第三个条件(c),),考虑图考虑图3.2.2给出的博弈,给出的博弈,该博弈只有一个子博弈,该博弈只有一个子博弈,它始于局中人它始于局中人1选择选择R,,局中人局中人2选择选择R′之后局中人之后局中人3最右边一个决策点最右边一个决策点由于(由于(c)的限制,局中人)的限制,局中人2的两个决策点之下都不能构成一个子博弈的两个决策点之下都不能构成一个子博弈,即使这两即使这两个决策结点处于单结点的信息集个决策结点处于单结点的信息集图图3.2.3 存在着信息集分割的博弈树存在着信息集分割的博弈树定义定义3.2.3在完全且完美信息动态博弈中,在完全且完美信息动态博弈中,如果如果局中人的策略组合或行动组合在每一个子博弈中都构局中人的策略组合或行动组合在每一个子博弈中都构成了纳什均衡,则称纳什均衡是成了纳什均衡,则称纳什均衡是子博弈精炼子博弈精炼的,并的,并称为原博弈的称为原博弈的子博弈纳什均衡子博弈纳什均衡。
子博弈完美纳什均衡两点说明子博弈完美纳什均衡两点说明1. 关于行动组合的纳什均衡未直接给出定义行动组关于行动组合的纳什均衡未直接给出定义行动组合的纳什均衡和策略组合的纳什均衡没有本质差异合的纳什均衡和策略组合的纳什均衡没有本质差异动态博弈既可以用动态博弈既可以用策略式策略式表示也可以用表示也可以用扩展式扩展式表示,表示,因此该定义中既包含因此该定义中既包含策略组合策略组合又包含又包含行动组合行动组合P88))2. 关于在每一个子博弈中构成纳什均衡未直接给出定关于在每一个子博弈中构成纳什均衡未直接给出定义子博弈所组成的纳什均衡是原博弈某个行动组义子博弈所组成的纳什均衡是原博弈某个行动组合的纳什均衡的一个子集;原博弈该行动组合的纳合的纳什均衡的一个子集;原博弈该行动组合的纳什均衡构成子博弈中的纳什均衡什均衡构成子博弈中的纳什均衡P88))§3.2.2.3 子博弈完美纳什均衡的逆向归纳法子博弈完美纳什均衡的逆向归纳法※完全且完美信息动态博弈的主要特点完全且完美信息动态博弈的主要特点 ※※子博弈完美纳什均衡的逆向归纳法子博弈完美纳什均衡的逆向归纳法完全且完美信息动态博弈的主要特点完全且完美信息动态博弈的主要特点((1)行动是顺序发生的,)行动是顺序发生的,((2)下一步行动选择之前,所有以前的行动都可以)下一步行动选择之前,所有以前的行动都可以被观察到,被观察到,((3)每个可能的行动组合下局中人的收益是共同知)每个可能的行动组合下局中人的收益是共同知识识。
子博弈完美纳什均衡的逆向归纳法子博弈完美纳什均衡的逆向归纳法我们对这类动态博弈只有两阶段时进行讨论这时我们对这类动态博弈只有两阶段时进行讨论这时的博弈为:的博弈为:•局中人局中人1从可行集从可行集中选择一个行动中选择一个行动,,•局中人局中人2观察到观察到之后从可行集之后从可行集中选择一个行动中选择一个行动•两人的收益分别为两人的收益分别为和和•逆向归纳法逆向归纳法求解子博弈完美纳什均衡逆向归纳法求解子博弈完美纳什均衡对上面完全且完美信息的两阶段动态博弈,我们可以使用逆对上面完全且完美信息的两阶段动态博弈,我们可以使用逆向归纳法求解此类博弈问题向归纳法求解此类博弈问题这时局中人这时局中人1在第一阶段很难给出自己的最优行动因此,在第一阶段很难给出自己的最优行动因此,我们可以倒过来分析假设局中人我们可以倒过来分析。
假设局中人1在第一阶段选择了行动在第一阶段选择了行动,当,当在博弈的第二阶段局中人在博弈的第二阶段局中人2行动时,考虑到其前局中人行动时,考虑到其前局中人1若选择行若选择行动动他面临的决策问题可用下式表示:他面临的决策问题可用下式表示:若每个若每个,局中人,局中人2的这一最优化问题只有唯一解,的这一最优化问题只有唯一解,用用表示,这就是局中人表示,这就是局中人2对局中人对局中人1的行动的反应(或最的行动的反应(或最优反应)优反应)逆向归纳法求解子博弈完美纳什均衡(续)逆向归纳法求解子博弈完美纳什均衡(续)因为局中人因为局中人1可以预测到局中人可以预测到局中人2对自己每对自己每个可能的行动个可能的行动做出的反应,这样局中人做出的反应,这样局中人1在第一阶段要解决的问题可归结为:在第一阶段要解决的问题可归结为:假定局中人假定局中人1的这一最优化问题同样有唯一的这一最优化问题同样有唯一解,表示为解,表示为。
再将再将带回带回中得到中得到我们我们称称是这个博弈的逆向归纳解是这个博弈的逆向归纳解§3.2.3 完全且完美信息的动态博弈的案例完全且完美信息的动态博弈的案例例例3.2.2 斯塔克尔贝格双寡头竞争模型斯塔克尔贝格双寡头竞争模型 例例3.2.3 劳资博弈劳资博弈 例例3.2.4 序贯谈判序贯谈判例例3.2.5 制造商与销售商的博弈制造商与销售商的博弈 例例3.2.6 承包基数博弈承包基数博弈斯塔克尔贝格双寡头竞争模型斯塔克尔贝格双寡头竞争模型斯塔克尔贝格(斯塔克尔贝格(Stackelberg,,1934)提出了双寡头垄断)提出了双寡头垄断的动态模型,其中一个支配企业(领导者)首先行动,然后从属企的动态模型,其中一个支配企业(领导者)首先行动,然后从属企业(追随者)行动。
根据斯塔克尔贝格的假定,模型中企业选择其业(追随者)行动根据斯塔克尔贝格的假定,模型中企业选择其产量,这一点和古诺模型是一致的(不同的是,古诺模型中企业是产量,这一点和古诺模型是一致的(不同的是,古诺模型中企业是同时行动的,而不是这里的序贯行动)同时行动的,而不是这里的序贯行动) 在这个博弈中,首先,企业在这个博弈中,首先,企业1选择产量选择产量;然后,企;然后,企业业2可以观测到可以观测到,并选择产量,并选择产量;此时,企业;此时,企业的收益由下面的收益由下面的利润函数给出的利润函数给出这里这里是市场上的总产量是市场上的总产量时的市场出清价时的市场出清价格,格,是生产的边际成本,为一常数(令固定成本为是生产的边际成本,为一常数(令固定成本为0)。
斯塔克尔贝格双寡头竞争模型(续斯塔克尔贝格双寡头竞争模型(续1))不难看出,这是完全且完美信息两阶段博弈,逆向归纳不难看出,这是完全且完美信息两阶段博弈,逆向归纳法求解假设企业法求解假设企业1有产量有产量,我们首先计算企业,我们首先计算企业2对企业对企业1任意任意产量的最优反应,产量的最优反应,应满足应满足由上式可得由上式可得这与我们在上一章分析的古诺模型中,得到的这与我们在上一章分析的古诺模型中,得到的相相同,两者不同的在于,这里得到的同,两者不同的在于,这里得到的是企业是企业2对假定企业对假定企业1产产量为量为时的最优反应。
时的最优反应斯塔克尔贝格双寡头竞争模型(续斯塔克尔贝格双寡头竞争模型(续2))由于企业由于企业1考虑到当它产量为考虑到当它产量为时,企业时,企业2的最优的最优反应为反应为那么,在博弈的第一阶段,企业那么,在博弈的第一阶段,企业1的问题可的问题可表示为表示为由上式可得由上式可得及及是斯塔克尔贝格双寡头垄断博弈的逆向是斯塔克尔贝格双寡头垄断博弈的逆向归纳解,也是该博弈的归纳解,也是该博弈的子博弈完美纳什均衡子博弈完美纳什均衡例例3.2.3 劳资博弈劳资博弈在里昂惕夫在里昂惕夫(1946)模型中,讨论了一个企业主模型中,讨论了一个企业主和一个垄断的工会组织和一个垄断的工会组织(即作为企业劳动力惟一供给者即作为企业劳动力惟一供给者的工会组织的工会组织)的相互关系:工会对工人的工资水平提出的相互关系:工会对工人的工资水平提出要求,但企业主却可以自主决定就业人数。
工会的效用要求,但企业主却可以自主决定就业人数工会的效用函数为函数为,其中,其中为工会向企业提出的工资水平为工会向企业提出的工资水平为就业人数假定为就业人数假定是是和和的增函数的增函数企业主的利润函数为企业主的利润函数为,其中,其中为企业雇佣为企业雇佣名工人可以取得的收入名工人可以取得的收入(在最优的在最优的生产和产品市场决策下生产和产品市场决策下),假定,假定是增函数,并且为是增函数,并且为凹函数凹函数(concave)例例3.2.3 劳资博弈(续劳资博弈(续1))假定博弈的时序为:假定博弈的时序为:(1)工会提出需要的工资水平;工会提出需要的工资水平;(2)企业主得到工会要求工资企业主得到工会要求工资后,选择雇佣人数后,选择雇佣人数(3)收益分别为收益分别为和和。
那么,工会要提出什么那么,工会要提出什么样的工资要求,而企业主又应雇用多少工人?样的工资要求,而企业主又应雇用多少工人?因为没有假定因为没有假定和和的具体的表达式,从的具体的表达式,从而无法明确解出该博弈的子博弈完美纳什均衡的表达式,而无法明确解出该博弈的子博弈完美纳什均衡的表达式,我们仍可以就解的主要特征进行讨论我们仍可以就解的主要特征进行讨论例例3.2.3 劳资博弈(续劳资博弈(续2))首先,对工会在第一阶段提出的任意一个工资首先,对工会在第一阶段提出的任意一个工资水平水平,我们能够分析在第二阶段企业主最优反应,我们能够分析在第二阶段企业主最优反应的特征给定的特征给定,企业选择,企业选择满足下式:满足下式:一阶条件为一阶条件为(3.2.1)为保证为保证有解,假定有解,假定且且,,如右图所示。
如右图所示例例3.2.3 劳资博弈(续劳资博弈(续3))•对(对(3.2.1)式,可以将)式,可以将表示为表示为的函数从图中可的函数从图中可见,当工资要求越高,见,当工资要求越高,时,企业主雇用工人会减时,企业主雇用工人会减少,少,这一特征在这一特征在是凹函数时,可以得是凹函数时,可以得到证明•若若,从上面一阶条件有,从上面一阶条件有•对此式再对对此式再对求导,有:求导,有:•由前面假设,由前面假设,是是的凹函数,即的凹函数,即,则必有:,则必有:。
例例3.2.3 劳资博弈(续劳资博弈(续4))•下面我们分析工会在第一阶段的问题,由于工会和企业主同样可下面我们分析工会在第一阶段的问题,由于工会和企业主同样可以解出企业在第二阶段的问题,工会就可预测到如果它要求的工以解出企业在第二阶段的问题,工会就可预测到如果它要求的工资水平为资水平为,企业最优反应的就业人数将为,企业最优反应的就业人数将为那么,工会那么,工会在第一阶段的问题可以表示为在第一阶段的问题可以表示为(3.2.2)求解(求解(3.2.2)式,由一阶条件有)式,由一阶条件有(3.2.3) •由前面假设,由前面假设,是是的增函数,于是可以求出工会提出的的增函数,于是可以求出工会提出的工资水平工资水平,进而可由,进而可由求出企业主对雇用工人的人数求出企业主对雇用工人的人数。
例例3.2.5 制造商与销售商的博弈 制造商与销售商的博弈设有一个由制造商和销售商组成的二级供应链,设有一个由制造商和销售商组成的二级供应链,为市场提供某种商品,该商品的市场需求函数设为为市场提供某种商品,该商品的市场需求函数设为其中其中为商品的价格,为商品的价格,为市场对商品需求数量,为市场对商品需求数量, 为一常数,其经济意义是商品的最高需求量制造商提为一常数,其经济意义是商品的最高需求量制造商提供给销售商的批发价为每件供给销售商的批发价为每件元制造商和销售商都元制造商和销售商都有不变的边际成本有不变的边际成本和和制造商和销售商的博弈顺制造商和销售商的博弈顺序规定如下:制造商先确定产品的批发价序规定如下:制造商先确定产品的批发价,根据制造,根据制造商的批发价商的批发价,销售商确定商品的定价,销售商确定商品的定价例例3.2.5 制造商与销售商的博弈(续 制造商与销售商的博弈(续1))现在要确定制造商如何确定批发价现在要确定制造商如何确定批发价,销售商如何确,销售商如何确定产品的销售价定产品的销售价,以实现各自的利润最大。
以实现各自的利润最大这是一个两阶段的完全且完美信息下的动态博弈博弈这是一个两阶段的完全且完美信息下的动态博弈博弈中有中有2个人局中人个人局中人1是制造商先行动,其行动空间是是制造商先行动,其行动空间是局中人局中人2是销售商后行动,其行动空间是销售商后行动,其行动空间两个局中人的收益函数分别是两个局中人的收益函数分别是和和 (3.2.3) (3.2.4)例例3.2.5 制造商与销售商的博弈(续 制造商与销售商的博弈(续2))•采用逆向递推法的思想求解问题。
假设制造商的批发价定为采用逆向递推法的思想求解问题假设制造商的批发价定为则销售商定价应满足:则销售商定价应满足:即即 (3.2.5)• 制造商知道销售商将采用(制造商知道销售商将采用(3.2.5)式的定价策略,则他的收益)式的定价策略,则他的收益为为:例例3.2.5 制造商与销售商的博弈(续 制造商与销售商的博弈(续3))对对求偏导,且令为求偏导,且令为0 则则 (3.2.6)将(将(3.2.5)式代入()式代入(3.2.6)式有)式有 (3.2.7)将(将(3.2.6)式和()式和(3.2.7)式代回到()式代回到(3.2.3)式和)式和((3.2.4)式有)式有例例3.2.6 承包基数博弈承包基数博弈ü承包基数的确定过程,实际上是发包人与承包人承包基数的确定过程,实际上是发包人与承包人的博弈过程。
的博弈过程ü 基数确定过程中的一个难题是,委托人(指发包人基数确定过程中的一个难题是,委托人(指发包人或董事会)从自己利益最大化角度考虑,总想提高或董事会)从自己利益最大化角度考虑,总想提高基数;而代理人(指承包人或总经理)则是为自身基数;而代理人(指承包人或总经理)则是为自身利益的实现总想降低基数对方对此僵持不下,进利益的实现总想降低基数对方对此僵持不下,进行一系列的讨价还价行一系列的讨价还价例例3.2.6 承包基数博弈承包基数博弈(续1)•从博弈的角度分析该问题,可视为这是一个从博弈的角度分析该问题,可视为这是一个两阶段动态两阶段动态博弈博弈•在第一阶段,委托人对承包基数提出了一个要求数在第一阶段,委托人对承包基数提出了一个要求数D和一个收益分配方案和一个收益分配方案• 在第二阶段,代理人在明确基数要求数在第二阶段,代理人在明确基数要求数D和收益分配方和收益分配方案后,对承包基数给出一个自报数案后,对承包基数给出一个自报数S •两阶段完成后,进入承包期,并在两阶段完成后,进入承包期,并在 承包期后按照事先规承包期后按照事先规定的方案进行收益分配定的方案进行收益分配。
