好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

博弈论与经济行为.ppt

43页
  • 卖家[上传人]:工****
  • 文档编号:579684737
  • 上传时间:2024-08-27
  • 文档格式:PPT
  • 文档大小:607.50KB
  • / 43 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • Lecture 13博弈论与经济行为博弈论与经济行为1 Introduction到目前为止,我们对经济活动的考察没有考虑人们之间的相互影响其实,一个人的行为总是受到他人行为的影响人们在追逐自己利益时,难免要与他人发生利益冲突或矛盾ªª如何克服和解决人如何克服和解决人如何克服和解决人如何克服和解决人们们们们之之之之间间间间的利益冲突的利益冲突的利益冲突的利益冲突??如何才能如何才能如何才能如何才能实现实现实现实现一种既一种既一种既一种既能能能能让让让让每个人都每个人都每个人都每个人都实现实现实现实现自己的利益,又能自己的利益,又能自己的利益,又能自己的利益,又能让让让让每个人都不妨碍和每个人都不妨碍和每个人都不妨碍和每个人都不妨碍和伤伤伤伤害他人利益的互利互惠的和害他人利益的互利互惠的和害他人利益的互利互惠的和害他人利益的互利互惠的和谐谐谐谐局面局面局面局面?Ø博弈论(game theory)为解决这些问题提供了有力工具Ø博弈论以人的理性为基本假定,强调策略性——一种普遍的行为现象这种现象的广阔背景是市场中的竞争与合作Ø20世纪80年代以来,博弈论在经济学中得到了广泛应用,在揭示经济行为的相互影响和制约方面取得了重大进展。

      Ø大部分经济活动都可以用博弈论加以解释,甚至连市场调节与宏观调控这样的重大问题,都可看成博弈现象来研究2 ( (一一) ) 两个充满理性与智慧的两个充满理性与智慧的博弈故事博弈故事IntroductionØ猪圈里有一大一小两头猪,猪圈一边装有踏板,踩一下,远离踏板的食槽端就会落下食物若一猪去踩踏板,另一猪就会等在槽边抢先吃到食物Ø若小猪去踩,大猪会在小猪跑到食槽前吃光食物;若大猪去踩,大猪还有机会在小猪吃完之前抢吃到食物的一半这两这两头猪会采取什么策略呢头猪会采取什么策略呢?Ø答案答案:小猪舒服地等在槽边,大猪要为争取残羹奔忙于踏板和食槽之间Ø原因:对小猪而言,去踩,吃不到食物;不去踩,反而能吃到一半食物,当然不去踩了反观大猪,明知小猪不为,那么自己为之总还是要比不为强1. 智猪博弈的故事智猪博弈的故事3 Ø智猪故事揭示了大、小企业的关系当企业定位于“大猪”时,应选择“主动获得”之优势策略;当定位于“小猪”时,应选择“等待获得”,这也是优势策略比如,研究开发、为新产品做广告,这对大企业值得,对小企业是得不偿失的完全市场中,作为一个理性企业,最可能的情况是小企业把精力花在模仿上,或等待大企业打开市场后出售廉价产品。

      而大企业应当以主动的态度来开拓市场 Ø智猪故事还给竞争中的弱者以等待为最佳策略的启发博弈中,每一方都想方设法攻击对方、保护自己,最终取得胜利;同时,对方也是一个与你一样的理性人,他会这么做吗?这就需要更高明的智慧Ø任何理性企业都必然会像智猪那样,总是选择优势策略 Introduction( (三三) ) 两个充满理性与智慧的两个充满理性与智慧的博弈故事博弈故事1. 智猪博弈的故事智猪博弈的故事( (启示启示) )4 Introduction( (三三) ) 两个充满理性与智慧的两个充满理性与智慧的博弈故事博弈故事2. 鱼与鱼竿的故事鱼与鱼竿的故事Ø从前有两个饥饿的人从一位智者那里得到了一根鱼竿和一篓鲜鱼•得到那篓鲜鱼的人在原地把鱼煮熟吃完,解决了饥饿问题,可很快又感到肚内空空,最终饿死在空鱼篓旁边•另外一个得到鱼竿的人提着鱼竿朝向遥远的大海走去,当他终于来到海边的时候,也用尽了最后一点力气而死去Ø不久之后,同样是两个饥饿的人,也从智者那里得到了一根鱼竿和一篓鲜鱼不同的是:•他们一起去寻找大海每到饥饿的时候,就从鱼篓中拿出一条鱼吃•当他们最终来到海边的时候,这两个人就拿着那根鱼竿开始了捕鱼为生的日子!5 ( (二二) ) 博弈论的研究对象博弈论的研究对象l l博弈是一种普遍博弈是一种普遍博弈是一种普遍博弈是一种普遍现现现现象象象象,,人人人人们总们总们总们总会有意、无意地运用博弈的思会有意、无意地运用博弈的思会有意、无意地运用博弈的思会有意、无意地运用博弈的思想想想想。

      比如企业在决策时,总是会考虑竞争对手的反应;个人与政府之间 “上有政策,下有对策” ;金融监管与创新犹如“猫鼠博弈”;博弈还作为消遣游戏,让人们获得快乐l l博弈的特征博弈的特征博弈的特征博弈的特征表表现为现为两个或两个以上具有利益冲突的当事人两个或两个以上具有利益冲突的当事人两个或两个以上具有利益冲突的当事人两个或两个以上具有利益冲突的当事人处处处处于一种不相容状于一种不相容状于一种不相容状于一种不相容状态态态态中中中中,,一方的行一方的行一方的行一方的行动动动动取决于取决于取决于取决于对对对对方的行方的行方的行方的行动动动动,,每个每个每个每个当事人的收益都取决于所有当事人的行当事人的收益都取决于所有当事人的行当事人的收益都取决于所有当事人的行当事人的收益都取决于所有当事人的行动动动动当所有当事人都拿定主意作出决策时,博弈的局势便确定下来l l博弈博弈博弈博弈论论论论的目的的目的的目的的目的是要研究人研究人研究人研究人们们们们之之之之间这间这间这间这种不相容的行种不相容的行种不相容的行种不相容的行为为为为,,推广推广推广推广标标标标准的一人决策理准的一人决策理准的一人决策理准的一人决策理论论论论。

      l l博弈博弈博弈博弈论论论论关注的关注的关注的关注的问题问题问题问题:在每个当事人的收益都依赖于其他当事人的选择的情况下,追求个人收益最大化的当事人应该如何采取行动?Introduction6 ( (三三) ) 博弈的标准形式与分类博弈的标准形式与分类l基本要素基本要素:局中人(players)、策略(strategies)、收益(payoffs)Ø局中人局中人以策略策略定胜负,以收益最大化收益最大化为目标l标准形式标准形式(normal form):G = (Xi, fi)n,其中 Xi 为局中人 i 的策略集合策略集合, fi : S  R 为局中人 i 的收益函数收益函数(i = 1,2,,n)ØS = X1 X2 Xn 叫做博弈G 的局势集合局势集合Ø局势局势:策略 n 元组 (x1, x2,, xn) ( xiXi,i = 1,2,,n)l博弈的分博弈的分类类:一般按照博弈的基本要素进行分类l按人数分:二人博弈二人博弈、多人博弈多人博弈l按策略分:有限有限(策略策略)博弈博弈、无限无限(策略策略)博弈博弈l按收益分:常和常和( (零和零和) )博弈博弈、变和博弈变和博弈l按性质分:非合作博弈非合作博弈、合作博弈合作博弈l按次序分:同时移动博弈同时移动博弈、先后先后移动博弈移动博弈(序贯博弈序贯博弈)l l交叉分类交叉分类交叉分类交叉分类:以以上分类方式的结合上分类方式的结合,比如二人零和有限博弈。

      Introduction7 矩阵博弈矩阵博弈 我们先以矩阵博弈矩阵博弈为重点,建立博弈论的基本分析框架l l矩矩矩矩阵阵阵阵博博博博弈弈弈弈:二人零和有限博弈二人零和有限博弈,这是最简单的博弈形式ØØ特点特点特点特点:甲与乙利益冲突,一方的收益就是对方的损失ØØ甲的策略集甲的策略集甲的策略集甲的策略集 X ={x1, x2,, xm};乙的策略集乙的策略集乙的策略集乙的策略集Y ={y1, y2,, yn}ØS = X Y ={(xi, yj): i =1,2,,m ; j =1,2,,n}ØØ甲的收益函数甲的收益函数甲的收益函数甲的收益函数 f : S  R;乙的收益函数乙的收益函数乙的收益函数乙的收益函数 g : S  RØ零和零和:f (xi, yj) + g (xi, yj) = 0 (i =1,2,,m ; j = 1,2,,n)ØØ标标标标准形式准形式准形式准形式:G = (X, f ; Y, g) = (X,Y, f ) l l矩矩矩矩阵阵阵阵博弈的矩博弈的矩博弈的矩博弈的矩阵阵阵阵表示表示表示表示:甲的收益矩阵收益矩阵 f 即可表示矩阵博弈8 ( (一一) ) 古诺均衡古诺均衡Ø局中人的目局中人的目标标:选择合适的策略以使自己的收益(对方的损失)达到最大,也即让对方的收益(自己的损失)达到最小。

      Ø假定假定:甲和乙彼此了解对方的收益矩阵,双方都清楚自己的收益就是对方的损失l博弈过程博弈过程:每个人都根据对方的行动来确定自己的行动,每个人都不断地在对方选定了策略的情况下来调整自己的策略以使自己的收益达到最大l博弈结局博弈结局:当策略调整达到这样的局势 (xh, yk) 使得 xh 是甲在乙选定yk的情况下的收益最大策略,同时yk是乙甲在选定xh的情况下的收益最大策略的时候,双方策略调整宣告结束,博弈得以确定此时的局势(xh, yk)就是古诺均衡古诺均衡(最优解最优解),即矩阵博弈矩阵博弈9 1. 最大最小原理最大最小原理Ø依据定义,矩阵博弈 f 的古诺均衡古诺均衡正对应于矩阵 f 的鞍点鞍点n鞍点定理(最大最小原理最大最小原理) 是矩阵 的鞍点(即局势(xh, yk)是矩阵博弈 f 的古诺均衡)当且仅当当且仅当下述等式成立:l l矩矩矩矩阵阵阵阵博弈古博弈古博弈古博弈古诺诺诺诺均衡的求解步均衡的求解步均衡的求解步均衡的求解步骤骤骤骤u从矩阵各行的最小元中找出最大元,称为最大最小元最大最小元;v从矩阵各列的最大元中找出最小元,称为最小最大元最小最大元;w如果最大最小元最大最小元与与最小最大元最小最大元一一致致,那么该元素就是鞍点,代表矩阵博弈的古古诺诺均衡均衡。

      ( (一一) ) 古诺均衡古诺均衡矩阵博弈矩阵博弈x1y1x2x4x3y3y4y5YXz鞍鞍点点古诺均衡古诺均衡y210 2. 两个博弈事例两个博弈事例 乙乙甲甲作广告作广告不作广告不作广告作广告作广告3030不作广告不作广告2020例例例例1 1. 广告广告竞竞争:争:存在古诺均衡存在古诺均衡单位单位:万元万元( (一一) ) 古诺均衡古诺均衡矩阵博弈矩阵博弈例例例例2 2. 便便士匹配士匹配:没有古诺均衡没有古诺均衡 甲、乙独立决定出示硬币正或反面若两人出示相同,甲赢乙1元;若出示相反,乙赢甲1元甲的收益表如下:乙乙甲甲出示正面出示正面出示反面出示反面出示正面出示正面11出示反面出示反面1111 3. 稳妥策略与不稳定性稳妥策略与不稳定性Ø只有当收益矩阵的最大最小元与最小最大元一致时,矩阵博弈才有古诺均衡(最优解)Ø最大最小元和最小最大元总存在,但二者未必一致,从而矩阵博弈可能没有最优解例如,便士匹配博弈没有最优解l矩阵博弈可能没有最优解的真正原因是什么?矩阵博弈可能没有最优解的真正原因是什么?Ø稳妥策略稳妥策略•甲的稳妥策略甲的稳妥策略:甲的收益矩阵的最大最小元;•乙的稳妥策略乙的稳妥策略:甲的收益矩阵的最小最大元。

      Ø问题问题的答案的答案:原因在于稳妥策略可能不稳定稳妥策略可能不稳定•不稳定的稳妥策略不能使博弈中的策略调整过程结束•即使甲和乙都选择稳妥策略,但若稳妥策略不稳定,那么博弈就无法达到古诺均衡矩阵博弈矩阵博弈( (一一) ) 古诺均衡古诺均衡12 ( (二二) ) 混合策略混合策略 为了消除古诺均衡未必存在的困惑,人们提出使用混合策混合策略略,即一种连当事人自己都不知道会采取什么行动的策略,对手就更不得而知了,从而使得局中人的行动变得相当诡异Ø考虑二人有限博弈二人有限博弈G = (X, f ; Y, g):•X = {x1, x2,…, xm}:甲的纯策略集合;•Y = {y1, y2,…, yn}:乙的纯策略集合;•S = X  Y :博弈 G 的纯局势集合Ø混合策略混合策略(mixed strategies):以一定的概率采取一种策略•甲的混合策略集合:•乙的混合策略集合: •G 的混合局势集合:•甲的预期收益:•乙的预期收益:Ø混合混合扩扩充充:博弈 叫做 G 的混合扩充混合扩充矩阵博弈矩阵博弈13 1. 矩阵博弈的混合扩充矩阵博弈的混合扩充n定理 博弈 G = (X, f ; Y, g) 为常和博弈 当且仅当当且仅当 G 的混合扩充 为常和博弈。

      当G 是常和博弈时,G 与 具有相同的收入常和因此,矩阵博弈的混合扩充仍为二人零和博弈l矩阵博弈矩阵博弈 G 的混合均衡的混合均衡:是指 G 的混合扩充 的古诺均衡即,G的混合局势( p*,q*)叫做 G 的混合均衡混合均衡(混合最优解混合最优解)是指( p*,q*)满足如下条件:n定理(混合均衡的存在性混合均衡的存在性) 任何矩阵博弈都有混合均衡任何矩阵博弈都有混合均衡Ø矩阵博弈 f 的混合均衡正对应于函数 Ef 的鞍点n鞍点定理(最小最大原理最小最大原理) ( p*, q*)是矩阵博弈G 的混合均衡(即函数 Ef 的鞍点) 当且仅当当且仅当 下述等式成立:( (二二) ) 混合策略混合策略 矩阵博弈矩阵博弈14 2. 事例:求解便士匹配博弈的混合均衡事例:求解便士匹配博弈的混合均衡Ø便士匹配博弈中,甲的收益矩阵为Ø寻找混合均衡,就是去找出 使得( (二二) ) 混合策略混合策略 矩阵博弈矩阵博弈15 3. 混合均衡集的特点混合均衡集的特点l博弈值博弈值:•混合均衡的存在性及鞍点定理,保证了V(G)是良好定义的,并且当( p*,q*)是混合均衡时,V(G) =Ef (p*,q*)。

      •博弈值在解释均衡及求解混合均衡方面相当有用•还可通过V(G) 证明矩阵博弈的混合均衡集的下述特点Ø令n定理 对于甲和乙的矩阵博弈G = (X, Y, f )来说,T = T1T2 且混合均衡集 T 是空间 的非空有界闭凸子集,从而甲的混合最优策略集T1是 的非空有界闭凸子集,乙的混合最优策略集T2 是 的非空有界闭凸子集 ( (二二) ) 混合策略混合策略 矩阵博弈矩阵博弈16 二人博弈二人博弈Ø矩阵博弈仅仅是一类简单又典型的二人常和博弈,经济学中遇到的博弈往往都是变和博弈Ø矩阵博弈理论之所以重要,是因为它为研究变和博弈提供了很好的分析思路和框架Ø现在,我们来在矩阵博弈理论的基础上建立一般的二人博弈理论 l二人博弈 : 古诺均衡古诺均衡•二人有限博弈:策略集合 X 和Y 为有限集合•二人无限博弈:策略集合 X 和 Y 为无限(任意)集合l 二人博弈的重复:博弈不只进行一次,而是要进行多次17 ( (一一) ) 二人有限博弈二人有限博弈二人博弈二人博弈l古诺均衡古诺均衡Ø应对 yj 的上策上策 xi( j):当乙采取 yj 时,甲采取 xi( j) 是最好的,即 f i( j) j 是 f 的第 j 列的最大元: 。

      Ø应对 xi 的上策上策 yj(i):当甲采取 xi 时,甲采取 yj(i) 是最好的,即 g i j(i) 是 g 的第 i 行的最大元: Ø甲的上上策上上策 xi*:不论乙采取什么策略,xi*都是甲的上策,即 f 的第i*行最大: Ø乙的上上策上上策 yj*:不论甲采取什么策略,yj*都是乙的上策,即 g的第j*列最大: l占优解占优解(xi*, yj*): xi*是甲的上上策, yj*是乙的上上策18 1. 求解方法求解方法二人博弈二人博弈( (一一) ) 二人有限博弈二人有限博弈l最大最小原理只适用于矩阵博弈,一般的二人有限博弈的求解只能采取通用方法①把局中人甲和乙的收益矩阵写在同一张表中②圈出甲的收益矩阵各列的最大元③圈出乙的收益矩阵各行的最大元。

      ④收益表中同时出现两个圈的位置即为古诺均衡古诺均衡如果没有一个位置出现两个圈,就说明该博弈的古诺均衡不存在⑤如果在甲的收益矩阵的某一行上全部带圈,则就出现了甲的上上策;同样,若在乙的收益矩阵的某一列上全部带圈,则就出现了乙的上上策⑥如果既找到了甲的上上策,又找到了乙的上上策,那么也就找到了博弈的占优解占优解否则,博弈没有占优解19 2. 求解事例求解事例二人博弈二人博弈( (一一) ) 二人有限博弈二人有限博弈Ø囚徒难题囚徒难题乙乙甲甲合作背叛合作3304背叛4011古诺均衡古诺均衡上上上上策策上上策上上策Ø智猪博弈智猪博弈小猪小猪大猪大猪去踩踏板 不去踩去踩踏板7355不去踩10000上上策上上策均衡均衡次优均衡次优均衡—剔除剔除乙乙甲甲y1y2y3y4x1121582623141811x21820151611191517x315101849221714x41712131814171920Ø找出下列博弈的古诺均衡找出下列博弈的古诺均衡古诺均衡古诺均衡(x2, y1)(x4, y4)无上上策无上上策20 ,预期收益都为2/3。

      3. 混合策略混合策略二人博弈二人博弈( (一一) ) 二人有限博弈二人有限博弈ØG = (X, f ; Y, g)的混合扩充:ØG 的混合均衡( p*, q*):n角谷不动点定理 设 T 是有限维欧氏空间的非空有界闭凸子集,F: T T 是集值映射若 F 上半连续且对任何xT,F(x)都是非空闭凸集,那么F 必有不动点,即(xT )(xF(x))n定理(混合均衡存在性混合均衡存在性) 任何二人有限博弈都有混合均衡卡夫卡夫茹达茹达话剧足球话剧2100足球0012ØØ例例例例. 性性性性别别别别之之之之战战战战::性别差异导致收益差异21 n假设G1 X 是拓扑向量空间V1的非空紧凸子集;乙的策略集合Y是 拓扑向量空间V2的非空紧凸子集;故局势集合 S 是拓扑向量空间V1 V2 的非空紧凸子集n假设G2 甲的收益函数 f (x,y)连续且关于策略变元 x 弱拟凹;乙的收益函数g(x,y)连续且关于策略变元 y 弱拟凹 (二二) ) 二人无限博弈二人无限博弈ØG = (X, f ; Y, g):X 和Y 为无限集合,S = X Y Ø二人有限博弈的混合扩充是二人无限博弈,二人无限博弈的混合扩充依然是二人无限博弈。

      因此,二人无限博弈是二人博弈的一般情形,无需再讨论其混合扩充l古诺均衡古诺均衡(x*, y*):XYzf (x*, y*)古诺均衡古诺均衡g (x*, y*)二人博弈二人博弈x*y*22 1. 均衡的存在性与反应函数均衡的存在性与反应函数n范格不动点定理 设T是拓扑向量空间的非空紧凸子集,集值映射 F : T T 上半连续且对任何 xT,F(x) 都是非空闭凸集则 F 有不动点,即(tT)(tF(t))n定理(古诺均衡的存在性) 任何满足假设任何满足假设G1和和G2的二人无限的二人无限博弈都有古诺均衡博弈都有古诺均衡l反应函数反应函数Ø甲对乙的反应甲对乙的反应:当乙采取策略 y时,甲的应对上策上策 x=(y)为:f (x, y) = max { f (x, y): xX } (y):甲的反应函数反应函数Ø乙对甲的反应乙对甲的反应:当甲采取策略 x时,乙的应对上策上策 y=(x)为:g(x, y) = max {g(x, y ): y Y }(x):乙的反反应函数应函数l古诺均衡古诺均衡(x*, y*):( (二二) ) 二人无限博弈二人无限博弈二人博弈二人博弈23 2. 用反应函数求解古诺均衡用反应函数求解古诺均衡•比如,( (二二) ) 二人无限博弈二人无限博弈二人博弈二人博弈Ø一般情形一般情形:找出反应曲线的交点,如右图所示。

      Ø特殊情况特殊情况:X 和 Y 都是实数区间,收益函数 f : XR 和 g : Y  R可微于是,反应函数由下述方程确定:YXx1x2x3x4x5x6x7x8y1y2y3y4y5古古诺诺均均衡衡甲的反应曲线甲的反应曲线乙的反应曲线乙的反应曲线24 ( (三三) ) 重复博弈重复博弈Ø虽然人们对二人博弈的最优解作了深入研究,但让局中人找到最优解却不是一件容易的事情,需要反复实践和锻炼,就好像棋手下棋一样,需要反复不断地下,才能越来越接近最优解可见,博弈是需要重复进行Ø但到目前为止,所研究的博弈都是一次性博弈因此,有必要研究博弈的重复Ø事实上,当博弈重复进行时,其最优结局可能会与一次性博弈的均衡有所差异Ø下面以囚徒难题博弈囚徒难题博弈为例,来说明重复博弈的最优解我们将分两种情况讨论:l 博弈重复博弈重复进进行有限次行有限次l 博弈重复博弈重复进进行无限次行无限次二人博弈二人博弈25 1. 有限次重复博弈有限次重复博弈Ø每个局中人都知道博弈将重复一个固定的次数Ø最后一次博弈中局中人的推理最后一次博弈中局中人的推理:这是最后一次行动,每个人都认为此时是在进行一次性博弈,因而古诺均衡的标准逻辑得以应用,结果局中人双方选择“背叛”。

      Ø倒数第二次博弈倒数第二次博弈:这里似乎每个人都重视合作,可以向对方发出“善意”的合作信号,以便在下次博弈中继续合作但理性的局中人清楚,最后一次博弈中对方必然背叛因此他在倒数第二次博弈中选择合作就没有优势,故要选择背叛Ø倒数第三次博弈倒数第三次博弈:局中人的推理与倒数第二次一样,结果在倒数第三次博弈中,局中人依然选择背叛 l结结局局:逆向归纳逆向归纳(backward induction)可知,每次博弈中双方都要“背叛”,有限次重复博弈的最优解依然是古诺均衡n古诺均衡是局中人双方的短期利益所在古诺均衡是局中人双方的短期利益所在 (三三) ) 重复博弈重复博弈二人博弈二人博弈26 2. 无限次重复博弈无限次重复博弈( (三三) ) 重复博弈重复博弈二人博弈二人博弈Ø每个局中人都知道,博弈要无限重复进行下去每个局中人的策略都是一个函数序列,表明每个人在每个阶段的策略选择都是此阶段之前的博弈历史的函数这样,局中人的收益是各阶段收益的贴现值之和(向时刻0贴现): ØR:局中人永不背叛的收益;RT:局中人第T次背叛的收益 l只要贴现率r < 2,就有RT < R,即选择背叛无利可图,还是合作为好。

      贴现率小于2是平常的,说明通常情况下,只要博弈能够无限次重复下去,则可实现“(合作,合作)”n双方选择合作是局中人双方的长期利益所在双方选择合作是局中人双方的长期利益所在 27 多人非合作博弈多人非合作博弈Ø二人一次性博弈是典型的非合作博弈,局中人之间没有串通和勾结,各个局中人都是独立决策和独立行动Ø20世纪50年代,美国数学家纳什成功地将这种博弈模式推广到多人情形,接连发表了多篇研究论文,为现代博弈论的形成和发展奠定了坚实基础Ø纳什对多人非合作博弈作出了明确界定,提出了多人非合作博弈的“纳什均衡纳什均衡”概念,并应用角谷不动点定理证明了纳什均衡的存在性Ø由于纳什均衡是对矩阵博弈的古诺均衡概念的推广,因此人们也常常把纳什均衡称作古古诺诺- -纳什均衡纳什均衡l纳什均衡存在性定理的重要意义纳什均衡存在性定理的重要意义:该定理的结论可以直接向经济系统推广,并且这种推广是阿罗和德布罗重建瓦尔拉一般均衡理论大厦的关键所在28 lG 的混合扩充的混合扩充:( (一一) ) 非合作的非合作的多人有限多人有限博弈博弈n定理(纳什定理纳什定理) 任何非合作 n 人有限博弈都有混合最优解多人非合作博弈多人非合作博弈Ø博弈博弈 G = (Xi, fi )iI :l纳什均衡纳什均衡 :29 ( (二二) ) 非合作的多人非合作的多人连续连续博弈博弈 l连续博弈连续博弈:策略集合为拓扑空间,收益函数为连续函数。

      lx*S是纳什均衡  x* (x*)(即x*为 的不动点)n假设假设G1 每个局中人 i 的策略集合 Xi 都是某个拓扑向量空间Vi 的非空紧凸子集,从而局势集合S是拓扑向量空间V1Vn的非空紧凸子集n假假设设G2 连续且关于策略变元 xi 弱拟凹n定理定理(均衡存在性均衡存在性) 任何满足假设G1和G2的 n 人非合作博弈都有纳什均衡 多人非合作博弈多人非合作博弈(i 的上策集)30 ( (三三) ) 带约带约束条件的束条件的纳纳什均衡什均衡 n假假设设G3 在带约束的博弈G = (Xi, fi, Bi)iI中,每个局中人 i 的约束集映Bi:SXi都是连续的集值映射,同时对任何xS,Bi(x)都是Xi的非空闭凸子集,并且Bi(x)与局中人i在局势x中的策略无关n定理定理(带约束条件的纳什均衡存在性带约束条件的纳什均衡存在性) 任何满足假设G1、G2和G3的 n 人非合作博弈都有纳什均衡l纳纳什均衡什均衡:多人非合作博弈多人非合作博弈l带约带约束的博弈束的博弈:31 合作博弈合作博弈Ø当博弈从二人发展到多人参与的时候,局中人就不再像二人博弈那样只是独立行动,而是可以开展合作。

      Ø一些局中人联合起来对抗另外一些局中人他们出于某种动机或需要而结成联盟,互通情报信息,采取一致行动,以便取得对自己有利的结果 这种相互配合、彼此协作、结成联盟的现象就是合作博弈的原型Ø在合作博弈中,局中人自己的策略选择已经不再是什么重要事情,关键是联盟如何选择策略,如何采取一致行动,联盟的收入如何向其成员进行分配Ø收入分配问题至关重要,它决定着局中人能否形成联盟,盟外人又是否愿意加入到联盟中来Ø现在,我们来讨论这些问题,建立多人合作博弈的理论我们将以有限博弈为对象展开讨论,至于无限博弈的情形,这里的理论和方法都可以自然地推广过去 32 ( (一一) ) 联盟对抗联盟对抗Ø博弈 G = (Xi, ui)iI ,局中人集合 I = {1,2,,n}Ø合作表现为局中人结盟,即形成联盟联盟是 I 的子集n定义 博弈 G 中的一个联盟联盟是指局中人集合 I 的一个子集l对于这个定义,以下三点值得注意:j如果 A 是联盟,那么 B = I – A 也是联盟—— A 的余联盟余联盟任何联盟 A 都把局中人分成两个联盟:联盟 A 和余联盟 B I 和空集 都是联盟且互为余联盟空集 称为空联盟空联盟。

      l只含一个局中人的集合也是联盟,叫做单人联盟单人联盟l通过联盟通过联盟,合作博弈转化为非合作博弈合作博弈转化为非合作博弈若 A 是联盟,那么G 转化为 A 与余联盟 B 的非合作博弈GA = (XA, uA ; XB, uB):局中人 A 和 B,策略集合分别为 XA =  iA Xi 和 XB =  iB Xi,局势集合为 X =  iI Xi = XA  XB,局势 x = (x1,, xn) = (xA, xB), A 和 B 的收益函数分别为 uA(x) = iA ui(x)和 uB(x) = iB ui(x)合作博弈合作博弈33 ( (二二) ) 特征函数特征函数l通过联盟 A,G 转化为二人非合作博弈 GA = (XA, uA ; XB, uB),由此可引出G 的特征函数特征函数V:lV(A)是 uA 在鞍点处的值,等于零和博弈(XA, uA ; XB, uA)的局中人 A在古诺均衡中的收益(冯·诺伊曼据此提出了特征函数)l特征函数特征函数V(A)具有以下基本性质具有以下基本性质:①对于空联盟 来说,V( ) = 0 (这是因为 u = 0)。

      ②若A, BP(I ) 且 AB = ,则V(AB )  V(A) + V(B) •若G为零和,则V(I ) = 0 且(AP (I ))(V(I – A) = V(A)) l可加性可加性:如果 V(AB ) = V(A)+V(B) 对一切不相交的联盟 A 和B成立,则称特征函数V 是可加的(即具有可加性可加性)①当V可加时,V(A) = iAV({i})对一切联盟 A 成立这表明结盟与不结盟无差别,从而合作没有意义这种特征函数可加的博弈,称为非本质博弈非本质博弈人们感兴趣的是本质博弈 合作博弈合作博弈34 ( (三三) ) 收入分配收入分配特征函数表示联盟总收入这笔收入在联盟内部又如何分配?为了研究收入分配问题,首先给出收入分配的定义n定义 博弈 G = (Xi, ui)n 的收入分配收入分配(简称分配分配)是一个 n 维向量(r1, r2,, rn) 使得 V(I ) = iI ri 且 ri  vi=V({i}) (i =1,2,,n)ØV(I ) = iI ri :全体局中人组成联盟,每人从中得到收入Øvi =V({i}):局中人不与他人结盟而单干的收入;Øri  vi:局中人加盟的收入不低于单干的收入,联盟的吸引力就在于参加联盟能够得到更多的收入。

      Øv = (v1, v2,, vn):单干收入向量单干收入向量V(I )  iI vi (特征函数性质)l收入分配具有下述一些性质收入分配具有下述一些性质:j(r1, r2,, rn) 是分配  存在 (a1, a2,, an)  0 使得 ri = vi + ai (i = 1,2,,n) 且iI ai = V(I )  iI vin 人非本质博弈的分配只有单干收入向量v = (v1, v2,, vn) l本质博弈的分配有无限多个合作博弈合作博弈35 ( (四四) ) 核心最优解核心最优解l AP(I) 是收入分配 t = (t1, t2,, tn) 的反对者联盟反对者联盟,是指存在另一种分配 r = (r1, r2,, rn) 使得 (V(A)  iA ri) & (iA)(ri > ti)l核心最优解核心最优解:是指不存在反对者联盟的收入分配只有这种收入分配,才能被所有局中人接受lG 的核心核心(core) C(G):是指由所有核心最优解组成的集合 l占优分配占优分配:对于收入分配 r 和 t, r A t (在联盟在联盟 A 中中 r 比比 t 占优占优)是指V(A ) iA ri 且 ri > ti 对一切 iA 成立;rt ( r 比比 t 占优占优)是指存在联盟 A 使得r A t。

      Ø占优关系 A 具有传递性,但占优关系 不具有传递性Ø若 r A t 且 A ,则 A  I 且 A 不是单人联盟Ø对任何收入分配 r= (r1, r2,, rn),rC(G) 当且仅当当且仅当 iA ri  V(A)对一切非空联盟 A 成立Ø当 G 为零和本质博弈时,C(G) = 合作博弈合作博弈36 序贯博弈序贯博弈Ø迄今为止,我们讨论的博弈都具有简单的动态结构,即它们是一次性博弈,或者是一次性博弈的重复序列,而且还具有简单的信息结构,即每个局中人都知道其他局中人的收益情况及可以采用的各种策略换句话说,各个局中人都是同时各个局中人都是同时移动的移动的Ø然而实际中,许多利益较量博弈并不具备这种结构,局中人的决策和行动具有先后次序,即每个局中人都是在看到其他对手的行动后才开始行动的Ø这种局中人在行动上具有先后次序的博弈局中人在行动上具有先后次序的博弈,就是所谓的序贯序贯博弈博弈(sequential game)对序贯博弈进行研究,将会产生一些新的概念和方法37 ( (一一) ) 博弈的扩展形式:博弈树博弈的扩展形式:博弈树省略号省略号序贯博弈序贯博弈38 ( (二二) ) 子博弈与逆向子博弈与逆向归纳归纳求解法求解法 541769653496253981369458甲乙丙序贯均衡序贯均衡 乙丙丙丙序贯博弈序贯博弈39 l完全均衡是序贯博弈的这样一种结局:局中人在所有到达的子博弈中都处于纳什均衡状态。

      l完全均衡完全均衡 = 序贯序贯均衡均衡 + 纳什均衡纳什均衡( (三三) ) 信息集与完全均衡信息集与完全均衡 非纳什均衡之解非纳什均衡之解甲乙乙正正正反反反101015812685纳什纳什均衡均衡序贯序贯均衡均衡乙的信息集序贯博弈序贯博弈40 l子博弈完全均衡子博弈完全均衡(subgame perfect equilibrium)是指这样的序贯均衡,其在任何子博弈中都处于纳什均衡状态 (四四) ) 子博弈完全均衡子博弈完全均衡甲乙乙正左左反右右13230021完全均衡子博弈均衡子博弈完全均衡序贯博弈序贯博弈41 第第13次作业次作业( (共3道题) ) 1.如果把落下的食物量减半或加倍,那么智猪博弈的结局又会如何?2.门卫和小偷的故事:①门卫偷懒,小偷偷盗,小偷得到收益V,门卫受到处罚而得收益D(负收益)②门卫提高警惕,小偷偷盗,小偷被逮住受到处罚而得收益P(负收益),门卫收益为零③门卫偷懒,小偷没有偷盗,小偷收益为零,而门卫得到了放松和休息的收益R④门卫提高警惕,小偷没有偷盗,双方收益都为零 该博弈是否存在纳什均衡?如果存在,求出纳什均衡;如果不存在,求出混合纳什均衡。

      第3题见下一页)( (12月月20日前,通过日前,通过e-mail交给助教交给助教闫勇闫勇) )42 第第13次作业次作业( (共3道题) ) 3.某行业被企业A和B垄断,这两家企业都在努力制造产品差别以增强各自的竞争力已知企业A和B的产品需求函数分别为: 和 ,其中Q1和P1分别表示A的产品的需求量和价格,Q2和P2分别表示B的产品的需求量和价格A和B的固定成本都为20,边际成本都为0,并且他们都能各自独立制定自己产品的价格①求纳什均衡中,企业A和B各自的价格和利润②如果A和B勾结串通,勾结利润对半分,那么他们的价格和利润为多少?③从短期来看,A和B会勾结串通吗?从长期来看,情况又会如何? ( (12月月20日前,通过日前,通过e-mail交给助教交给助教闫勇闫勇) )43 。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.