
1 完全信息静态博弈.ppt
107页博弈论与信息经济学 (Game Theory and Information Economics),第2章:完全信息静态博弈 Chapter 2: Static Game of Complete Information,完全信息静态博弈,静态博弈(同时行动博弈),所有参与人同时选择行动,而且只选择一次,“同时”是一个信息概念,而不一定与日历上的时间一致,如,罚点球时,守门员和对方射手必须同时决策,在博弈中,如果参与者在不知道对手如何选择的情况下行动,该博弈就是静态的完全信息静态博弈,信息,决策需要信息,但是几乎所有需要决策的场合,我们都只掌握着有限信息,这使得现实中往往是有限信息博弈完全信息:每个参与人对其他参与人的支付函数有完全的了解不完全信息:每个参与人对其他参与人的支付函数不完全的了解在位者低成本,市场进入博弈,若进入者知道在位者是高成本还是低成本——完全信息,若进入者不知道在位者是高成本还是低成本——不完全信息,进入者决定是否进入一个新的产业,在 位者选择斗争或默许,但不知道在位企 业的成本函数是高还是低,也不知道各 种战略组合下的利润水平在位者高成本,1 完全信息静态博弈,囚徒困境与占优均衡 智猪博弈与重复剔除的占优均衡 纳什均衡 多重均衡与协调 纳什均衡应用举例 混合战略纳什均衡 纳什均衡的存在性,1 囚徒困境与占优战略均衡,两个小偷行窃未果被抓,隔离审讯。
“坦白从宽,抗拒从严”:如果两人都 坦白则各判8年;如果一人坦白另一人 不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年 坦白否?,囚徒困境(Prisoners’ Dilemma)(塔克,1950),1 囚徒困境与占优战略均衡,囚徒 A,坦白,抵赖,坦白,抵赖,囚徒 B,基于收益矩阵的模型描述:,连续策略,1 囚徒困境与占优战略均衡,离散型策略,另一些博弈中,在其他博弈中,每个参与者的纯策略可以是 来自一个连续范围的一个数如厂商定价,博弈中参与人只拥有有限个离散型的纯战略供其选择 如篮球比赛中的运球、过人和投篮,离散型策略静态博弈通常用支付表来表示 ——博弈的战略式表述,1 囚徒困境与占优战略均衡,占优战略/优势策略/上策(dominant strategy),无论其他局中人如何行动,总是(严格地)优于其他战略的战略,称为(严格)占优战略而被(严格地)占优的战略称为(严格)劣战略从一方的角度看,选择“坦白”比选择“抵赖”好,无论他关 于对方的选择持有何等信念 我们就说,对于囚徒而言,“坦白”的策略是一个占优策略, 或者说“抵赖”的策略是一个劣策略以不变应万变,1 囚徒困境与占优战略均衡,参与人是理性的 囚徒A应选择坦白,同样的逻辑适用于囚徒B的选择—— 他也应选择坦白。
因而,(坦白,坦白)就是该博弈可预测的结果,也是 一个均衡(甚至是唯一的)占优均衡,若所有参与人都有自己的占优战略,则由占优战略组成的战略组合为占优均衡占优均衡并不常见,因为很多时候不存在占优战略,1 囚徒困境与占优战略均衡,博弈双方都遵循常规智慧选择占优策略,但是这种均衡结果所产生的支付比两人合作、都选择自己的劣战略时要低两个囚徒双双选择坦白是博弈的最坏结果,“困境”,囚徒困境反映了个人理性与集体理性的冲突,反之,彼此达成合作是最好的“利己策略”,但合作必须符合黄金定律:“己所不欲,勿施于人”(前提是“人所不欲,勿施于我”)囚犯两人都从利己目的出发,最终导致结果损人不利己, 合作没有产生囚徒困境“是典型的非合作博弈的范例,1 囚徒困境与占优战略均衡,现实生活中诸多的问题和现象,都是囚徒困境问 题的翻版 实际上,“囚徒困境”是现实生活中许多现象的一个 抽象概括,有着广泛而深刻的意义当我们面临需要加以解析的经济现象时,首先要做的事就是看该现象的发生机制是否可归于某种已知的博弈模型如可以,就可立即知道现象的本质和发生机制,并预测结果如不能,则很可能为博弈论经济学做出创造性贡献NE: (不提供,不提供),1 囚徒困境与占优战略均衡,公共品的理解?,集体行动的障碍:个人最优选择从社会整体的角度看并不是最优的。
社会最优结果是(提供,提供)——“大家的事情反而无人管”(英国历史学家麦考莱),公共品(public goods)的供给,1 囚徒困境与占优战略均衡,不降价,降价,不降价,降价,B,A,价格战,,市场中常见现象,如旅游、机票、家电 中国的几个生产彩电的寡头厂商于2000年合谋成立“彩电厂家自律联盟”以求将彩电价格维持高位 彩电价格能维持高位吗?,双方合作制定较高的价格,那么都可获得较高利润但是这些联盟处于利益驱动的“囚徒困境”中,双赢成为泡影企业之间五花八门的价格联盟总是非常短命,道理也就在于此,1 囚徒困境与占优战略均衡,假设团队中10名员工,每人选择“努力”都要承担成本1元,同时为团队的预期产出增加2元;每人偷懒则无须付出成本,也不会增加团队预期产出 如果其他人努力,自己偷懒可以获得好处;若别人偷懒,则自己更应该偷懒,因为自己努力付出成本1元,但为团队增加的2元产出中自己得到1/10元团队生产中的偷懒,所以,无论其他人是否努力地工作,我自己的最优选择都是偷懒——偷懒是每个人的占优战略,1 囚徒困境与占优战略均衡,“减负”之后,家长们恐怕孩子学业荒废,纷纷请家 教给定其他孩子“减负”好耍,我家孩子在家苦读,将来考 上个北大清华什么的,那些“减负”好耍的孩子只能垫底了! 给定其他孩子也在家苦读,我家孩子则更需要加倍苦学 了,否则不就会在将来的高考中为别人垫底了吗! 于是,当每个家长都如此盘算时,孩子们却倒了霉。
小学生减负,政府“减负”政策:减少小学生的某些课时内容和家庭 作业但“减负”后学生反而更累了!,1 囚徒困境与占优战略均衡,曾经威胁世界整个甚至人类的军备竞赛 公共资源过度开采/公共品供给短缺 大学扩招、研究生扩招、大学贷款基建 年年都有的评优评先活动 各种资格考试广泛盛行 备受批评却日益严重的应试教育,现实生活中其他囚徒困境的例子,1 囚徒困境与占优战略均衡,如何走出囚徒困境?,可信的(由第三方实施的)报复和惩罚,历史上的 “人质”或“通婚”方案,以克服信任问题,若两囚徒是意大利黑手党成员,结果会如何?,人质方案的例子:秦始皇的父亲子楚,1 囚徒困境与占优战略均衡,长期关系,即博弈必须重复“多次”,人们可能为了长远的将来利益而牺牲眼前利益,从而达成合作相互忠诚的文化或者规范:“江湖义气”/部队的“同生共死” 组织中团队生产面临的囚徒困境问题的轻重程度不同——不同的企业文化 组织克服囚徒困境的途径之一是企业文化,电视剧《亮剑》,委托-代理关系中被设计的囚徒困境,,1 囚徒困境与占优战略均衡,囚徒困境对于人们来说是糟糕的,是应当竭力避免的?,在一些委托-代理关系中,故意创造出代理人之间的囚徒困境有时对委托人有好处。
这样的囚徒困境反而促进效率委托-代理关系:通常指委托人请代理人代理某件事情其中 的关键问题是二者利益不一致,并且委托人与代理人之间存 在信息不对称为此,需要设计一种制度(system)或机制 (mechanism) ,使代理人追求自己利益的同时也最大化委托 人的利益,如何设计这样的制度就是信息经济学研究的问题经理与审计师之间可能合谋,隐瞒不良信息 股东解决这一问题的一种做法是双头审计,请两位审计师进行审计,扣发给隐瞒者的部分报酬,而给坚持如实报告问题的审计师以更多的报酬审计师 A,隐瞒,实报,隐瞒,实报,审计师 B,如果都谎报,得奖金0,但分享贿金1万,如果都诚实,则得到0,如一个诚实一个谎报,则诚实者奖励0.6万,对谎报者罚款1.1万,但谎报者得到1万贿金,1 囚徒困境与占优战略均衡,预防审计合谋—双头审计,1 囚徒困境与占优战略均衡,假设:两供应商成本都为6元/件,报价都为10元/件 策略:如果二者报价都为10元/件或8.5元/件,则从每家订购50件;若一家报价10元/件而另一家报价8.5元/件,则从价低者订购100件供应商 A,8.5,10,8.5,10,供应商 B,利用囚徒困境压低供应商价格,2 智猪博弈与重复剔除劣战略均衡,一头大猪和一只小猪生活在同一猪圈里,共用一食槽。
食槽的一端有一个开关,猪用嘴一拱,食槽的另一端会掉下包子假定按一下会掉下8个包子,而跑去按开关的猪会耗费2个包子的能量智猪博弈(Boxed Pigs),如果小猪按开关,大猪先吃,等小猪按完跑过来时,大猪 吃掉7个包子,小猪只能吃到1个; 若大猪按,按完后跑过来,大、小猪各吃掉4个包子; 若同时按,则大猪吃5个,小猪吃3个 如果都不去按开关,就会一起饿死2 智猪博弈与重复剔除劣战略均衡,按,等,小猪,“按”是小猪的劣战略,理性的小猪是不会选择按 大猪知道小猪是理性的,意即知道小猪不会选择“按”,小猪有占优战略——“等” 但大猪无占优战略——因为大猪战略将随小猪战略改变而改变按,小猪,2 智猪博弈与重复剔除劣战略均衡,,,排除劣策略减少了博弈的规模,得到的“新”博弈有可能又有了其他的(对自己或对手的)劣势策略,又可以被排除按为小猪劣战略,等为大猪劣战略,2 智猪博弈与重复剔除劣战略均衡,重复剔除严格劣战略,严格劣战略:不管其他参与人如何选择,参与人从选择战略A得到的支付,严格小于选择策略B给得到的支付 称策略A是相对于B的“严格劣战略”,或者称策略A严格劣于策略B 称策略B是相对于策略A的“严格占优战略”,或者称策略B严格占优于策略A,在求解均衡过程中,可以剔除局中人的严格劣战略以简化博弈,因为严格劣战略肯定不会被实施。
2 智猪博弈与重复剔除劣战略均衡,“重复剔除严格劣战略”的思路,首先找出博弈参与人的劣战略(dominated strategy)(假定存在的话),把这个劣战略剔除后,剩下的是一个不包含已剔除劣战略的新的博弈;然后再剔除这个新的博弈中的劣战略;继续这个过程,直到没有劣战略存在如果剩下唯一的策略组合,那么该策略组合称为“重复剔除的占优均衡”,L,R,M,U,D,B,,A知道B是理性的,A,B知道A是理性的,且B知道A知道B是理性的,2 智猪博弈与重复剔除劣战略均衡,,,,剩下唯一的策略组合(U,M)——重复剔除的占优均衡,例,2 智猪博弈与重复剔除劣战略均衡,1,U,D,L,M,2,对于某些参与者而言,无论其他参与者选择什么,如果A策略至少和B策略一样好,而且至少在某些时候严格更好,就称策略A为相对于策略B的弱占优策略,或称弱占优于策略B,反之称策略B为相对于策略B的弱劣策略,或称弱劣于策略B,对1而言,U不是D的严格劣战略 对2而言,L不是M的严格劣战略,警告:逐次剔除弱劣势策略可能去掉了某些纳什均衡例,,2 智猪博弈与重复剔除劣战略均衡,占优战略均衡与重复剔除的占优均衡中的区别:,占优均衡中,占优策略严格优于其他所有策略,选择法,在用重复剔除方法寻找均衡时,一个战略是占优战略或劣战略只是相对于另一个特定的战略而言,而非相对于战略空间中的其他所有战略,排除法,占优均衡仅要求每个参与人是理性的,重复剔除则要求理性是“共同知识”,对理性要求更高,,参与人2,参与人1,练习:用重复剔除严格劣战略求以下博弈的均衡,2 智猪博弈与重复剔除劣战略均衡,智猪博弈背后的哲理,反映生活中的搭便车现象,小猪角度:自己不能努力,即使努力劳动成果也会被大猪侵占,所以最优选择是等待,坐享大猪的劳动成果,这称为搭便车(free-riding)。
大猪角度:主观上为了自己的利益,但客观上为小猪带来了好处,但“多劳不一定多得”,“看不见的手”的童话版,若全部博弈主体都试图免费搭车,那么可能陷入囚徒困境,“一个和尚挑水喝,两个和尚抬水喝,三个和尚没水喝”,2 智猪博弈与重复剔除劣战略均衡,公司治理——股份公司中,大股东较小股东更有监督管理层的动力因为大股东可以平衡其监督的成本收益,而小股东却不能因此大股东承担监督。












