
博弈论最全完整-讲解ppt课件.ppt
308页在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确博弈论与信息经济学博弈论与信息经济学Game Theory and Economics of Information在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确博弈论基本思想博弈论基本思想人们在日常生活中进行着博弈,与配偶,朋友,陌生人,老板/ /员工,教授等类似的博弈也在商业活动、政治和外交事务、战争中进行着————在任何一种情况下,人们相互影响以达成彼此有利的协议或者解决争端博弈论为众多学科提供了分析的概念和方法:经济学和商学,政治科学,生物学, 心理学和哲学在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确如何在“博弈”中获胜?日常生活中的博弈(““游戏””)往往指的是诸如赌博和运动这样的东西: 赌抛硬币 百米赛跑 打网球/ /橄榄球How can you win such games?许多博弈都包含着运气、技术和策略。
策略是为了获胜所需要的一种智力的技巧它是对于如何最好地利用身体(物质)的技巧的一种算计在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确什么是策略博弈?What is a Game of Strategy?• 策略思考本质上涉及到与他人的相互影响其他人在同一时间、对同一情形也在进行类似的思考• 博弈论就是用来分析这样交互式的决策的• 理性的行为指的是:明白自己的目的和偏好,同时了解自己行动的限制和约束,然后以精心策划的方式选择自己的行为,按照自己的标准做到最好•博弈论对理性的行为又从新的角度赋予其新的含义——与其他同样具有理性的决策者进行相互作用•博弈论是关于相互作用情况下的理性行为的科学在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确如何在博弈中获胜?…… …… 真的能在博弈中(总是)获胜吗?对手和你一样聪明! 许多博弈相当复杂,博弈论并不能提供万无一失的应对办法在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确例1:无谓竞争(The GPA Rat Race))你所注册的一门课程按照比例来给分:无论卷面分数是多少,只有4040%的人能够得优秀,4040%的人能得良好。
所有学生达成一个协议,大家都不要太用功,如何?想法不错,但无法实施! !稍加努力即可胜过他人,诱惑大矣问题是,大家都这么做这样一来,所有人的成绩都不比大家遵守协议来得高而且,大家还付出了更多的功夫正因为这样的博弈对所有参与者存在着或大或小的潜在成本,如何达成和维护互利的合作就成为一个值得探究的重要问题存在双赢的博弈吗?在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确例2 2:焦点博弈 “We Can’t Take the Exam,Because We Had a Flat Tire”两个学生想要推迟考试,谎称由于返校途中轮胎漏气,未能很好地备考教授分别对他们提出了问题:““哪个轮胎漏气?”?”如何应答?他们本应该预计到教授的招数,提前准备好答案在博弈中,参与者应该向前看到未来的行动,然后通过向后推理,推算出目前的最佳行动如果双方都没有准备,他能够独立地编出一个相互一致的谎言吗?在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确例2 2:焦点博弈 “We Can’t Take the Exam,Because We Had a Flat Tire”““乘客侧前轮””看起来是一个合乎逻辑的选择。
但真正起作用的是你的朋友是否使用同样的逻辑,或者认为这一选择同样显然并且是否你认为这一选择是否对他同样显然;反之,是否她认为这一选择对你同样显然……以此类推也就是说,需要的是对这样的情况下该选什么的预期的收敛这一使得参与者能够成功合作的共同预期的策略被称为焦点心有灵犀一点通在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确例2 2:焦点博弈 “We Can’t Take the Exam,Because We Had a Flat Tire”我们无法从所有这样的博弈的结构中找到一般和本质的东西,来保证这样的收敛某些博弈中,由于偶然的外因可以对策略贴标签,或者参与者之间拥有某些共同的知识体验,导致了焦点的存在没有某个这样的暗示,默契的合作就完全不可能在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确例3:为什么教授如此苛刻?许多教授强硬地规定,不进行补考,不允许迟交作业或论文教授们为何如此苛刻?如果允许某种迟交,而且教授又不能辨别真伪,那么学生就总是会迟交。
期限本身就毫无意义了避免这一“滑梯”通常只有一种办法,就是“没有例外”的策略在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确例3:为什么教授如此苛刻?问题是,一个好心肠的教授如何维持如此铁石心肠的承诺?他必须找到某种使拒绝变得强硬和可信的方法拿行政程序或者学校政策来做挡箭牌在课程开始时做出明确和严格的宣布通过几次严打来获得“冷面杀手”的声誉在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确导论博弈均衡与一般均衡博弈论与诺贝尔经济学奖获得者博弈论的基本概念与类型主要参考文献12实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确导论一、博弈均衡与一般均衡13实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 案例:囚犯困境案例:囚犯困境抵赖坦白抵赖-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确与传统微观经济学的比较与传统微观经济学的比较一致性利益最大化原则均衡原则不一致人与人之间的关系-个人理性导致集体非理性-设计协调性机制-满足个人理性前提下达到集体理性信息不完全-委托-代理理论、信号传递与信息筛选模型在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确导论二、博弈论与诺贝尔经济学奖获得者16实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确1994年诺贝尔经济学奖获得者美国人约翰-海萨尼(John C. Harsanyi) 和美国人约翰-纳什(John F. Nash Jr.)以及德国人莱因哈德-泽尔腾(Reinhard Selten) 获奖理由:在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响 。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确约翰约翰··纳什纳什19281928年生于美国年生于美国约翰约翰··海海萨尼尼19201920年年生于美生于美国国莱因哈莱因哈德德··泽泽尔腾,尔腾,19301930年年生于德生于德国国在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确1996年诺贝尔经济学奖获得者英国人詹姆斯·莫里斯 (James A. Mirrlees)和美国人威廉-维克瑞(William Vickrey) 获奖理由:前者在信息经济学理论领域做出了重大贡献,尤其是不对称信息条件下的经济激励理论的论述;后者在信息经济学、激励理论、博弈论等方面都做出了重大贡献在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确詹姆斯詹姆斯··莫里斯莫里斯19361936年生于英国年生于英国威廉·维克瑞,1914-1996,生于美国在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确2001年诺贝尔经济学奖获得者三位美国学者乔治-阿克尔洛夫(George A. Akerlof)、迈克尔-斯彭斯(A. Michael Spence)和约瑟夫-斯蒂格利茨(Joseph E. Stiglitz) 获奖理由:在“对充满不对称信息市场进行分析”领域做出了重要贡献。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确约瑟夫·斯蒂格利茨,1943年生于美国的印第安纳州,1967年获美国麻省理工学院博士头衔,曾担任世界银行的首席经济学家,现任美国哥伦比亚大学经济学教授乔治·阿克尔洛夫1940年生于美国的纽黑文,1966年获美国麻省理工学院博士头衔,现为美国加利福尼亚州大学经济学教授迈克尔·斯彭斯1948年生于美国的新泽西,1972年获美国哈佛大学博士头衔,现兼任美国哈佛和斯坦福两所大学的教授在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确2005年诺贝尔经济学奖获得者以罗伯特·奥曼色列经济学家罗伯特-奥曼(Robert J. Aumann)和美国经济学家托马斯·谢林((Thomas Thomas C. SchellingC. Schelling)) 获奖原因:“通过博弈论分析加强了我们对冲突和合作的理解”所作出的贡献而获奖 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 罗伯特·奥曼 托马斯·谢林在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确导论三、博弈论的基本类型25实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确合作博弈与非合作博弈合作博弈(cooperative game) 达成有约束力的协议(binding agreement),强调团体理性,强调效率、公正、公平非合作博弈(non-cooperative game) 强调个人理性,其结果可能有效率,也可能无效率。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确纳什均衡(什均衡(NENE))子博弈完美子博弈完美纳什什均衡(均衡(SPNESPNE)贝氏氏纳什均衡什均衡((BNEBNE))完美完美贝氏氏纳什均衡什均衡((PBNEPBNE))及序及序贯均均衡(衡(SESE))完全信息 不完全信息静态动态非合作博弈的基本分类非合作博弈的基本分类在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确静态博弈与动态博弈(static games and dynamic games)同时决策或者同时行动的博弈属于静态博弈;先后或序贯决策或者行动的博弈,属于动态博弈即使决策或行动有先后,但只要局中人在决策时都还不知道对手的决策或者行动是什么,也算是静态博弈在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确完全信息博弈与不完全信息博弈(games of complete information and games of incomplete information)按照大家是否清楚对局情况下每个局中人的得益。
“各种对局情况下每个人的得益是多少” 是所有局中人的共同知识(common knowledge)据“共同知识”的掌握分为完全信息与不完全信息博弈在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确完美信息博弈与不完美信息博弈(games with perfect information and games with imperfect information)是关于动态博弈进行过程之中面临决策或者行动的参与人对于博弈进行迄今的历史是否清楚的一种刻划如果在博弈进行过程中的每一时刻,面临决策或者行动的参与人,对于博弈进行到这个时刻为止所有参与人曾经采取的决策或者行动完全清楚,则称为完美信息博弈;否则位不完美信息在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确零和博弈与非零和博弈(zero-sum game and non-zero-sum game)如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为零,这个博弈就叫零和博弈;相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为零,这个博弈就叫非零和博弈。
零和博弈是利益对抗程度最高的博弈在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确常和博弈与非常和博弈(constant-sum game and variable-sum game)如果一个博弈在所有各种对局下全体参与人之得益总和总是保持为一个常数,这个博弈就叫常和博弈;相反,如果一个博弈在所有各种对局下全体参与人之得益总和不总是保持为一个常数,这个博弈就叫非常和博弈常和博弈也是利益对抗程度最高的博弈非常和(变和)博弈蕴含双赢或多赢在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确导论四、主要参考文献33实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确张维迎迎著著,,《《博博弈弈论与与信信息息经济学学》》,,上上海海三三联书店店、、上海人民出版社,上海人民出版社,19961996年版Roger B. Myerson著:Game Theory(原文版、译文版),中国经济出版社,2001年版。
王则柯、李杰编著,《博弈论教程》,中国人民大学出版社,2004年版艾里克.拉斯缪森(Eric Rasmusen)著,《博弈与信息:博弈论概论》,北京大学出版社,2003年版因内思·马可-斯达德勒,J.大卫·佩雷斯-卡斯特里罗著,《信息经济学引论:激励与合约》,上海财经大学出版社,2004年版施锡铨编著,《博弈论》上海财大出版社,2000年版谢识予予编著著,,《《经济博博弈弈论》》,,复复旦旦大大学学出出版版社社,,20022002年版谢识予予主主编,,《《经济博博弈弈论习题指指南南》》,,复复旦旦大大学学出出版社,版社,20032003年版在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确课程主要内容第一章 完全信息静态博弈第二章 完全信息动态博弈第三章 不完全信息静态博弈第四章 不完全信息动态博弈第五章 委托-代理理论第六章 逆向选择与信号传递在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第一章 完全信息静态博弈博弈论的基本概念及战略式表述纳什均衡纳什均衡应用举例混合战略纳什均衡纳什均衡的存在性与多重性36实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第一节 博弈论的基本概念与战略式表述37实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确博弈论的基本概念与战略式表述博弈论(game theory)是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。
博弈的战略式表述:G={N,(Si)iN,(Ui)iN}有三个基本要素:(1)参与人(players)iN={1,2,…,n} ;(2)战略(strategies),siSi(战略空间);(3)支付(payoffs),ui=ui(s-i,si)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 案例案例1 1:囚犯困境:囚犯困境抵赖坦白抵赖-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确均衡与均衡结果均衡战略(坦白,坦白)均衡支付(-6,-6)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第二节 纳什均衡占优战略均衡重复剔除的占优战略均衡纳什均衡41实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确完全信息静态博弈的几点特性完全信息静态博弈的几点特性 同时出招,出招一次; 知道博弈结构与游戏规则(共同知识); 不管是否沟通过,无法做出有约束力的 承诺(非合作) 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、占优战略均衡占优战略:不管对手战略为何,该参与人可找到一最佳战略。
定义:在博弈G={N,(Si)iN,(Ui)iN}中,如果对所有的参与人i,si*是它的占优战略,那么所有参与人选择的战略组合(s1*,…,sn*)成为该对策的占优战略均衡在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 案例案例1 1:囚犯困境:囚犯困境抵赖坦白抵赖-1,-1-9,0坦白0,-9-6,-6支付嫌疑人B嫌疑人A在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确“囚犯困境” 的扩展两个寡头企业选择产量公共产品的供给军备竞赛经济改革 结论:一种制度安排,要发生效力必须是一种纳什均衡;否则,制度安排便不能成立在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确价格大战低价高价低价3,36,1高价1,65,5支付百事可乐可口可乐在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确案例2:智猪博弈 猪圈里圈两头猪,一头大猪,一头小猪。
猪圈的一头有一个猪食槽,另一头安装一个按钮,控制着猪食的供应按一下按钮会有10个单位的猪食进槽,但谁按按钮谁就要付出2个单位的成本若大猪先到,大猪吃到9个单位,小猪只能吃1个单位;若同时到,大猪吃7个单位,小猪吃3个单位;若小猪先到,大猪吃6个单位,小猪吃4个单位支付如表在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 案例案例2 2:智猪博弈:智猪博弈按等待按5,14,4等待9,-10,0支付小猪大猪在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确智猪博弈的扩展股份公司承担监督经理职能的大股东与小股东股票市场上炒股票的大户与小户市场中大企业与小企业在研发、广告上的博弈公共产品的提供(富户与穷户)改革中不同利益分配对改革的推动在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、重复剔除的占优战略均衡绝对劣势战略:si是一绝对劣势战略当且仅当存在另一战略si’Si使得ui(si,s-i)< ui(si’,s-i) 对所有s-iS-i均成立。
si’ 未必是优势战略)重复剔除的占优战略均衡:逐次删去绝对劣势战略得到唯一的占优战略在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 例:重复剔除的占优战略均衡例:重复剔除的占优战略均衡2,30,23,41,12,74,5 参与人2 L M R参与人1UD在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确例 重复剔除的占优战略均衡4,,35,16,22,18,43,63,09,62,8 参与人2L M R参与人1UDM在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确例 重复剔除的占优战略均衡1,,01,33,00,20,13,00,22,45,3 参与人2L M R参与人1UDM在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、纳什均衡什均衡定义:指一战略组合有以下特性:当参与人持此战略后,任一参与人均无诱因偏离这一均衡;s*=(s1*,…,sn*)=(si*,s-i*)是一纳什均衡,当且仅当对所有参与人而言,ui (si*,s-i*) ui (si’,s-i*)对所有si’Si 均成立。
简单而言,当s1*是对s2*的最适反应,s2*也是s1*的最适反应时,(s1*,s2*)就是二人博弈的纳什均衡命题1:纳什均衡在占优战略重复剔除解法中不会被剔除命题2:重复剔除的严格占优战略均衡一定是纳什均衡在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确例 纳什均衡求解0,44,05,34,00,45,33,53,56,6 参与人2L M R参与人1UDM在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确作业7,76,67,65,75,88,56,65,84,8 乙 左 中 右上中下甲一个两人同时博弈的支付竞争如下所示,试求纳什均衡是否存在重复剔除占优战略均衡?在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第三节 纳什均衡应用举例古诺(Cournot)寡头模型沙滩卖冰豪泰林(Hotelling)价格竞争模型公共地的悲剧57实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、古诺寡头模型特点:存在两家厂商;同时行动确定产量。
通过预测另一家厂商的产量来选择自己的利润最大化产量,寻求预测均衡厂商1表示为:max p(y1+y2e)y1-c(y1),得出y1=f1(y2e),同理得出y2=f2(y1e),称为反应函数,两条曲线的交点为古诺模型的解在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确古诺寡头模型的纳什均衡反应函数 y1=f1(y2) y2=f2(y1)(y1*,y2*)是该对策的纳什均衡解y1* y12y11 y10y2*y22y21y1oy2f1(y2)f2(y1)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确例题:古诺模型的解假设p=a-(y1+y2),C1=y1c,C2=y2c则根据利润最大化的一阶条件分别得到反应函数y1=f1(y2)=(a-y2-c)/2,y2=f2(y1)=(a-y1-c)/2,求出均衡产量为(1/3(a-c),1/3(a-c)),为纳什均衡,均衡利润为(1/9(a-c)2,1/9(a-c)2)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确古诺模型的解:与垄断市场的比较古诺模型的解:与垄断市场的比较假设为一垄断企业,则有: Max =y(a-y-c), 得到垄断企业的最优产量 y=1/2(a-c) y1+y2=2/3(a-c) 垄断利润为=1/4(a-c)2 2/9(a-c)2寡头竞争的总产量大于垄断产量的原因在于每个企业在选择自己的最优产量时,只考虑对本企业利润的影响,而忽视对另一个企业的外部负效应。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确寡头厂商与垄断厂商的比较 1/3(a-c) 1/2(a-c)1/2(a-c)y1oy2f1(y2)f2(y1)1/3(a-c)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确0 ¼ ½ ¾ 1二、沙滩卖冰假设游客沿沙滩{0,1}间均匀分布,现有两位卖冰者,他们会将摊位选在哪个位置?假设游客就近购买生活中还有哪些类似的例子?在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、豪泰林模型寡头企业竞争战略是价格伯川德(Bertrand)模型:产品同质,均衡价格等于边际成本,类似于完全竞争市场均衡豪泰林(Hotelling)模型:存在产品差异,均衡价格不等于边际成本,垄断性提高在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确假定长度为1的线性城市,消费者均匀分布在[0,1]区间内,分布密度为1;两个商店1、2分别位于x=0,x=1,即城市的两端;消费者购买商品的旅行成本与商店的距离成反比,单位距离的成本为t;住在x的消费者在两个商店之间是无差异的,需求D1=x,D2=1-x,x满足:p1+tx=p2+t(1-x),解得x=(p2-p1+t)/2t。
0 0 x 1x 1商店商店1 1 商店商店2 2豪泰林模型:以空间上差异为例在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确豪泰林模型:以空间上差异为例根据两个商店的利润函数,1=(p1-c)x, 2=(p2-c)(1-x)选择使利润最大化的价格,得到一阶条件,求得p1*=p2*=c+t,均衡利润1=2=t/2旅行成本越高,产品差异越大,均衡价格从而均衡利润也越高原因:随着旅行成本上升,不同商店出售的产品之间的替代性下降,每个商店对附近的消费者的垄断能力加强,当旅行成本为零时,不同商店的产品之间具有完全的替代性,则为伯川德均衡结果。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确四、公共地的悲剧生物学家和生态学家哈丁(Garrett Harden)在《科学》(1968年,第162卷)发表《公地的悲剧》考虑一块对所有的人都开放的牧场,在着的制度下,可以预期,每一个放牧的人都会在公地上放牧尽可能多的牲口增加一头牲口既有正效用,也有负效用正效用是牲口的销售收入,增加一头为+1负效用使每增加一头带来的过度放牧的损失,每一个放牧着承担-1/n放牧者合理的决策是增加牲口,直至马瘦毛长,公地毁灭在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确四、公共地的悲剧资源没有排他性产权:草地放牧、公海捕鱼、小煤窑的过度开发;另一类是人们向其中排放废物的公地草地放牧:n个农民,每个拥有羊的数量为gi,G=gi,v(G)代表每只羊的价值,与草地上放牧的总数G相关,饲养量增加到一定程度,随着数量继续增加,羊的价值会下降,即v’(G)<0农民的利润函数i=giv(gj)-gic最优化的一阶条件:i/gi=v(G)+giv’(G)-c=0增加一只羊有正效应(羊的价值)、负效应(新增羊使之前所有羊的价值下降)个人边际成本小于社会边际成本,个人最优决定的饲养总量大于社会最优决定的饲养总量在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确五、斗鸡博弈 0,00,2退2,0-3,-3进退进12支付在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确“斗鸡博弈”的扩展夫妻间吵架警察与游行队伍公共产品的供给(两富户修路)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第四节 混合战略纳什均衡71实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确混合战略(mixed strategies)定义:*=(1*,…,n*)=(i*,-i *)是一纳什混合战略均衡,当且仅当对所有参与人而言, i*是-i*的最适反应,ui(i*,-i *) ui(I’,-i *),对所有i’i成立)。
持混合战略的前提是在均衡时两种战略的报酬会相等,是预期支付最大化的推导结果在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确掷硬币-1,11,-1反面1,-1-1,1正面反面正面12支付 p 1-pq1-q参与人参与人1:1:max Eu=q(p(-1)+(1-p)1)+(1-q)(p1+(1-p)(-1)) =-pq+q-pq+p-pq-1+q+p-pq =-4pq+2q+2p-1一一阶条件条件为零求得:零求得:p=1/2在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确掷硬币的分析给定参与人1(q,1-q),参与人2的支付是:q+(-1)(1-q)(正面)=(-1)q+(1-q)(反面); 给定参与人2(p,1-p),参与人1的支付为: p(-1)+(1-p)(正面)=p+(-1)(1-p)(反面);求得((1/21/2,,1/21/2)是)是纳什混合什混合战略均衡略均衡 如果两种战略报酬不相等,那么就变为 纯战略(pure strategies) 了。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确混合战略均衡的博弈原则两博弈方不能让对方知道或猜到自己的选择,因而必须在决策时利用随机性;两博弈方选择每种策略的概率一定要恰好使对方无机可乘,即让对方无法通过针对性地倾向某一策略而在博弈中占上风例:在掷硬币的博弈中,参与人1选正面、反面的概率q,1-q,一定要使参与人2选正面的和反面的期望得益相等在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确单纯战略与混合战略的定义G={N,S,U}是一个战略式有限博弈,参与人i的战略空间S中的任一元素si称为i的一个单纯战略(pure strategy);定义在Si上的一个概率分布函数pi(si)代表了一个混合战略(mixed strategy)——这个战略的内容是:参与人i以概率pi(sij)选择单纯战略sij,而pi(sij)=1单纯战略是混合战略的特例,因为任一单纯战略si都可以理解为i以概率1选择si,以0概率选取其他所有单纯战略引入混合战略,参与人的目标需要修改为“最大化自己的期望支付”在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确SeltonSelton::小小偷和守和守卫的博弈的博弈 一小偷欲偷窃有一守卫看守的仓库,如果小偷偷窃时守卫在睡觉,则小偷就能得手,偷得价值为V的赃物;如果小偷偷窃时守卫没有睡觉,则小偷就会被抓住。
设小偷被抓后要坐牢,负效用为-P,守卫睡觉而未遭偷窃有S的正效用,因睡觉被窃要被解雇,其负效用为-D而如果小偷不偷,则他既无得也无失,守卫不睡意味着出一份力挣一分钱,他也没有得失在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确睡不睡偷V,-D-P,0不偷0,S0,0小偷小偷守卫守卫支付支付小偷与守卫的博弈小偷与守卫的博弈在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确守守卫得益(睡)得益(睡)S01pt((小小偷偷的概率)的概率)pt*pt*/-D-D/小偷的混合策略小偷的混合策略S S到到-D连线的的纵坐坐标是在横坐是在横坐标对应的小的小偷“偷”窃概窃概率下的守率下的守卫选择“睡睡”的期望得益,的期望得益,即即S(1-pt)+(-D)pt加重对守卫的处罚在短期加重对守卫的处罚在短期中的效果是使守卫真正尽中的效果是使守卫真正尽职,但在长期中恰恰是会职,但在长期中恰恰是会降低盗窃发生的概率(激降低盗窃发生的概率(激励的悖论)励的悖论)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确小小偷得益(得益(偷))V01Pg((守守卫睡的概率)睡的概率)Pg*Pg*/-P-P/守卫的混合策略守卫的混合策略小偷的混合策小偷的混合策略分布不受略分布不受P的影响,因此的影响,因此政府加重政府加重对小小偷的的惩罚在在长期中并不能抑期中并不能抑制盗窃,最多制盗窃,最多只能抑制短期只能抑制短期的盗窃的盗窃发生率,生率,它的作用主要它的作用主要是使守是使守卫可以可以更多地更多地偷懒在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确齐威王田忌赛马齐威王田忌赛马古代齐威王与大将田忌赛马,田忌的谋士孙膑运用计谋帮助田忌以弱胜强。
比赛规则:田忌与齐威王各出三匹马,一对一比赛三场,每一场的输方要赔1000斤铜给赢方双方的马按实力都可以分为上、中、下,但齐威王的上、中、下均优于田忌的上、中、下实际上,田忌的上马、中马要优于齐威王的中马、下马比赛结果:田忌连输三场;后孙膑建议,以上对中、以中对下、以下对上,结果以2:1赢得比赛在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确前述为单方面运用策略的故事,如果齐威王预料到田忌的做法,必然会改变各匹马出场的次序本博弈中博弈双方的利益是完全对立的,是严格竞争的零和博弈,不会有纯策略纳什均衡,必然是一个混合策略均衡假设齐威王采取六种战略的概率分别为pa,pb,pc,pd,pe,pf(加总为1),则田忌采取六种战略的期望得益相等,则得出齐威王与田忌均以1/6的相同概率随机选择各自的六个纯策略,构成本博弈唯一的混合策略纳什均衡齐威王田忌赛马齐威王田忌赛马在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-3齐齐威威王王田忌田忌齐威王田忌赛马齐威王田忌赛马在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确齐威王田忌赛马 在上述混合策略下,齐威王的期望得益为1/6(3+1+1+1+1-1)=1;田忌的期望得益为1/6(1-3-1-1-1-1)=-1,即多次进行这样的赛马,齐威王平均每次能赢田忌1000斤铜,这是因为齐威王三匹马的总体实力略胜田忌三匹马总体实力的缘故在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确混合策略反应函数将博弈方的策略空间扩展到包括混合策略,将纳什均衡扩展到包括混合策略纳什均衡以后,求纳什均衡反应函数的分析方法也可以扩展到求混合策略纳什均衡。
反应函数即一博弈方对另一博弈方每种可能的决策内容的最佳反映决策构成的函数在纯策略的范畴内,反应函数是各博弈方选择的纯策略对其他博弈方纯策略的反应在混合策略的范畴内,博弈方的决策内容为选择概率分布,反应函数就是一方对另一方的概率分布的反应在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确掷硬币-1,11,-1反面1,-1-1,1正面反面正面12支付 q 1-q1-pp在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确pq01/2111/2p1=f(q)q2=f(p)当当2 2出正面的概率出正面的概率q 1/2,,1出正面的概率出正面的概率为1,因,因为他出正面得到的他出正面得到的预期收益大于他出反期收益大于他出反面;当面;当2出正面的概率出正面的概率q 1/2,,1出正面的概出正面的概率率为0,因,因为他出反面的期望收益大于他出正他出反面的期望收益大于他出正面在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第五节 纳什均衡的存在性与多重性88实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确混合战略纳什均衡纯战略纳什均衡重复剔除占优均衡占优均衡不同均衡概念之间的关系在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确纳什均衡的存在性 每个有限战略式博弈(参与人与战略数目均为有限)都有纳什均衡存在,这均衡有可能是混合战略均衡纳什均衡的多重性 纳什均衡不唯一,如性别战在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确案例 性别战1,30,0足球0,02,1时装足球时装妻子支付 p 1-pq1-q丈夫在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确性别战:混合策略均衡给定妻子分别以给定妻子分别以q,1-q的概率的概率选择时装、足球,装、足球,则丈夫丈夫选择时装、足球的期望收益相等,即装、足球的期望收益相等,即1.q+0.(1-q)=0.q+3.(1-q),,解得妻子解得妻子选择时装、足球的概率分装、足球的概率分别为((3/4,,1/4))给定丈夫分定丈夫分别以以p,1-p的概率的概率选择时装、足球,装、足球,则妻子妻子选择时装、足球的期望收益相等,即装、足球的期望收益相等,即2.p+0.(1-p)=0.p+1.(1-p),,解得妻子解得妻子选择时装、足球的概率分装、足球的概率分别为((1/3,,2/3))在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确当妻子以(当妻子以(3/43/4,,1/41/4)的概率分布随机选择时)的概率分布随机选择时装表演和足球,丈夫以(装表演和足球,丈夫以(1/31/3,,2/32/3)的概率随)的概率随机选择时装表演和足球时,双方都无法通过单机选择时装表演和足球时,双方都无法通过单独改变策略,即单独改变随机选择纯策略的概独改变策略,即单独改变随机选择纯策略的概率分布而提高利益,因此双方的上述概率分布率分布而提高利益,因此双方的上述概率分布的组合构成一个混合策略纳什均衡。
的组合构成一个混合策略纳什均衡该混合策略混合策略纳什均衡什均衡给妻子和丈夫各自妻子和丈夫各自带来的来的期望收益分期望收益分别为:: q.p.2+q.(1-p).0+(1-q).p.0+(1-q).(1-p).1=2/3; q.p.1+q.(1-p).0+(1-q).p.0+(1-q).(1-p).3=3/4双方的期望收益均小于双方的期望收益均小于纯策略策略时的期望收益的期望收益性别战:混合策略均衡在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确qp01/3113/4q1=f(p)p2=f(q)夫妻之争两博弈夫妻之争两博弈方的反应函数方的反应函数如果p 1/3,,则妻子妻子选择时装的装的期望得益小于期望得益小于选择足球足球,,因此因此妻子妻子应选择足球,即足球,即q=0;;如如果果p 1/3,,则妻子妻子选择时装的装的期望得益期望得益为大于大于选择足球的得足球的得益,因此益,因此选时装,即装,即p=1在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确焦点均衡(focal point)当一个博弈有多个纳什均衡时,博弈论并没有一个一般的理论来证明纳什均衡结果一定会出现。
在现实生活中,参与人可能使用某些被博弈模型抽象掉的信息来达到一个“焦点”均衡这些信息可能与社会文化习惯、参与人过去博弈的历史有关例,在性别战中,如果今天是丈夫的生日,(足球、足球)可能是一个焦点均衡;而如果是妻子的生日,(时装、时装)可能是一个焦点均衡还有分蛋糕等在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确课堂练习:求纳什均衡2,40,0音乐会1,14,2足球音乐会足球男方女方支付 p 1-pq1-q在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 市场进入阻挠0,3000,300不进入-10,040,50进入斗争默许进入者在位者支付威胁是可置信的吗?在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确作业1 春节前夕,某小镇上两个商铺主甲和乙同时看到一个赚钱机会:去城里贩一批鞭炮回来零售,购货款加上运输费用共5000元,如果没有竞争对手,这批货在小镇上能卖6000元;但如果另一家商铺同时在小镇上卖鞭炮,价格下跌使得这批鞭炮只能卖4000元。
请用战略式表示支付矩阵;请找出纳什均衡在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确作业二2,01,14,23,41,22,31,30,23,0 乙 左 中 右上中下甲一个两人同时博弈的支付竞争如下所示,试求纳什均衡是否存在重复剔除占优战略均衡?在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第二章 完全信息动态博弈博弈的扩展式表述子博弈精炼纳什均衡子博弈精炼纳什均衡举例重复博弈和无名氏定理100实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第一节 博弈的扩展式表述101实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确完全信息动态博弈一般以扩展型式来表示:G=(N,H,P,I,U),包括5要素:(1)局中人N;(2)历史H:博弈树是一个多环节与枝干的集合,从单一的起始环节,直到终结环节,代表博弈历史;(3)对每个环节的分配法则P:将每个环节(除终结环节外)分配给不同的局中人,并赋予行动时可选的策略;(4)局中人行动时的信息集合I;(5)对应局中人可能选择策略,各局中人在终结环节所得到的报酬U。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确122LLSSLS((2,,2))((-1,,-1))((-1,,-1))((1,,1))战略式表述战略式表述(strategic form (strategic form representation)representation)多用矩多用矩阵2,2-1,-1-1,-11,12L SL S1扩展式表述扩展式表述( (extensive form extensive form representation)representation)多用博弈多用博弈树战略式与扩展式在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确-3 ,-3-3 ,-31 ,01 ,00 ,10 ,00 ,10 ,0A AB B(进入,进入)(进入,进入)进入进入不进入不进入(进入,不进入)(进入,不进入)(不进入,进入)(不进入,进入)(不进入,不进入)(不进入,不进入)市场进入博弈的标准式市场进入博弈的标准式进入不进入ABB进入不进入不进入进入收益:收益:A B-3 ,-31 ,00 ,10 ,0市场进入的扩展式市场进入的扩展式在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 在市场进入博弈中:在市场进入博弈中:A有两个行有两个行动::“进入入”、、“不不进入入”。
由于是先行由于是先行动者,只有两个者,只有两个战略:略:选择“进入入”或或“不不进入入” B有两个行有两个行动::“进入入”、、“不不进入入”但是,有但是,有4个个战略:略:(1)(1)若若A选择“进入入”,,B选择“进入入”,若,若A选择“不不进入入”,,B选择“进入入”,即,即((进入,入,进入)入)(2)若若A选择“进入入”,,B选择“进入入”,若,若A选择“不不进入入”,,B选择“不不进入入”,即,即((进入,不入,不进入)入)(3)(3)若若A选择“进入入”,,B选择“不不进入入”,若,若A选择“不不进入入”,,B选择“不不进入入”,即,即(不(不进入,入,进入)入)(4)若若A选择“进入入”,,B选择“不不进入入”,若,若A选择“不不进入入”,,B选择“不不进入入”,即,即(不(不进入,不入,不进入)入)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确博弈树的构成 1 1.结.结( (nodes):结包括决策结(decition nodes)和终点结(terminal nodes)两类决策结是参与人采取行动的时点,终点结是博弈行动路径的终点。
在博弈树中,“谁在什么时候行动”用在决策结旁边标注参与人的办法来表示参与人的支付标注在博弈树终点结处2.枝.枝(branches)::在博弈树上,枝是从一个决策结到它的直接后续结的连线,每一个枝代表参与人的一个行动选择3.信息集.信息集(information sets)::博弈树上的所有决策结分割成不同的信息集每一个信息集是决策结集合的一个子集该子集包括所有满足下列条件的决策结:(1)每一个决策结都是同一参与人的决策结;(2)该参与人知道博弈进入该集合的的某个决策结,但不知道自己究竟处于哪一个决策结在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确122LLSSLS((2,,2))((-1,,-1))((-1,,-1))((1,,1)) 结nodes信息集分单节信息集和多节信息集;如果用虚线匡起来表示2知道自己位于信息集内,但不知道是哪一点,因为他没能观察到对手的行动;如果博弈树的所有信息集都是单结的,称为完美信息博弈在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确122LLSSLS((2,,2))((-1,,-1))((-1,,-1))((1,,1))完美信息(perfect information)与不完美信息(imperfect information)122LLSSLS((2,,2))((-1,,-1))((-1,,-1))((1,,1))不完美信息:2不能区分1是采用了L还是S完美信息:2能区分1是选择了L还是S在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第二节 子博弈精炼纳什均衡子博弈子博弈子博弈精子博弈精炼纳什均衡什均衡求解方法:逆向求解方法:逆向归纳法法承承诺行行动与子博弈精与子博弈精炼纳什均衡什均衡109实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、子博弈(sub-game)子博弈定义:在一个扩展型博弈中,如果一个博弈由它的一个决策结及其所有后续结构成,并满足(1)起始结是一个单结的信息结;(2)子博弈保留了原博弈的所有结构,则称它为原博弈的一个子博弈(子博弈)。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确(1)起始结是一个单结的信息结122LLSSLS((2,,2))((-1,,-1))((-1,,-1))((1,,1))122LLSSLS((2,,2))((-1,,-1))((-1,,-1))((1,,1))x1x2在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确(2)子博弈保留了原博弈的所有结构:子博弈的信息集和支付向量都直接继承自原博弈122LLSSLSx1x23333在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确进入不进入ABB进入不进入不进入进入收益:收益:A B-3 ,-31 ,00 ,10 ,0抵赖坦白ABB抵赖坦白坦白抵赖-1 ,-1-9 ,00 ,-9-6 ,-6在市场进入博弈中,包含在市场进入博弈中,包含3 3个子博弈(包括原博弈)个子博弈(包括原博弈)而在囚徒博弈中,只有一个子博弈(?而在囚徒博弈中,只有一个子博弈(?)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、子博弈精炼纳什均衡 子博弈精炼纳什均衡定义: 在博弈G中,如果s*=(s1,…,sn)是G的一个纳什均衡,并且对所有可能的子博弈而言仍是一个纳什均衡,则称s*=(s1,…,sn)为一个子博弈精炼纳什均衡在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确市场进入博弈的纳什均衡市场进入博弈的纳什均衡进入不进入ABB进入不进入不进入进入收益:收益:A B-3 ,-31 ,00 ,10 ,0-3 ,-3-3 ,-31 ,01 ,00 ,10 ,00 ,10 ,0A AB B(进入,进入)(进入,进入)进入不进入(进入,不进入)(进入,不进入)(不进入,进入)(不进入,进入)(不进入,不进入)(不进入,不进入) 该博弈中有三个纳什均衡:不进入,(进入,进入)进入,(不进入,进入)进入,(不进入,不进入)前两个均衡的结果(进入,不进入),即A进入,B不进入;第二个均衡结果是(不进入,进入),即A不进入,B进入 如果理论得到这样的结果,无助于预测博弈参与人的行为。
此外,纳什均衡假定,每一个参与人选择的最优战略是在所有其他参与人的战略选择给定时的最优反应,即参与人并不考虑自己的选择对其他人选择的影响,因而纳什均衡很难说是动态博弈的合理解在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确必须在多个纳什均衡中剔除不合理的均衡解,即所谓“不可置信威胁”子博弈精子博弈精炼纳什均衡什均衡是对纳什均衡概念的最重要的改进它的目的是把动态博弈中的“合理纳什均衡”与“不合理纳什均衡”分开正如纳什均衡是完全信息静态博弈解的基本慨念一样,子博弈精炼纳什均衡是完全信息动态博弈解的基本概念①{不进入,(进入,进入)}② {进入,(不进入,进入)}③{进入,(不进入,不进入)}进入不进入ABB进入不进入不进入进入收益:收益:A B-3 ,-31 ,00 ,10 ,0前边得到的三个纳什均衡中,均衡①意味着当A不进入时,B选择进入;而当A选择进入时,B仍选择进入(B威胁无论如何都要进入市场)显然,当当A A选择进入入时,,B B仍仍选择进入入是不合理的,如果A进入市场,B选择“不进入”比选择“进入”收益要更大,理性的B不会选择进入,而A知道B是理性的,因此也不会把该战略视为B会选择的战略。
因此,B B的的战略(略(进入,入,进入)是不可置信威入)是不可置信威胁在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 均衡③意味着当A进入时,B选择不进入;而当A选择不进入时,B仍选择进入(B威胁无论如何都不进入市场)显然,当当A A选择不不进入入时,,B B仍仍选择不不进入入是不合理不合理的,B B的的战略略是不可置信的是不可置信的 ①{ ①{不进入,(进入,进入)不进入,(进入,进入)} } ②② {进入,(不入,(不进入,入,进入)入)} ③③{进入,(不入,(不进入,不入,不进入)入)} 只有均衡②是合理的:如果A进入,B不进入;如果A不进入,B进入因为A是先行动者,理性的A会选择“进入”(他知道B是理性的,B不会选择“进入”),而理性的B选择“不进入” 观察博弈树上的三个均衡中,B的不可置信战略中的反应,在第二阶段B开始行动的两个子博弈中不是最优;而合理的纳什均衡中,B的战略在所有子博弈中都是最在所有子博弈中都是最优的的,与A的第一阶段可能选择的行动构成该子博弈的纳什均衡。
进入不进入ABB进入不进入不进入进入收益:收益:A B-3 ,-31 ,00 ,10 ,0① ② ③① ② ③在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 只有当一个战略规定的行动规则在所有可能的情况下都是最优的时,它才是一个合理的、可置信的战略子博弈精炼纳什均衡就是要剔除掉那些只在特定情况下是合理的而在其他情况下并不合理的行动规则 子博弈精子博弈精炼纳什均衡:什均衡: 如果参与者的战略在每一个子博弈中都构成了纳什均衡,则称纳什均衡是子博弈精练的(泽尔滕,1965) 为简单起见,假定博弈有两个阶段,第一阶段参与人1行动,第2阶段参与人2行动,并且2在行动前观测到1的选择令A1是参与人1的行动空间,A2是参与人2的行动空间当博弈进入第二阶段,给定参与人1在第一阶段的选择为a1∈ A1 ,参与人2面临的问题是: 显然参与人2的最优选择a2*依赖于参与人1的选择a1用a2*=R(a1)代表上述最优化问题的解(即2的反应函数)因为参与人1应该预测到参与人2在博弈的第二阶段将按a2*=R(a1)的规则行动,参与人1在第一阶段面临的问题是:在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 令上述问题的最优解为a1*。
那么,这个博弈的子博弈精炼纳什均衡为{a1*,R2(a1)},均衡结果为{a1*,R2(a1*)}a1*,R2(a1*))是一个精炼均衡,因为a2*=R2(a1)在博弈的第二阶段是最优的除a2*=R2(a1)之外,任何其他的行为规则都不满足精练均衡的要求 上述思路就是逆向逆向归纳法法寻找子博弈精炼纳是均衡的基本思路在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确甲乙(2,2)(1,0)(3,1)上下左右乙(2,1)左右 乙{左,左} {左,右} {右,左} {右,右}2,22,22,12,11,03,11,03,1 上下甲在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确纳什均衡子博弈精炼纳什均衡三个纳什均衡:(上,{左,左})(下,{左,右})(下,{右,右})排除(上,{左,左}),(下,{右,右}),只有(下{左,右}) 是子博弈精炼纳什均衡在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、求解方法:逆推法三、求解方法:逆推法 逆向归纳法求解子博弈精炼纳什均衡的过程,实质是重复剔除劣战略过程在扩展式博弈上的扩展:从最后一个决策结开始依次剔除掉每个子博弈的劣战略,最后生存下来的战略构成精炼纳什均衡。
如同重复剔除的占优均衡要求“所有参与人是理性的”是共同知识一样,用逆向归纳法求解均衡也要求“所行参与人是理性的”是共同知识在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确122软软脆脆软脆((0,,0))((10,,20))((20,,10))((0,,0))逆推法:例1在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确甲丙乙上东下西左右((4,,2,,3))((1,,7,,8))((5,,3,,4))((7,,6,,6))丙丙(2,1,9)(0,4,2)逆推法:例2在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确进入者在位者(0,300)(40,50)(-10,0)不进入进入默许斗争0,3000,300不进入-10,040,50进入斗争默许进入者在位者支付逆推法:例3在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确四、承诺行动(commitment)与子博弈精炼纳什均衡纳什均衡之所以不是精炼均衡,是因为不可置信的威胁存在,如父母与子女之间的博弈。
如果参与人在博弈前采取措施改变行动空间或支付函数,原来不可置信威胁就变得可置信,博弈的精炼均衡就会改变;将改变博弈结果而采取的措施称为“承诺行动”完全承诺,如破釜沉舟、军事博弈 不完全承诺,增加行动成本在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确承诺行动与博弈结果春节前夕,某小镇上两个商铺主甲和乙同时看到一个赚钱机会:去城里贩一批鞭炮回来零售,购货款加上运输费用共5000元,如果没有竞争对手,这批货在小镇上能卖6000元;但如果另一家商铺同时在小镇上卖鞭炮,价格下跌使得这批鞭炮只能卖4000元纳什均衡是什么?假设甲先行动,商铺乙看到对方的选择后再决定是否进货,子博弈精炼纳什均衡是什么?在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确承诺行动与博弈结果 如果甲先行动,但在博弈开始前商铺主乙有一次行动A的机会,利用子博弈精炼均衡概念分析下述两种情况下的博弈结果:(1)A:商铺主乙逢人便说自己一定要进货,无论对方如何行动他都不会改变这个决定;(2)A:商铺主乙与某个嘲笑他说大话的第三者丙打赌:如果自己到时不进货,向丙支付1500元;如果自己到时候进货,丙向他支付100元。
并且,乙将这个赌局通知甲在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确甲乙乙进进不进不进进不进((-1000,,-1000))((1000,,0))((0,,1000))((0,,0))甲乙乙进进不进不进进不进((-1000,,-900))((1000,,-1500))((0,,1100))((0,,-1500))在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确开金矿博弈的基本问题:甲在开采一价值4万元的金矿时缺1万元资金,而乙正好有1万元资金可以投资设甲想说服乙将这1万元资金借给自己用于开矿,并许诺在采到金子后与乙对半分成,乙是否该将钱借给甲呢?假设金矿的价值是经过权威部门探测确认的,没必要怀疑乙甲(0,4)(2,2)(1,0)不借借分不分开金矿博弈在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确不借乙甲乙借不分分(1,0)不打打(0,4)(1,0)(2,2)有法律保障的开金矿博弈——分钱打官司都可信在一个重视自身利益的成员组成的社会中,完善公正的法律制度不但能保障社会的公平,而且还能提高社会经济活动效率,是实现最有效率的社会分工合作的重要保障在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确乙甲乙打(2,2)不分分不借借(0,4)(-1,0)不打(1,0)法律保障不足的开金矿博弈——分钱打官司都不可信由于法制建设不完善,司法机构执法能力存在问题,并且也存在司法腐败和“执行难”的问题,因此,有理不一定能打赢官司,赢了官司却反而输了钱的事情在一些国家普遍存在在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第三节 子博弈精炼纳什均衡举例斯塔克尔伯格(Stackelberg)寡头竞争模型劳资(工会与厂商)博弈模型罗宾斯泰英(Rubinstein)轮流出价的讨价还价模型委托人—代理人理论133实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、斯塔克尔伯格模型产量领导模型:行动顺序为,第一家厂商首先选择产量;第二家厂商再选择产量,得到反应函数;将反应函数代入第一家厂商的利润函数求出y1*;然后求y2。
追随者max 2 =p(y1+y2)y2-c(y2) ,得到反应函数y2=f2(y1) 领导者 max 1=p(y1+y2)y1-c(y1)= p(y1+f2(y1) )y1-c(y1),可以求出均衡产量y1*,跟随者依照反应函数求出y2*,进一步解出p在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确斯塔克尔伯格模型求解 设p=1-(y1+y2),MC=0,则厂商2根据利润最大化得到反应函数y2=f2(y1)=(1-y1)/2, 代入厂商1的利润函数 1=p(y1+y2)y1-c1(y1), 一阶条件得到y1=1/2, 代入厂商2的反应函数得到y2=1/4, (1/2,1/4)为均衡解, (1/8,1/16)为其相应的支付在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确斯塔克尔伯格模型斯塔克尔伯格模型y1y2f1(y2)f2(y1)1/21/4在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、劳资博弈模型里昂惕夫1946年提出,分别代表劳资双方的工会与厂商之间的博弈模型。
该模型假设工资完全由工会决定,而厂商则根据工会要求的工资高低决定雇用工人的数量工会代表的劳方效用u=u(W,L)厂商的利润函数为=(W,L)=R(L)-WL行动顺序为:先由工会决定工资率,然后厂商根据工会提出的工资率决定雇用多少劳动在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确劳资博弈模型采用逆推法求解先分析第二阶段厂商的选择厂商对工会选择的工资率W的反应函数为L=L(W),则:max (W,L)=max[R(L)-WL],解得R’(L)=W,求得L*(W)为在给定工会选择W时厂商的最优雇佣数量然后分析第一阶段工会的选择工会清楚厂商对应每一个W所选择的L*,工会需要决定的是选择W*,使得max u=u(W,L*(W)),求得符合工会最大利益的W*在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确劳资博弈模型先由工会决定工资率,再由厂商决定雇用多少劳动力RL0W L厂商的反应函数R(L)斜率为WLW0工会的无差异曲线在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、罗宾斯泰林讨价还价模型讨价还价模型简述: 甲、乙两人协商分配上级下拨的1000元钱。
在给定的3天协商时间内,第一天甲提出一个分配方案,乙若同意的话就按此分配,乙若不同意他可在第二天提出自己的方案,甲可选择接受或在第三天再提出一个方案,乙对此可以接受或拒绝;如果3天内两人不能达成协议,上级将收回这1000元钱;甲和乙分别按天贴现率和贴现自己的未来收益, 0 、1简化条件:如果自己不能从拒绝对方提案中获取更多的收益,局中人都会接受对方提案在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确Rubinstein讨价还价模型第一天第二天第三天甲乙提案提案拒拒绝并提案并提案甲拒拒绝并提案并提案乙拒拒绝(a3,b3) (a2,b2) (a1,b1)接接受受接接受受接接受受((0,,0))在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确Rubinstein讨价还价模型解析:逆推法第三天:只要甲的提案满足b10,乙总会接受,甲的目标是利益最大化,因而提案为(a1,b1)=(1,0)(单位为千元)第二天:乙预料到第三天(1,0)的结果,所以尽可能让甲接受自己的提案,提案中给甲的金额不小于1的贴现,因而有方案(a2,b2)=(,1-)第一天:甲清楚如果自己的提案被否决,对方第二天的提案将是(,1-),自己会接受它。
甲的问题是保证第一天乙得到(1-)的前提下自己尽可能多得一些他的最佳选择将是(a3,b3)=(1-(1-),(1-)),乙接受,博弈于第一天即告结束在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确无穷次讨价还价模型无穷次讨价还价模型不能采用逆推法Rubinstein曾经对其进行证明,得到结果:甲在第一阶段提出((1-)/(1-),1-(1-)/(1-)),乙接受在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确四、委托人—代理人理论 委托人——代理人关系经济活动和社会活动中有很多委托人——代理人关系,有明显的,也有隐蔽的工厂和工人、店主和店员、客户和律师、市民和政府、基金购买者和基金管理人等都是委托人——代理人关系的关键特征:不能直接控制,监督不完全,信息不完全,利益的相关性委托人——代理人涉及问题:激励机制设计、机制设计理论,委托合同设计问题等在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确无不确定性的委托人—代理人模型[R(E)-w(E), w(E)-E][R(S)-w(S), w(S)-S][R(0),0][R(0),0]122偷懒努力拒绝接受不委托委托代理人的选择激励相容约束: w(E)-E> w(S)-S w(E)> w(S)+E-S在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确参与约束:参与约束:22[R(E)-w(E), w(E)-E]拒绝接受拒绝接受[R(0),0][R(S)-w(S), w(S)-S][R(0),0]接受:w(E)-E>0接受:w(S)-S>0参与约束在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 委托人的选择11不委托委托委托[R(S)-w(S), w(S)-S][R(0),0][R(E)-w(E), w(E)-E]不委托[R(0),0]委托: R(E)-w(E) > R(0)不委托: R(E)-w(E) < R(0)委托: R(S)-w(S) > R(0)不委托: R(S)-w(S) < R(0)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确数值例子[12, 2][0,0][0,0]122偷懒努力拒绝接受不委托委托[7,1]E=2, S=1,W(E)=4, w(S)=2在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确有不确定性但可监督的委托人—代理人博弈10022[0,0][0,0][10-w(S), w(S)-S][20-w(S), w(S)-S][10-w(E), w(E)-E][20-w(E), w(E)-E]不委托高产(0.1)低产(0.9)低产(0.1)高产(0.9)努力偷懒接受拒绝委托偷懒:委托: 0.1*[20-w(S)] +0.9*[10-w(S)]>0不委托: 0.1*[20-w(S)] +0.9*[10-w(S)]<0努力委托:0.9*[20-w(E)]+0.1*[10-w(E)]>0不委托:0.9*[20-w(E)]+0.1*[10-w(E)]<0因为可监督,因此代理人报酬与成果无关,只与努力情况有关。
不确定性风险由委托人承担代理人选择同无不确定性情况在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确有不确定性且不可监督的委托人—代理人博弈122[0,0][0,0][10-w(10), w(10)-S][20-w(20), w(20)-S][10-w(10), w(10)-E][20-w(20), w(20)-E]不委托高产(0.1)低产(0.9)低产(0.1)高产(0.9)努力偷懒接受拒绝委托0只能根据成果只能根据成果付酬,付酬,w w是成是成果函数,而非果函数,而非努力程度函数努力程度函数不确定性不确定性对代代理人利益、理人利益、选择有影响在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确努力:0.9*[w(20)-E]+0.1*[w(10)-E]>0.1*[w(20)-S]+0.9*[w(10-S)]接受:0.9*[w(20)-E]+0.1*[w(10)-E]>0委托:0.9*[20-w(20)]+0.1*[10-w(10)]>0激励相容约束促使代理人努力的激励相容约束、参与约束,以及委托人选择委托的条件参与约束对于委托人来说,就是要对于委托人来说,就是要根据上述两个条件,以及根据上述两个条件,以及 E E、、S S的的值,,选择最佳的工最佳的工资水平水平w(20)w(20)和和w(10)w(10),,或或者它者它们的差的差额w(20)w(20)- -w(10)w(10)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第四节 重复博弈和无名氏定理有限次重复博弈:连锁店悖论无限次重复博弈和无名氏定理152实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、有限次重复博弈一、有限次重复博弈有限次重复博弈 令G为阶段性博弈,G(T)是G重复T次的重复博弈(T<)。
如果G有唯一的纳什均衡解,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次,如囚犯困境在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确有限次重复博弈:连锁店悖论有限次重复博弈:连锁店悖论连锁店悖论连锁店悖论 假定同样的市场有20个(可以理解为在位者有20个连锁店),进入者每次进入一个市场,博弈就变成了20次重复博弈子博弈精炼纳什均衡为,在位者在每一个市场选择默许,进入者在每一个市场选择进入在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确连锁店悖论连锁店悖论——市场进入博弈市场进入博弈默许斗争进入40,50-10,0不进入0,3000,300进入者支付在位者在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确3,30,4利他4,01,1利己利他利己甲 乙支付n次重复博弈在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确讨论“信息完备”是重复博弈的一个必要条件,事实证明,如果局中人的博弈环境存在不完备信息,或者存在不确定性,类似于“连锁店悖论”这样的问题多半会消失。
假定连锁店有高成本、低成本两种情况,就但其博弈看,面对新厂商进入,高成本厂商最佳反应为容忍,低成本厂商最佳反应为斗争,那么高成本厂商在博弈的前期阶段选择斗争,仍是可信的威胁在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、无限次重复博弈与无名氏定理无限次重复博弈 假设囚徒困境是一个阶段性博弈,并且是无限次重复博弈,那么任一个囚徒选择抵赖的条件是:0+(-6)+2(-6)+…-1+(-1)+2(-1)+…( 为贴现因子)或者-6/(1-)-1/(1-),即 1/6(即局中人具有足够的耐心),(抵赖、抵赖)是无限次囚徒博弈的一个子博弈精炼纳什均衡在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确冷酷战略(grim strategies)也称触发战略(trigger stratigies) 以囚徒困境为例:开始选择抵赖,选择抵赖直到有一方选择了坦白,然后永远选择坦白 一旦哪个参与人选择了坦白,就触发了惩罚的扳机在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确无名氏定理 在无限次重复博弈中,如果参与人具有足够的耐心(即足够大),那么任何满足个人理性的可行的支付向量都可以通过一个特定的子博弈精炼均衡得到。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确无名氏定理举例以“利己、利他”为例,其博弈中唯一的纳什均衡为(利己,利己),两个局中人在此均衡下所的支付都是1;所以,只要无穷重复博弈中局中人可行的平均单期支付不小于1,这样的支付就是一个可能的均衡支付无穷重复博弈能够导致帕雷托改进在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确寡头市场上古诺均衡的寡头市场上古诺均衡的无限次重复博弈无限次重复博弈合作:生产垄断产量的一半(1/4,1/4),获取超额利润(1/8,1/8)不合作:生产纳什均衡产量(1/3,1/3),获取超额利润(1/9,1/9)给定企业坚持冷酷战略,企业一开始生产1/4,中途只要有企业偏离合作产量,生产短期最优产量3/8,则对方选择1/3在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确证明冷酷战略是子博弈精炼纳什均衡 如果下列条件满足,则任一企业没有积极性偏离合作均衡: 9/64+/9+2/9+…1/8+ /8 +2/8+… 即如果9/17,默契合作就会是一个精炼均衡结果。
寡头市场上古诺均衡的寡头市场上古诺均衡的无限次重复博弈无限次重复博弈在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确如果有n个寡头企业,默契合作要求(1+4n/(n+1)2)-1,当n时,1,即企业越多,默契合作越困难解释了为什么小团体的合作靠非正式规则就可以维持,而大团体就必须依赖于正式的规则与合约寡头市场上古诺均衡的寡头市场上古诺均衡的无限次重复博弈无限次重复博弈在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确作业作业1 1:请找出此博弈的子博弈精炼纳什均衡:请找出此博弈的子博弈精炼纳什均衡((-6,,-6))EIE进L不进SLS((-3,,-3))((-1,,1))((1,,-1))ELS(0,2)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确作业2一个建筑公司每到有工程合同才雇用临时工人考虑某项工程中公司与工人的劳动-工资博弈;工人受雇于该公司的机会成本是0;工人可以老实地干活,为公司创造利润y,但这需要付出劳动成本l,y>l>0;工人也可以受雇后不干活,这不需任何劳动成本,同时创造的利润也是0。
假设公司与工人在工程结束之前没有任何工资合同,它只是在雇用期满后才决定付给每个工人的工资额w在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确作业2如果该建筑公司在未来的10年内每年有一项相同的工程,证明:无论公司的利润贴现因子是多少,唯一的子博弈完美均衡是:在每一项工程中,无论工人是否干活,公司向工人付的工资额w都是0;工人不干活如果该建筑公司依次有无穷多个工程,而下一期工人又能看到以前的工资政策证明:只要充分接近1,每一期工人都努力干获将是一个子博弈完美均衡战略在所有子博弈完美均衡中,对公司最有利的是什么样的均衡?在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第三章 不完全信息静态博弈不完全信息博弈和贝叶斯纳什均衡贝叶斯均衡的应用举例贝叶斯博弈与混合战略均衡机制设计理论与显示原理168实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第一节 不完全信息博弈和贝叶斯均衡169实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、不完全信息博弈完全信息(complete information) 每个局中人对其他局中人的特征(或类型)和支付函数有准确的了解;否则,为不完全信息(incomplete information )。
完美信息(perfect information) 在博弈过程的任何时点每个局中人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息(imperfect information )在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确40,50 -10,030,80-10,1000,300 0,3000,400 0,400 高成本情况高成本情况 低成本情况低成本情况 默默许 斗争斗争 默默许 斗争斗争进入进入不不进入入进进入入者者在位者在位者市场进入博弈:不完全信息市场进入博弈:不完全信息在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、海萨尼(Harsanyi)转换在位者存在不同类型,类似于与n个参与人博弈;海萨尼(1967-1968)提出,引入虚拟参与人——自然,自然先决定参与人的特征,不完全信息博弈转换为不完美信息博弈不完全信息意味着至少有一个人有多个类型(type),即个人所拥有的非共同信息,用i表示参与人i的一个类型,分布函数p(1,…,n)为共同知识。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确自然进入者进入者在位者在位者高低不进入进入不进入进入合作斗争 合作斗争(40,50) (-10,0) (30,80) (-10,100)(0,300)(0,400)[p][1-p]海萨尼转换后的市场进入博弈在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、海萨尼转换假设自然N按照一个先验的分布函数p(1,…,n)来选择各个局中人的类型,并且假设这是共同知识记-i=(1,…,i-1,i+1,…n)-i局中人i不知道N对-i的选择结果,但由于他知道自己的类型i,它可以利用贝叶斯法则计算出条件分布函数,对其他局中人的类型进行估计:称pi(-ii)为局中人i对别的局中人类型的信念(belief)在许多场合下,局中人的类型是彼此无关的,此时pi(-ii)就简化为pi(-i)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、不完全信息静态博弈的三、不完全信息静态博弈的战略式表述战略式表述n人贝叶斯博弈的战略式表述为: G={N,S,,P,U},其中参与人的类型空间为:1,… n;条件概率为:p1,…pn;类型依存战略为:S1(1) ,…S(n);类型依存支付函数为:u1(s1,…sn; 1),… un(s1,…sn; n)给定参与人i知道自己的类型ii,条件概率pi=pi(-ii)描述给定自己属于i的情况下,参与人i有关其他参与人类型-i-i的不确定性。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确静态贝叶斯博弈的时间顺序自然选择类型向量=(1,…,n),其中ii,参与人i观测到i,但参与人j只知道pj(-jj),观测不到iN个参与人同时选择行动s=(s1,…,sn),其中siSi(j)参与人i得到ui(s1,…,sn;j)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确自然进入者进入者在位者在位者高低不进入进入不进入进入合作斗争 合作斗争(40,50) (-10,0) (30,80) (-10,100)(0,300)(0,400)[p][1-p]海萨尼转换后的市场进入博弈在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确市场进入博弈均衡求解当进入者选择进入的期望收益大于选择不进入的期望收益时,进入者选择进入进入的期望收益:p*40+(1-p)*(-10)>0,解得:p>1/5,进入;p<1/5,不进入;p=1/5,进入与不进入是无差异的。
当p>1/5时,s1*=进入,s2*(高成本)=默许当p<1/5时,s1*=不进入,s2*(低成本)=斗争在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确四、贝叶斯纳什均衡(BNE)定义:如果有一组与局中人类型相关的战略{si*(i)ii}ni=1,对每个局中人i和每种局中人i的类型iI,si*(i)是问题 的解,则称{si*(i)ii}ni=1是一个贝叶斯纳什均衡换句话说,贝叶斯纳什均衡下,每个局中人都在其他局中人(无论他属于哪种类型)不改变当前战略的情况下达到了他的最大期望支付在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确类型2类型2/左 右左 右3,12,03,02,10,14,00,04,1上 下 甲乙静态贝叶斯博弈均衡举例:表中甲、乙同时行动,甲只有一种类型,但乙有两种类型:2={2,2/};甲不了解对方是哪一类,但他相信对方为2,2/的概率各为1/2求解均衡。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确静态贝叶斯博弈均衡举例求解乙:如果为2,有占优战略为“左”;如果为2/,有占优战略为“右”甲:由于甲相信对方为两种类型的可能性各为1/2,故甲计算选“上”或“下”,分别给他带来的期望收益,结果选“上”,期望支付为5/2,选“下”,期望支付为2,因而甲的最佳选择是“上”均衡为s1*=上;s2*(2)=左,s2*(2/)=右在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第二节贝叶斯均衡的应用举例182实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、不完全信息古诺模型在不完全信息古诺模型中,参与人的类型是成本函数假定逆需求函数是P=2-q1-q2,每个企业都有不变的单位成本ci(i=1,2),企业i的利润函数为:i=qi(2-q1-q2-ci)假定企业1的单位成本c1=1是共同知识,企业2的单位成本可能是c2h=5/4,也可能是c2l=3/4,两者的可能性各为p=1/2,1-p=1/2在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确不完全信息古诺模型求解(一)求企业2的反应函数高成本时,2h=q2h(2-q1-q2h-c2)=q2h(3/4-q1-q2h);低成本时,2l=q2(5/4-q1-q2l),求最优化的一阶导数,得到反应函数:q2h=1/2(3/4-q1),q2l=1/2(5/4-q1)求企业1的反应函数企业1不知道企业2的真实成本,因而不知道企业2的最优反应是q2h,还是q2l,因此将选择q1最大化利润函数:E1=1/2q1(2-q1-q2h-c1)+1/2q1(2-q1-q2l-c1),求最优化的一阶导数,得到反应函数:q1=1/2(1-1/2q2h-1/2q2l)=1/2(1-Eq2)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确不完全信息古诺模型求解(二)企业2的反应函数q2h=1/2(3/4-q1) (1)q2l=1/2(5/4-q1) (2)企业1的反应函数q1=1/2(1-1/2q2h-1/2q2l) (3)解方程(1)、(2)、(3)得到:q1*=1/3,q2l*=11/24,q2h*=5/24在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确完全信息与不完全信息情况下古诺模型比较假设企业2的成本为3/4,得到均衡产量为q1=1/41/3,q2=1/21/3如果企业2的成本为5/4,得到均衡产量为q1=5/121/3,q2=1/61/3与完全信息相比,不完全信息情况下,企业1面对低成本企业选择的产量相对较低,面对高成本企业选择的产量相对较高,其原因在于:企业1生产预期的最优产量,高于完全信息下面对低成本竞争对手时的产量,低于完全信息下,面对高成本竞争对手时的产量,企业2对此做出反应。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确古诺模型:完全信息和不完全信息1/4 1/3 5/12 1/2 11/24 5/24 1/6q1(q2)q2l(q1)q2h(q1)q1q2在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、不完全信息情况下公共产品的提供鲍弗瑞和罗森塞尔(Palfrey and Rosenthal,1989)模型两个参与人同时决定是否提供公共产品,提供或不提供,如果至少有一个人提供,每人得到一单位好处;如果没有人提供,每人得到0单位支付,参与人i提供公共产品的成本是ci公共产品的收益是共同知识,提供的成本只有自己知道,假定c1,c2具有相同的定义在 上的分布函数P(.),其中 , 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确不完全信息公共产品博弈1-c1,1-c21-c1,11,1-c10,0 参与人2 提供 不提供提供不提供参与人10 ci* 2P(0)=0 P(ci*)=ci*/2 P(2)=1在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确不完全信息公共产品提供的解最大化行为意味着,只有当参与人i预期对方j不提供时,参与人才会考虑自己是否提供。
假设对方提供公共产品的概率为zj,则参与人i提供公共产品的条件为:1-ci>zj+(1-zj)0=zj,即只有1-zj>ci,参与人才会提供存在一个分割点(cutoff),使得ci[c,ci*]时,参与人才会提供求解ci*:1-ci*=cj*/2,1-cj*=ci*/2,求得ci*=cj*=2/3,即当只当cic*,参与人i提供在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、一级密封价格拍卖(the first-price sealed auction)当一件物品对买者的价值买者比卖者更清楚时,卖者一般不愿意首先提出价格,而常常采用拍卖的方式获得可能的最高价格一级密封价格拍卖是许多拍卖方式的一种,在这种拍卖中,投标人同时将自己的出价写下来转入一个信封,密封后交给拍卖人,拍卖人打开信封,出价最高者是赢者,按他的出价支付价格,拿走被拍卖的物品在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一级密封价格拍卖(一)以两个人为例 两个人对拍卖品分别有自己的主观判断,称其为对拍卖品的保留价格v,假设两人都不清楚对方的保留价格,只知道对方的保留价格为一均匀分布于[0,1]上的随机值。
记局中人的最佳叫价为b(v),由经验常识,假设函数b(v)严格单增是合适的,在此假设下,其反函数存在,记为V(b),反映的是叫价为b的局中人真实的保留价格在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一级密封价格拍卖(二) 当某人叫价b时,获胜的概率当然是对方叫价低于b的概率,或者等价地说,是对方的保留价格低于V(b)的概率——由于局中人对该物品的保留价格是闭区间[0,1]上的均匀分布,这一概率就等于V(b)所以,一个具有保留价格v、叫价b的竞价者的期望支付为: V(b)(v-b)+(1-V(b))0 从而他的目标是: max V(b)(v-b) 其一阶条件为:V(b)/(v-b)-V(b)=0, 即V(b)/(V(b)-b)-V(b)=0 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一级密封价格拍卖(三)等价于:[V2(b)/2]/=[bV(b)]/恒等式两端对b求不定积分得到:V2(b)/2=bV(b)+c显然当某人对一个物品的保留价格是0时,它最优的叫价也是0,即V(0)=0,将这一初始条件带入上式可求得c=0。
从而V(b)=2b,或b=v/2竞价者的最优战略是以自己保留价格的一半作为叫价在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一级密封价格拍卖(四) 如果有n人参与竞标,则b=(n-1)v/n,即b随n的增加而增加,特别地,当n时,bv,就是说,投标人越多,卖者能得到的价格就越高;当投标人趋于无穷时,卖者几乎得到买者价值的全部因此,让更多的人加入竞标是卖者的利益所在在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第三节贝叶斯均衡与混合战略均衡196实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确贝叶斯均衡与混合战略有不少人认为完全信息博弈中的混合战略均衡仅仅只是理论上的概念,但在现实生活中确实难以理解的针对这一点,海萨尼(1973)对混合战略提出了另一种解释其思想是,只要在原来的博弈中加入少许不完全信息因素,得到(单纯战略)贝叶斯均衡就与完全信息下的混合战略均衡相似在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确 性别战2,4+20,0音乐会1,14+1,2足球音乐会足球男方女方支付 b/ 1-b/a/0 a(b) p=a/或者p=b/1-a/在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确“性别战”的重新构造完全信息情况下的“性别战”加上不完全信息,想象两人还不十分了解,当双方都去看足球赛时男士得到的支付是4+1,双方都去听音乐会时女士得到的支付为4+2。
两人知道自己的类型,但不清楚对方值的大小,只知道对方的值是均匀地分布在区间[0,]上的随机变量如果男士的类型1不小于某一临界值a,他选择“足球”,否则选择“音乐会”;如果女士的类型2不小于某一临界值,她选择“音乐会”,否则选择“足球”在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确“性别战”求解男士选择足球的条件: b/(4+1)+(-b)/1>b/0+(-b)/2 整理后得到男士选“足球”的充要条件: 1>/b-5=a女士选择“音乐会”的充要条件是: 2>/a-5=b联立两个条件中的等式,解得 a=b=在上述贝叶斯均衡中,两个局中人使用的都是单纯战略,因为不知道对方的类型,感觉面对的像是混合战略的博弈对手如果令为0,男士选足球的概率(-a)/趋于4/5但不完全信息消失时,贝叶斯均衡趋向于完全信息下的混合均衡 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第四节机制设计原理与显示原理201实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、机制设计(mechanism design)机制设计是一种特殊的不完全信息博弈,委托人(principal)选择设计机制,给代理人足够的激励,促使代理人(agent)说实话(获取真实信息),也可以最大化委托人的期望效用。
委托人设计机制面临两个约束:(1)参与约束(participation constraint)或称个人理性约束(individual rationality constraint):代理人在该机制下得到的期望效用不小于他在不接受这个机制时得到的最大期望效用2)激励相容约束(incentive-compatibility constraint):代理人在所设计的机制下必须有积极性选择委托人希望他选择的的行动在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确机制设计满足参与约束的机制称为可行机制,满足激励相容约束的机制称为可实施机制,满足两个约束条件的机制称为可行的可实施机制委托人的目的是选择一个可行的可实施机制以最大化他的期望效用典型的机制设计是一个三阶段不完全信息博弈:第一阶段:委托人设计机制,即博弈规则,代理人根据规则发出信号(message),实现的信号决定配置结果(allocation);第二阶段:代理人同时选择接受或不接受委托人设计的机制;第三阶段:接受机制的代理人根据机制的规定进行博弈在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确机制设计案例 机制设计的案例有很多:拍卖、垄断企业定价、政府税收政策的制定、政府对垄断企业的规制、公共产品的供给、雇主对雇员职位的安排、保险公司的收费和赔偿政策等。
在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确机制设计案例分析(一)《圣经》上索罗门国王对孩子所有权的判定: 两个代理人:A、B 私人信息:孩子对于A、B两人的价值分别为CA,CB 索罗门国王的处置方式:将孩子切成两半 A、B两个人按照所罗门国王设计的机制采取行动:私人信息配置结果 存在问题:代理人可以模仿其他人的反应在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确机制设计案例分析(二)King Econ’ game采取处罚措施:让A先行动,如果放弃得0,如果向B挑战需要付出FB如果接受A的选择,放弃孩子则得0,如果不放弃,向A挑战,则需要付出EA再进入下一个迎接挑战的循环在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确ABA(0,CB)(CA,0)(-F,CB-E)(CA-E-F,-F)Give upAssertAcceptChallege, bide E and A pays FDon’t matchChallege, match E and B pays FKing Econ’ game在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确King Econ’ game假设A是孩子的亲生母亲,则有CA>CB,B知道她如果要得到孩子,必须付出足够的E使得A放弃,即有-F>CA-E-F,即E>CA,则有CB 假设B是孩子的亲生母亲,则有CA 设只有两个投标人,他们的估价类型V1,V2都是[0,1]上的标准分布说实话的直接机制是这样设计的:(1)两投标人同时声明V1/,V2/;(2)投标人中中标的概率为qi=V1//2,中标的价格为pi=V1//由于Vi[0,1],因此Vi/[0,1],q1+q21其中为代定参数,是决定投标人都说实话是否能成为贝叶斯纳什均衡的关键在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确假定两投标人的声明是线性齐次的,具有:Vi/=aiVi的形式,则投标人i声明Vi/的期望收益为:对投标人i来讲,均衡条件是找出ai使期望收益最大其一阶条件为ai=/2所谓说实话,即ai=1,Vi/=Vi因此,当=2时,也就是中标价格为中标人声明估价(也是真实股价)的一半时,上述直接机制使得两投标人都讲真话是贝叶斯纳什均衡显示原理显示原理在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确0,00,1B1,0-1,-1ABA厂商1厂商2支付作业1请用下面这个两市场博弈验证海萨尼关于混合策略和不完全信息博弈关系的结论。 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确v1-1,v2-1v1-1, v2v1,v2-10,0 参与人2 提供 不提供提供不提供参与人1作业2:公共物品的提供支付如下所示,成本为1,收益为私人信息,分别为v1,v2,其中v1,v2分别均匀分布于[0.75,1.75],[1,2]区间上,求贝叶斯纳什均衡在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第四章 不完全信息动态博弈精炼贝叶斯纳什均衡信号传递博弈及其应用举例KMRW声誉模型214实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第一节精炼贝叶斯纳什均衡215实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、不完全信息动态博弈特点“自然”首先选择参与人的类型,参与人自己知道,其他参与人不知道;参与人开始行动,后行动者能观测到先行动者的行动,但不能观测到先行动者的类型;后行动者通过观察先行动者所选择的行动来推断类型或修正对其类型的先验信念(概率分布),然后选择自己的最优行动;先行动者预测到自己的行动将被后行动者所利用,就会设法选择传递对自己最有利的信息,避免传递对自己不利的信息。 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、贝叶斯法则先验概率(prior probability):修正之前的判断;后验概率(posterior probability):修正之后的判断贝叶斯法则:假定参与人i有K个类型,有H个行动,用k和sh分别代表一个特定的类型和战略,假定i属于k的先验概率是p(k)0,p(k)=1,i选择sh的条件概率为p(shk),p(shk)=1 假如观测到i选择了sh,i属于类型k的后验概率Prob(ksh)有以下公式存在:在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确贝叶斯法则举例假定现实中分为好人(1)和坏人(2)(type),所有的事分为好事(s1)和坏事(s2)(strategy),那么一个人干好事的概率p{s1}就等于他是好人的概率p(1)(先验概率)乘以好人干好事的概率p(s11),加上他是坏人的概率p(2)乘以坏人干好事p(s12)的概率,即p{s1}=p(s11)p(1)+p(s12)p(2)(边缘概率)。 假定观测到一个人干了一件好事,那么这个人是好人的后验概率为:在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确贝叶斯法则举例假设认为这个人是好人的先验概率为1/2,那么在观测到他干了好事之后来修正他是好人的先验概率依赖于这件事好到什么程度假设这件事非常好,好人一定干,坏人一定不干,则有p(s11)=1, p(s12)=0,那么后验概率Prob(1s1)=(1*1/2)/(1*1/2+0*1/2)=1假设这是一件非常一般的好事,好人会干,坏人也会干,则有p(s11)=1, p(s12)=1,后验概率Prob(1s1)=(1*1/2)/(1*1/2+1*1/2)=1/2假设介于上述两种之间,好人肯定会做,坏人可能做也可能不做,则有p(s11)=1, p(s12)=1/2,后验概率Prob(1s1)=(1*1/2)/(1*1/2+1/2*1/2)=2/3在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、精炼贝叶斯均衡(PBNE)PBNE是不完全信息动态均衡的基本均衡概念,是泽尔腾的完全信息动态博弈子博弈精炼纳什均衡(SPNE)和海萨尼的不完全信息静态博弈贝叶斯均衡(BNE)的结合。 BNE中,参与人的信念是事前给定的,均衡概念没有规定参与人如何修正自己的信念SPNE要求均衡战略不仅在整个博弈上构成纳什均衡,而且要求在每个子博弈上构成纳什均衡,剔除了那些包含不可置信威胁的战略PBNE要求,给定每一个参与人有关其他参与人类型的后验信念,参与人的战略组合在每一个后续博弈(continuation game,每一个信息集开始的博弈的剩余部分,不同于开始于单结信息集的子博弈)上构成贝叶斯均衡在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、精炼贝叶斯均衡(PBNE)精炼贝叶斯均衡( PBNE )是贝叶斯均衡、子博弈精炼均衡和贝叶斯推断的结合PBNE要求:(1)在每一个信息集上,决策者必须有一个定义在属于该信息集的所有决策结上的一个概率分布(信念);(2)给定该信息集上的概率分布和其他参与人的后续战略,参与人的行动必须是最优的;(3)每一个参与人根据贝叶斯法则和均衡战略修正后验概率在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确精炼贝叶斯均衡的定义精炼贝叶斯均衡是一个战略组合s*()=(s1*(1),…,sn*(n))和一个后验概率组合 ,满足:(P)对于所有的参与人i,在每一个信息集h,存在 ,或者说,参与人的战略是序贯理性的,即在每个参与人的信息集中,给定这个人的信念以及其他参与人的战略,他在该信息集中的选择以及之后的行动是他在这些前提下的最优行动。 B) 是使用贝叶斯法则从先验概率pi(-ii),观测到的最优战略s*得到的在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确精炼贝叶斯均衡定义的阐释精炼贝叶斯均衡是均衡战略和均衡信念的结合: 给定信念 ,战略s*=(s1*,…,sn*)是最优的;给定战略s*=(s1*,…,sn*),信念 是使用贝叶斯法则从均衡战略和所观测到的行动得到的在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确四、精炼贝叶斯均衡求解SPNE的缺点:有不完全信息、不完美信息时无法检验决策情境在均衡中加入信念的好处:给定均衡状态,可检验每一种情境求解方法: (1)确定均衡型态(s1,s2…p1,p2…) (2)给定信念,选择均衡在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确123(4,4,4) (1,1,1) (5,5,0) (2,2,2)LRRLDdAa(3,3,0)1-pp例一:有哪些均衡? 哪些均衡有问题?在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确3,3,0 5,5,04,4,4 4,4,43,3,0 2,2,21,1,1 1,1,1ADADa d a d L R纳什均衡(D,a,L)、(A,a,R)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确123(4,4,4) (1,1,1) (5,5,0) (2,2,2)LRRLDdAa(3,3,0)1-pp检验纳什均衡(D,a,L)、(A,a,R)当当3 3选择选择L L时,,2 2的理性的理性选择是是d d,,而非而非a a,,排除排除( (D,a,L)D,a,L)L: 4P+(1-L: 4P+(1-P)0=4PP)0=4PR: P+(1-P)2=2-PIf: p 2/5,,3选RPBE:PBE:(A,a,R)+p 2/5在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确123(-1,0,1) (3,0,2) (0,3,2) (0,-1,1)udduuudd(0.5,0.5,4)1-pp练习:有哪些均衡? 哪些均衡有问题?在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确-1,0,1-1,0,10,3,20.5,0.5,43,0,23,0,20,-1,1 0.5,0.5,4ududu d u d u d纳什均衡(d,u,u)、(u,u,d)、(u,d,d)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确123(-1,0,1) (3,0,2) (0,3,2) (0,-1,1)udduuudd(0.5,0.5,4)1-pp检验(d,u,u)、(u,u,d)、(u,d,d)如果如果3 3选选d,2d,2的最佳的最佳选择是是d,d,排除排除(u,u,d)(u,u,d)PBE: PBE: (u,d,d)+p(u,d,d)+p 1/21/2PBE: (d,u,u)+p<1/2PBE: (d,u,u)+p<1/2在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第二节信号传递博弈及其应用举例231实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、信号传递博弈(signaling games)是一种比较简单但有广泛应用意义的不完全信息动态博弈(斯宾塞,1974)博弈中有两个参与人,1的类型是私人信息,为信号发送者;2的类型是公共信息,为信号接收者。 博弈顺序(1)“自然”首先选择1的类型,2只知道1属于的先验概率p=p();(2)1在观测到类型后选择发出信号mM,M={m1,…,mJ}是信号空间;(3)2观测到m(而非)使用贝叶斯法则从先验概率p得到后验概率 ,然后选择战略s;(4)支付函数分别为u1(m,s,),u2(m,s,)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确信号传递博弈的精炼贝叶斯均衡信号传递博弈的精炼贝叶斯均衡是战略组合(m*(),s*(m))和后验概率 的结合,它满足: (P1)s*(m)极大化 u2(m,s,) (P2)m*()极大化u1(m,s*(m),); (B) 是参与人2使用贝叶斯法则从先验概率p=p()、观测到的信号m和参与人1的最优战略m* ()得到的在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确分离均衡(Separating equilibrium)不同类型发送者以1的概率选择不同信号,或者说,没有任何类型选择与其他类型相同的信号。 在分离均衡下,信号准确地揭示出类型如果m1是类型1的最优选择,m1就不可能是2的最优选择,并且,m2一定是类型2的最优选择,即:u1(m1,s*(m), 1)>u1(m2,s*(m), 1) u1(m2,s*(m), 2)>u1(m1,s*(m), 2) 后验概率为:在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确混同均衡(pooling equilibrium)不同类型的发送者选择相同的信号,或者说,没有任何类型选择与其他类型不同的信号,因此,接收者不修正先验概率假定mj是均衡战略,那么: u1(mj,s*(m), 1)u1(m,s*(m), 1) u1(mj,s*(m), 2) u1(m,s*(m), 2)在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确例一:市场进入博弈假定有两个时期,市场上一个垄断企业在生产,潜在的进入者考虑是否进入如果进入,两个企业进行古诺博弈,否则在位者仍是一个垄断者在位者有两个类型,高成本与低成本,其概率分别为q,1-q(先验信念)。 进入者只有一个类型,进入成本为2如果进入,生产成本函数与高成本的在位者相同如果是高成本,单阶段最优价格为p=6;如果是低成本,单阶段最优价格为p=5在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确市场进入博弈N在位者在位者进入者进入者高低P=4 P=5 P=6 P=4 P=5 P=6 进 不不 进 不不 进 不不 进 不不 进 不不 进 不不第一阶段 (2,0) (2,0) (6,0) (6,,0)(7,0)(7,0) (6,0)(6,0)(9,0)(9,0)(8,0)(8,0)第二阶段 (3,1) (7,0) (3,1) (7,0)(3,1)(7,0) (5,-1)(9,0)(5,-1)(9,0)(5,-1)(9,0)q1-q在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确市场进入博弈求解(一)单阶段最优垄断价格p=6(高成本)或p=5(低成本),不是精炼贝叶斯均衡如果进入者这样选择,则后验概率q~(6)=1(选择p=6证明在位者是高成本),q~(5)=0(选择p=5证明在位者是低成本)给定后验概率,当观测到在位者选择p=6,进入者选择进入,在位者两期利润=7+3=10;而如果模仿低成本企业,选择p=5,则得到两期利润=6+7=13。 因此p=6不是高成本在位者的最优选择在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确市场进入博弈求解(二)假定q1/2,得到混同均衡,两类在位者选择相同的价格给定进入者的后验概率和战略,如果高成本选择p=6,进入者进入,u1=7+3=10,如果选择p=5,进入者不进入,u1=6+7=13,p=5是高成本的最优选择;如果低成本选择p=5,u1=9+9=18,大于选择其他任何价格时的利润,p=5是低成本的最优选择给定两类在位者都选择p=5,进入者不能从观测到的价格中得到任何新的信息,即后验概率q~=1*q/(1*q+1*(1-q))=q1/2,(式中的1分别为高成本、低成本时在位者选择p=5的概率)进入的期望利润q*1+(1-q)*(-1)0,不进入的期望利润为0,因此不进入是最优的在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确市场进入博弈求解(三)假定q1/2,得到分离均衡,两类在位者选择不同价格如果不同类型在位者选择相同的价格,进入者得不到新的信息,将选择进入,因为q*1+(1-q)*(-1)=2q-10。 给定进入者一定会进入,在位者的最优选择是p=6(高成本)或p=5(低成本),前面已经证明不是一个均衡给定进入者的后验概率和战略,低成本在位者选择p=6(认为他是高成本,进入),u1=8+5=13;选择p=5,进入者进入,u1=9+5=14;选择p=4,进入者不进入, u1=6+9=15,最优战略为p=4,进入者不进入给定进入者的后验概率和战略,高成本在位者选择p=4,进入者不进入,u1=2+7=9;选择p=5,进入者进入, u1=6+3=9;选择p=6,进入者进入,u1=7+3=10,因此p=6是最优的在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、Education game工人:U(e,w;)=w-e/,e为信息,w为工资,为劳动者的素质,其中高生产率者H的概率为P,低生产率者L的概率为1-P,=E[]雇主:U(w,)=-w,(e):给定教育程度时能力的概率分布,如果雇主完全竞争,则工资就等于劳动者的期望工作能力,即w(e)=(He)* H+ (Le)* L行动顺序为工人先选择e,雇主根据e支付w, PBE为何?在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确Education game的解法(一)均衡定义与分类: (eH,eL,(•e))(1)Pooling: eH=eL;(2)Separating: eHeL(3)HybridPooling: eH=eL=eP,, 信念:(HeP) =P, (HeeP)=0 =w(e=eP)=p* H+(1-p)* L H: -ep/H L L: -ep/L L 当ep p L( H-L)时均衡成立。 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确Education game的解法(二)Separating: eH eL,eL=0 信念:(HeH) =1, (HeL)=0, 假设:(HeeHoreL)=0 如果不等式左边代表e=eH,, 不等式右边e=eL=0,则有 H: H-eH/H L(高生产率者选择eH) L: H-ep/L L (低生产率者选择eL) 当L( H-L) eHH( H-L)时均衡成立在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确Education game的解法(三)Hybrid (1) H: eH ; L: eH or eL(eL=0) 当pL( H-L) eHL( H-L)时可成立(2) H: eH or eL (eL=0); L: eL=0 当(1-p)H( H-L) eHH( H-L)时可成立在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确讨论:顺序的重要性可能有多重均衡如果改成由公司先行动:只有一个可能的均衡经验:拥有信息的人先行动,均衡多;处于信息劣势的一方先行动,均衡唯一。 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第三节KMRW(Kreps-Milgrom-Roberts-Wilson,1982)声誉模型246实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确简化的KMRW声誉模型市场上有大小两个厂商1,2,博弈分两个阶段,在第1阶段,厂商1降低产品价格挑起价格战(战),也可以选择和平相处(和),厂商2在第二阶段选择“退出” 和“留下”厂商1有“强”、“弱”两种类型,其概率分别为p,1-p,假设“强”厂商始终选择“战”厂商1选择“战”,厂商2在每期的支付为F2(第二期退出支付为0);如果对方选“和”,厂商2在每个阶段的支付为A2,满足F20A2厂商1选“战”、“和”时每期的利润分别是F1、A1,如果第二阶段厂商2退出,厂商1获得垄断利润M1,三者的关系是F1A1M1,假设跨时贴现因子为[0,1]在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确N厂商1厂商1厂商2厂商2强 p弱 1-p战 和战 和留下退出留下退出留下退出留下退出声誉模型在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确声誉模型的解题思路“强”厂商1的战略已经假设总选择“战”,模型的重点是“弱”厂商会选择什么样的战略。 从单期看,因为F1 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确声誉模型:混同均衡混同均衡的特点:不同类型的参与人选择相同的均衡战略,此时,参与人的行动不会暴露他的真实类型混同均衡的条件:如果两种厂商1都选“战”,没有给厂商2任何辨别的信息,厂商2看到对方行动后的信念等于先验概率:p{1=强战}=p;“弱”厂商1确定可以吓退对手,才值得选“战”,即厂商2在第二阶段期望支付小于零: pF2+(1-p)A2<0,如果这个不等式成立,并且有:(1+)A1 博弈论是方法导向:给定信息结构,什么是可能的均衡结果信息经济学是问题导向:给定信息结构,什么是最优的契约安排在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、基本分类及应用举例信息经济学的分类信息经济学的分类:一是依据非对称发生的时间,二是依据非对称信息的内容,分类如下:隐藏行动隐藏信息事前逆向选择模型信号传递模型信息筛选模型事后隐藏行动的道德风险模型隐藏信号的道德风险模型在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确逆向选择与道德风险 逆向选择逆向选择:在鉴定交易契约前,进行市场交易的一方可能因为占据信息优势,做出对自己有利,对另一方有害的事情,从而降低了市场效率,甚至可能导致这一市场的萎缩道德道德风险:是指交易双方签订契约后,处于信息优势的一方在使自己利益最大化的同时,损害了处于信息劣势一方的利益,而且不承担由此造成的全部后果在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确委托—代理问题委托人(principal)与代理人(agent)的概念来自法律,经济学上的委托—代理关系泛指任何一种涉及非对称信息的交易,交易中有信息优势的一方称为代理人;不具有信息优势的一方称为委托人。 存在原因:保险与信用是暂时的;代理人试图从委托人那里获得更多的收益在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确隐藏行动的道德风险模型(moral hazard with hidden action)签约时信息是对称的;签约后,代理人选择行动,自然选择状态;代理人的行动和自然状态一起决定某些可观测的结果;委托人只能观测到结果,而不能直接观测到代理人的行动本身和自然本身状态委托人的问题是设计一个激励合同以诱使代理人从自身利益出发选择对委托人最有利的行动例如:雇主与雇员的关系;保险公司与投保人;员工与经理;房东与住户;公民与政府官员等在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确隐藏信息的道德风险模型(moral hazard with hidden information)签约时信息是对称的;签约后,自然选择状态;代理人观测到自然的选择,然后选择行动;委托人观测到代理人的行动,但不能观测到自然的选择委托人的问题是设计一个激励合同以诱使代理人在给定自然状态下选择对委托人最有利的行动。 例如:企业经理与销售人员的关系;股东与经理;债权人与债务人;原告(或被告)与代理律师等在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确逆向选择模型(adverse selection)自然选择代理人的类型;代理人知道自己的类型,委托人不知道;委托人和代理人签订合同例如:卖者和买者的关系;保险公司和投保人;雇主与雇员;债权人与债务人等在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确信号传递模型(signaling model)自然选择代理人的类型;代理人知道自己的类型,委托人不知道;为了显示自己的类型,代理人选择某种信号;委托人在观测到信号之后与代理人签订合同例如:雇主与雇员的关系;买者与卖者在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确信息甄别模型(screening model)自然选择代理人的类型;代理人知道自己的类型,委托人不知道;委托人提供多个合同供代理人选择,代理人根据自己的类型选择一个最适合自己的合同,并根据合同选择行动。 例如:雇主与雇员的关系;垄断者与消费者;保险公司与投保人在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确说明习惯上委托-代理理论是指隐藏行动道德风险模型逆向选择理论包括了信号传递模型与信息甄别模型在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第二节委托-代理理论的基本分析框架保险市场与道德风险激励机制设计的基本思想委托-代理论的基本分析框架264实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、保险市场与道德风险 消费者购买保险后,如果意外损失可以得到全部保险,即全部保险,那么他会放弃一些预防意外事故发生的措施,引起意外事件发生的概率提高;如果保险金额小于意外损失,即部分保险,与完全信息条件相比,投保人倾向于减少预防不测事件发生费用的支出在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、激励机制设计的基本思想 委托人想使代理人按照前者的利益行动,但不能直接观察到代理人的行动,能观察到的另一些变量,是由代理人的行动与其他外生的随机因素共同决定的。 委托人的问题是如何根据观测到的变量奖惩代理人,以激励选择对委托人最有利的行动在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确激励机制设计分析如表所示:如果委托人确定w=10,那么代理人选择不努力工作;如果委托人按利润支付工资,在利润为10、20,w=10,在利润为40,w=20,代理人选择不努力工作的收入为10,选择努力工作的预期收益为13,代理人选择努力工作在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确激励机制设计分析运气坏(=0)运气好(=1)工作不努力(a=0,c=0)1020工作努力(a=1,c=2)2040利润经理表现外在环境在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、委托—代理理论分析的基本框架委托人设计契约,预期效用最大:Ev=v(a,w,)g()d,v(a,w,)=(a,)-w()](1)代理人接受契约,使自身效用最大:Eu=u(a,w,)g()d,u(a,w,)=h(w)-c(a) 委托人面临的第一个约束,预期效用大于机会效用:Eu=u(a,w,)g()du*(2)(IR);面临的第二个约束为激励相容条件,即代理人能够按照委托人设计的努力程度工作,Eu(a,w)Eu(a’,w)(3)(IC)最优激励机制设计可以概括为:(1)、(2)、(3) 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确最优激励合同如果代理人选择了某一契约,那么就可以根据激励机制方程计算出相应的w*,根据w*,确定代理人努力程度a。 委托人根据代理人创造的利润与付出的努力制定相应的工资,并通过观察代理人的行为,相应调整工资水平,促使代理人努力工作,使代理人承担了更多的风险在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第三节 最优激励合同对称信息下的最优风险分担合同对称信息下的最优激励合同不对称信息下的最优激励合同271实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、对称信息下的最优风险分担合同如果委托人和代理人都是严格风险规避的,最优风险分担要求每一方都承担一定的风险;如果委托人是风险中性者而代理人是严格风险规避者,那么代理人得到固定收入,委托人承担所有风险;如果委托人是严格风险规避者而代理人是风险中性者,委托人得到固定收入,代理人承担全部风险在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、对称信息下的最优激励合同当委托人可以观测到代理人的努力水平时,怕累托最优风险分担和帕累托最优努力水平可以同时实现:委托人要求代理人选择最优努力程度a*,委托人根据努力程度支付代理人;否则,代理人得到最低支付。 如果委托人不能观测到代理人的努力水平和外生变量,而代理人是风险规避的,帕累托最优是无法实现的,最优激励合同要求代理人承担比对称信息情况下更大的风险如果代理人的行动不可观察,而代理人是风险中性的,帕累托最优可以实现在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、不对称信息下的最优激励合同如果委托人是风险中性的,在对称信息下,帕累托最优风险意味着代理人得到固定收入,不承担任何风险;在非对称信息下,代理人必须承担一些风险给定产出,如果代理人不努力时的概率大于努力的概率,w将减小;如果在代理人努力时的概率大于不努力时的概率,w将增加在合同中增加其他不需要成本的变量:如相对业绩比较,例如,同一行业不同企业的经营业绩除了受每个企业经营者的行为和特有的外生因素影响外,也受到行业性共同因素影响在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第四节 多阶段博弈动态模型显性激励机制代理人市场-声誉模型棘轮效应(鞭打快牛)275实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、显性激励机制 在静态模型中,委托人不能观测代理人的行动,为了诱使代理人选择委托人所希望的行动,委托人必须根据可观测的行动结果来奖惩代理人。 这样的激励机制称为显性激励机制在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、代理人市场-声誉模型 主要观点:在竞争的经理市场,经历的市场价值从而收入决定于其过去的经营业绩,从长期看,经理必须对自己的行为负完全的责任;因此,即使没有显性激励机制合同,经理也有积极性努力工作,因为这样做可以改进自己在经理市场上的声誉,从而提高未来的收入在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、棘轮效应 如果用代理人过去的业绩作为现在业绩的评价标准,那么会出现以下情况:代理人越努力,好业绩出现的可能性越大,评价“标准”也就越高;当代理人预测到他的努力将提高评价“标准”时,他努力的积极性也就下降了这种标准随业绩上升的趋向被称为“棘轮效应”在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确两种模型的比较声誉模型:根据代理人过去的业绩推段经理的经营能力将强化激励机制;传递的信息是有关经理的经营能力的信息,经营能力的所有权属于经理;经营业绩越好,市场所认为的经营能力越高,经理的报酬也越高。 棘轮效应模型:根据代理人过去的业绩推断企业的内在生产率将弱化激励机制;过去的业绩传递的是有关企业内在生产能力的信息,企业内在生产能力的所有权属于委托人;经营业绩越好,委托人认为的企业的内在生产能力越高,经理给委托人上缴的份额越高,因此,经理努力工作的积极性下降在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第六章 逆向选择与信号传递逆向选择:旧车市场保险市场上的逆向选择问题逆向选择与信贷市场的配给制信号传递:斯宾塞劳动力市场模型在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第一节逆向选择:旧车市场281实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确逆向选择的定义 在鉴定交易契约前,进行市场交易的一方可能因为占据信息优势,做出对自己有利,对另一方有害的事情,从而降低了市场效率,甚至可能导致这一市场的萎缩在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确旧车市场简述 在旧车市场,卖者拥有信息,买者缺乏信息,买者以平均质量的价格购买旧商品,将质量较高的旧商品逐出市场,质量较差的旧商品留在市场。 在均衡的情况下,只有低质量的车成交,在极端情况下,市场可能根本不存在,交易的帕累托改进不能实现在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确Akerlof:the market for lemons旧车市场有多个潜在的买者与卖者,卖者知道自己出售的车的质量,买者不知道,但知道的分布函数F(),买者与卖者均为风险中性买者出价P,卖者决定接受或不接受,如果接受,买者、卖者的效用分别为:B=V()-P、S=P-U(),且有V()U(),如果不接受,双方的效用均为0在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确一、买卖双方有相同的偏好,只有两类卖主两类卖主:=6000(高质量)或=2000(低质量),每一种的概率各为1/2;买卖双方有相同的偏好且对车的评价等于车的质量:V()=U()=当买者不知道车的质量时,当两类车都进入市场,车的平均质量E=4000,买者愿意出的最高价格为P=4000;高质量的车退出市场,平均质量再次下降,唯一的均衡是P=2000,只有低质量的车成交,高质量的车逐步退出市场。 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确oxpSHSLpHpLPL’旧车市场与逆向选择在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、买卖双方偏好相同,但卖主的类型连续分布假定车的质量在[2000,6000]区间上均匀分布,密度函数为1/4000如果所有的车都在市场出售,消费者愿意购买的价格为车的预期质量E=4000P=4000E=3000P=3000E=2500P=2500…P=2000,唯一的均衡价格是P=2000在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、买卖双方偏好相同,但卖主的类型连续分布如果用需求曲线表示买者愿意支付的最高价格与市场上车的平均质量的关系,则有P=E;供给曲线表示市场上车的平均质量与价格的关系,则有 区间是动态的,因而密度函数为1/(P-2000)供求均衡意味着P=E,唯一的交点和均衡点在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确EP需求曲线供给曲线市场不存在在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、买者对车的评价高于卖者假定买者对旧车的评价高于卖者,即存在V()=b>U()=(b1),旧车的交易就会出现。 交易带来的净剩余为(b-1),买卖双方的讨价还价决定净剩余的分配卖者的供给曲线仍为E=P/2+1000买者的需求曲线为P(E)=bE均衡价格与均衡质量分别为:P=2000b/(2-b),(b1.5),E=min{2000/(2-b),4000}在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、买者对车的评价高于卖者如果b=1,回到分析二如果b1,均衡价格和均衡质量均高于上例;均衡价格和均衡质量都是b的增函数,买者与卖者的评价差距越大,均衡价格越高,交易量越大当b=1.2时,均衡价格等于3000,所有3000的车都进入交易,所有3000的车都退出交易,市场上出售的车的平均价格E=2500当b1.5时,所有的车都成交,所有的车都成交,平均质量为=4000,均衡价格为P=4000b在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确四、卖者的评价不同在现实中,不同的卖者对同样质量的车的评价一般也是不相同的,假定U()=(1+),(是一个均值为0的随机变量);当(1+)P,卖者才会卖车。 给定,市场上出售的车的平均质量为:E(P,)=P/2(1+)+1000,如果买者知道,他就可以知道市场上出售的车的质量均衡交易量取决于买者评价参数b以及卖者评价参数的共同作用在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第二节保险市场上的逆向选择问题293实用文档在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确保险市场假设一家保险公司想提供汽车失窃保险,经调查发现,不同社区失窃情况差别很大,有的社区失窃率高,有的失窃率低,保险公司根据平均失窃率提供保险,结果如何?假设n个人投保,投保价格p=P/x,汽车失窃率为,则保险公司的预期利益为:=-n(x-P)+n(1-)P=-n(1-p)x+n(1-)px,如果保险市场是完全竞争市场,则有=0,=p,即投保价格等于汽车失窃率在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确保险市场对应而言,失窃率高,投保价格高;失窃率低,投保价格低;如果采用平均失窃率,那么投保价格会高于失窃率低的社区,并将这一部分低风险的消费者挤出保险市场,保险公司利益受损,为逆向选择。 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确第三节 逆向选择与信贷市场的配给制在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确信贷配给 信贷配给是信贷市场上存在的一种典型现象,原因在于逆向选择现象存在,高风险的项目驱赶了低风险的项目在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确信贷市场信贷市场中,一般高风险与高收益成正比,银行不了解贷款者的类型,厂商知道自己的信息导致贷款利率与银行期望收益之间的变化如图所示,利率上升的(直接的)收益效应大于(间接的)风险效应,随r上升而上升;当r>r*时,利率上升的(间接的)风险效应超过(直接的)收益效应,随r的上升而下降,银行期望收益最大化的利率为r*在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确关于信贷市场的实例 例:两类项目其收益分别为:R1=2.4,成功的概率p=0.5;R2=1.5,p=0.8,其中高风险项目占1/4,低风险占3/4。 银行每单位贷款的期望收益: =0.725(1+r)(r0.5); =0.5(1+r) (0.5 信息信息筛选模型模型:是指在交易之前,处于信息劣势一方,以某种方式给出区分不同类型的市场信号,以求获得自己所取信息,以此解决在交易中所处的信息劣势地位 在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、斯宾塞劳动力市场模型斯宾塞劳动力市场模型斯宾塞劳动力市场模型:雇员的教育程度向雇主传递有关雇员能力的信息,原因在于,接受教育的成本与能力成反比,不同能力的人最优教育程度是不相同的在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、斯宾塞劳动力市场模型假定教育不影响劳动生产率假定教育不影响劳动生产率, 受教育程度e=0(不接受教育)、1(接受教育); 高生产率者(H)MRH=ARH=3,低生产率者(L)MRL=ARL=1,二者受教育成本分别为cH=1,cl=3; 厂商支付工资WH=MR(e=1)=3,WL=MR(e=0)=1在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、斯宾塞劳动力市场模型H:如果接受教育,净收益为WH-cH=2;如果不接受教育,净收益为WH-cH=1,H选择接受教育。 L:如果接受教育,净收益为WL-cL=0;如果不接受教育,净收益为WL-cL=1,L选择不接受教育;通过受教育传递了高、低生产率差别信息,得到均衡在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确二、斯宾塞劳动力市场模型存在问题:存在问题:(1)假设教育是连续的,教育水平如何确定,过高,H与L均选择不接受教育,过低,选择接受教育;(2)对于受教育者工资的制定,过高,都接受教育,过低,均不接受教育,以至教育无法起到传递生产率的作用均衡是不唯一的,有分离均衡与混同均衡在整堂课的教学中,刘教师总是让学生带着问题来学习,而问题的设置具有一定的梯度,由浅入深,所提出的问题也很明确三、信息筛选模型雇主先行动,提出合同菜单{w,e}(假定教育是连续的),雇员选择其中一个与雇主签约,根据合约接受教育e,得到w均衡是指存在一组合同和一个选择规则,使得(1)每一类型雇员在所有可选择的合同中选择一个最适合自己的合同(即能力的雇员选择(w,s) ,当只当对于所有的(w,s),U(w,s)U(w,s) );(2)雇主的利润不为负;(3)不存在新的合同使得选择提供该合同的雇主得到严格正的利润。
