
博奕论综述福州大学课件经管学院.ppt
62页清华诚志1博弈论(Game Theory) 黄建华Everam@13706943809清华诚志2 要想在现代社会做一个有文化的人,你要想在现代社会做一个有文化的人,你必须对博弈论有一个大致的了解必须对博弈论有一个大致的了解 ——保罗保罗·萨缪尔森(萨缪尔森(Paul Samuelson)) 清华诚志3人物介绍人物介绍——冯冯. .诺依曼诺依曼清华诚志4冯冯. .诺依曼诺依曼((John Von Neuman,,1903--1957 ))简历:简历:1 1、、19141914年,大学预科班年,大学预科班2 2、、19261926年布达佩斯大学数学博士学位年布达佩斯大学数学博士学位3 3、、19271927年一年一19291929年,年,柏林大学柏林大学和和汉堡大学汉堡大学担任数学讲师担任数学讲师4 4、、19311931年,普林斯顿大学的第一批终身教授年,普林斯顿大学的第一批终身教授5 5、、美国国家科学院美国国家科学院、秘鲁国立自然科学院和意大利国立林且学院等、秘鲁国立自然科学院和意大利国立林且学院等院的院士.院的院士. 6 6、、19541954年,美国原子能委员会委员年,美国原子能委员会委员7 7、、19511951年至年至19531953年任美国数学会主席.年任美国数学会主席. 贡献:贡献:1 1、、2020世纪最重要的数学家世纪最重要的数学家2 2、第一台电子计算机的发明者、第一台电子计算机的发明者3 3、化学、物理学、气象和原子能领域专家、化学、物理学、气象和原子能领域专家4 4、博弈论创始人(与摩根斯坦合著、博弈论创始人(与摩根斯坦合著《《博弈论与经济行为博弈论与经济行为》》))清华诚志5相关人物相关人物ØLloyd Shapley(2012年度诺贝尔经济奖) 哈佛大学文学学士,普林斯顿大学数学系博士;冯.诺依曼和摩根斯坦的继承者,研究合作博弈。
Ø塔克Ø库恩清华诚志6人物介绍人物介绍——约翰约翰. .纳什纳什清华诚志7约翰约翰. .纳什纳什((John Forbes Nash,,1928-- ))简历:简历:1 1、、19481948年,普林斯顿大学攻读博士学位年,普林斯顿大学攻读博士学位2 2、、1950-19511950-1951年,年, 《n人博弈的均衡点》,《非合作博弈》3 3、、19521952年,麻省理工任教年,麻省理工任教4 4、、19571957年,与年,与艾里西亚艾里西亚结婚结婚4 4、、19581958年,患精神分裂症年,患精神分裂症6 6、、19621962年,数学领域里的年,数学领域里的Nobel奖奖——Fields奖,因精神奖,因精神状况而未授予他状况而未授予他 5 5、、19941994年,诺贝尔经济学奖年,诺贝尔经济学奖 清华诚志8一、博弈论概述一、博弈论概述1 1、博弈论的发展、博弈论的发展¨1838年古诺(Cournot)对垄断竞争的数量分析被认为是数理经济学研究的起点,现代博弈论中最重要的纳什均衡有时被称为古诺-纳什均衡¨1883年伯特兰和1925年艾奇沃奇思研究了两个寡头的产量与价格垄断 ¨20世纪初,以数学家为主研究博弈问题,且大多专注于严格竞争博弈(双人零和博弈)。
典型成果:1913年则梅罗(Zemelo)给出定理说明国际象棋的输赢是严格确定的¨1944年John von Neumann(冯.诺依曼)和Oskar Morgenstern(摩根斯坦)的巨著《Game Theory and Economic Behaviour》出版,将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,标志着博弈论作为一门学科的建立研究合作博弈理论清华诚志9一、博弈论概述一、博弈论概述u1950年,图克(Tucker)最先提出并研究了“囚徒困境”,非合作博弈非合作博弈的经典例子u约翰.纳什于1951年提出纳什均衡纳什均衡概念,为非合作博弈的一般理论和谈判理论奠定了基础《n人博弈的均衡点》(1950),《非合作博弈》(1951) 利用数学的不动点定理,证明了均衡的存在性u20世纪60-80年代,合作博弈论和非合作博弈论得到很大发展,其应用从军事领域逐渐转向经济领域¨20世纪80年代至今,是博弈论的 完善和应用期¨1994年诺贝尔经济学奖被授予纳什、豪尔绍尼、泽尔滕三位博弈论研究者,之后还有摩里斯、斯宾赛等清华诚志10一、博弈论概述一、博弈论概述u理性假设 个体理性:非合作博弈 集体理性:合作博弈u不完全理性假设 演化博弈清华诚志11¨非合作博弈非合作博弈主要研究人们在利益相互影响的局势中如主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大,强调个人理性、个何选择策略使得自己的收益最大,强调个人理性、个人最优决策,其结果是有时有效率,有时则不然。
人最优决策,其结果是有时有效率,有时则不然 目前经济学家谈到博弈论主要指的是非合作博弈,目前经济学家谈到博弈论主要指的是非合作博弈,也就是各方在给定的约束条件下如何追求各自利益最也就是各方在给定的约束条件下如何追求各自利益最大化,最后达到力量均衡大化,最后达到力量均衡 清华诚志12清华诚志13清华诚志14囚徒困境的例子囚徒困境的例子¨A. W. Tucker的囚犯困境(Prisoner‘s Dilemma): 囚徒B-8,-80,-10-10,0-1,-1囚徒A 坦白抵赖坦白抵赖清华诚志15囚徒困境说明了什么囚徒困境说明了什么¨在(坦白、坦白)这个组合中,A和B都不能在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是谁也没有动力游离这个组合,因此这个组合是纳什均衡,也叫非合作均衡纳什均衡,也叫非合作均衡¨囚徒困境反映了囚徒困境反映了个人理性和集体理性的矛盾个人理性和集体理性的矛盾。
如果A和B都选择抵赖,各判刑1年,显然比如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑都选择坦白各判刑5 5年好得多当然,A和B年好得多当然,A和B可以在被警察抓到之前订立一个可以在被警察抓到之前订立一个" "攻守同盟攻守同盟" ",,但是这可能不会有用,因为它不构成纳什均衡,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定没有人有积极性遵守这个协定, ,显然最好的策显然最好的策略是双方都抵赖略是双方都抵赖. . 清华诚志16囚徒困境的意义囚徒困境的意义¨“囚徒的两难选择”有着广泛而深刻的意义个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果 清华诚志17清华诚志18博弈论的要素博弈论的要素¨参与人 (players)¨虚拟参与人(pseudo-player) ¨行动 (actions or moves) ¨行动的顺序 (sequence order)¨信息 (information) ¨共同知识(common knowledge) ¨战略(strategies) ¨支付payoff(效用utility) ¨均衡(equilibrium) 清华诚志19参与人 playersv一个博弈中的决策主体,他的目的是通过选择行动(或战略)以最大化自己的支付(效用水平)。
参与人可能是自然人,也可能是团体,如企业,国家等v重要的是:每个参与人必须有可供选择的行动和一个很好定义的偏好函数不做决策的被动主体只能被当作环境参数清华诚志20虚拟参与人pseudo-player¨为了分析方便,自然nature被当作虚拟参与人¨自然代表决定外生随机变量的概率分布的机制比如房地产开发中市场需求的大小清华诚志21行动 ACTIONS OR MOVES¨参与人在博弈的某个时点的决策变量坦白)¨N个参与人的行动的有序集称为行动组合(坦白,抵赖)清华诚志22行动的顺序¨对于博弈的结果非常重要有关静态和动态博弈的区分就是基于行动的顺序做出的¨同样的行动集合,行动的顺序不同,每个参与人的最后决策就不同,博弈的结果也不同尤其在不完全信息博弈中,后行动者依赖观察先行动者的行动来获取信息清华诚志23信息 information¨参与人有关博弈的知识,特别是有关自然的选择,其他参与人的特征和行动的知识¨完美信息perfect information:指一个参与人对其他参与人的行动选择有准确的理解,即每个信息集只包含一个值清华诚志24共同知识common knowledge¨所有参与人知道每一步的信息集。
清华诚志25战略strategies¨参与人在给定信息集的情况下的行动规则,它规定参与人在什么时候选择什么行动¨战略与行动:战略是行动的规则而不是行动本身¨在静态博弈中,战略和行动是相同的¨战略必须是完备的,要给出参与人在每一种可想象得到的情况下的行动选择清华诚志26支付payoff(效用utility)¨在一个特定的战略组合下参与人得到的确定效用水平,或是指参与人得到的期望效用水平清华诚志27均衡equilibrium¨指所有参与人的最优战略的组合清华诚志28三位大师主要的贡献三位大师主要的贡献¨19501950年和年和19511951年纳什的两篇关于非合作博弈论的重要年纳什的两篇关于非合作博弈论的重要论文,彻底改变了人们对竞争和市场的看法他证明论文,彻底改变了人们对竞争和市场的看法他证明了非合作博弈及其均衡解,并证明了均衡解的存在性,了非合作博弈及其均衡解,并证明了均衡解的存在性,即著名的纳什均衡从而揭示了博弈均衡与经济均衡即著名的纳什均衡从而揭示了博弈均衡与经济均衡的内在联系因为在现实世界中,非合作博弈要比合的内在联系因为在现实世界中,非合作博弈要比合作博弈普遍得多作博弈普遍得多。
清华诚志29Selten and Harsanyi¨泽尔腾(泽尔腾(19651965)将纳什)将纳什均衡的概念引入了动态均衡的概念引入了动态分析,提出了分析,提出了“精炼纳精炼纳什均衡什均衡”概念;以及进概念;以及进一步刻画一步刻画不完全信息动不完全信息动态博弈态博弈的的“完备贝叶斯完备贝叶斯纳什均衡纳什均衡” ¨海萨尼则发展了刻画海萨尼则发展了刻画不不完全信息静态博弈完全信息静态博弈的的“贝叶斯纳什均衡贝叶斯纳什均衡”((19671967--19681968)总之,他俩进一步将纳什之,他俩进一步将纳什均衡动态化,加入了接均衡动态化,加入了接近实际的不完全信息条近实际的不完全信息条件他们的工作为后人件他们的工作为后人继续发展博弈论,提供继续发展博弈论,提供了基本思路和模型了基本思路和模型 清华诚志30博弈的分类及对应的均衡静态动态完全信息完全信息静态博弈;纳什均衡纳什均衡;Nash(1950)完全信息动态博弈;子博弈精炼纳什均衡子博弈精炼纳什均衡;泽尔腾(1965)不完全信息不完全信息静态博弈;贝叶斯纳什均衡贝叶斯纳什均衡;海萨尼(1967-1968)不完全信息动态博弈,精炼贝叶斯纳什均衡精炼贝叶斯纳什均衡;泽尔腾(1975)Kreps,Wilson(1982),Fudenberg,Tirole(1991)清华诚志31主要思想¨博弈论并不是经济学的一个分支,它只是一种方法,博弈论并不是经济学的一个分支,它只是一种方法,这也是为什么许多人将其看成数学的一个分支的缘故。
这也是为什么许多人将其看成数学的一个分支的缘故博弈论已经在政治、经济、外交和社会学领域有了广博弈论已经在政治、经济、外交和社会学领域有了广泛的应用,它为解决不同实体的冲突和合作提供了一泛的应用,它为解决不同实体的冲突和合作提供了一个宝贵的方法个宝贵的方法 ¨在对参与者行为研究这一点上,博弈论和经济学家的在对参与者行为研究这一点上,博弈论和经济学家的研究模式是完全一样的经济学越来越转向人与人关研究模式是完全一样的经济学越来越转向人与人关系的研究,特别是人与人之间行为的相互影响和相互系的研究,特别是人与人之间行为的相互影响和相互作用,人与人之间利益和冲突、竞争与合作,而这正作用,人与人之间利益和冲突、竞争与合作,而这正是博弈论的研究对象是博弈论的研究对象 清华诚志321111、我们从博弈中学习什么?、我们从博弈中学习什么?¨博弈论告诉人们,要学会理解他人都有自己的思想,博弈论告诉人们,要学会理解他人都有自己的思想,每个个体都是理性的,所以必须了解竞争对手的思想每个个体都是理性的,所以必须了解竞争对手的思想商业关系被认为是一种相互作用但博弈论并不是疗商业关系被认为是一种相互作用但博弈论并不是疗法,并不是处方,它并不告诉你该付多少钱买东西,法,并不是处方,它并不告诉你该付多少钱买东西,这是计算机或者字典的任务。
博弈论只是提供一些关这是计算机或者字典的任务博弈论只是提供一些关系的例证,一些有用的解决问题的方法这种思维方系的例证,一些有用的解决问题的方法这种思维方法也许是企业家应该学习的对于经济学家,也许需法也许是企业家应该学习的对于经济学家,也许需要学习它的理论模型,它的实验方式要学习它的理论模型,它的实验方式 清华诚志33几个例子¨1.1.囚徒困境在经济学和生活中的例子囚徒困境在经济学和生活中的例子¨中东石油输出国中东石油输出国 OPECOPEC限产限产¨几乎所有的几乎所有的卡特尔都会遭到失败卡特尔都会遭到失败,原因就在于卡特尔,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守那么是不是不可能有卡特尔合没有成员有兴趣遵守那么是不是不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双方考虑作成功了?理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的但只要是有限次长远利益,他们的合作是会成功的但只要是有限次的合作,合作就不会成功比如合作10次,那么在的合作,合作就不会成功比如合作10次,那么在第九次博弈参与人就会采取不合作态度第九次博弈参与人就会采取不合作态度----------¨参与者效用多重性,漂亮女生参与者效用多重性,漂亮女生清华诚志34价格战¨厂家价格大战的结局也是一个厂家价格大战的结局也是一个“纳什均衡纳什均衡”,而且价,而且价格战的结果是谁都没钱赚格战的结果是谁都没钱赚。
因为博弈双方的利润正好因为博弈双方的利润正好是零竞争的结果是稳定的,即是一个是零竞争的结果是稳定的,即是一个“纳什均衡纳什均衡”这个结果可能对消费者是有利的,但对厂商而言是灾这个结果可能对消费者是有利的,但对厂商而言是灾难性的所以,价格战对厂商而言意味着自杀所以,价格战对厂商而言意味着自杀 ¨引伸出两个问题,一是竞争削价的结果或引伸出两个问题,一是竞争削价的结果或“纳什均衡纳什均衡”可能导致一个有效率的零利润结局可能导致一个有效率的零利润结局 ¨二是如果不采取价格战,作为一种敌对博弈论二是如果不采取价格战,作为一种敌对博弈论(rivalry game)(rivalry game)其结果会如何呢?每一个企业,都会其结果会如何呢?每一个企业,都会考虑采取正常价格策略,还是采取高价格策略形成垄考虑采取正常价格策略,还是采取高价格策略形成垄断价格,并尽力获取垄断利润如果垄断可以形成,断价格,并尽力获取垄断利润如果垄断可以形成,则博弈双方的共同利润最大这种情况就是垄断经营则博弈双方的共同利润最大这种情况就是垄断经营所做的,通常会抬高价格另一个极端的情况是厂商所做的,通常会抬高价格另一个极端的情况是厂商用正常的价格,双方都可以获得利润。
用正常的价格,双方都可以获得利润 清华诚志35有趣的联系¨我们又引出一条基本准则:“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”事实上,完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”在这种状态下,每一个厂商或消费者都是按照所有的别人已定的价格来进行决策在这种均衡中,每一企业要使利润最大化,消费者要使效用最大化,结果导致了零利润,也就是说价格等于边际成本¨在完全竞争的情况下,非合作行为导致了社会所期望的经济效率状态如果厂商采取合作行动并决定转向垄断价格,那么社会的经济效率就会遭到破坏这就是为什么WTO和各国政府要加强反垄断的意义所在清华诚志36占优战略¨不论其他参与人选择什么战略,它的最优战略是唯一的,这样的最优战略被称为占优战略¨重复剔除严格劣战略清华诚志37智猪博弈¨每次按出10个萝卜,按者支付2个单位成本,大先,(9,1)小先(6,4)同时(7,3) 小猪大猪9 ,14,45 ,-10,0按 等待 按等待清华诚志38实际生活中的智猪博弈¨“搭便车”现象;¨公共物品,穷人和富人修路博弈(中产阶级对社会的稳定作用);¨大股东对管理者的监督;¨天塌下来有高个子顶着。












