
纳什均衡理论课件.ppt
20页单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,*,纳什均衡理论与上大学生的发展策略,郁松年,一场海战,你死我活的对策,日 方,盟,军,航行北线,航行南线,搜,索,北,线,2天,2天,搜,索,南,线,1天,3天,鞍点的重要性,:,局中人都不能由单方面背离它而做出改进称鞍点为“纯策略”对策的一个“解”所谓“纯策略”即按规定总是采取相同的行动否则,为“混合策略”石头纸剪刀 对策的支付矩阵,Max,Min,纸,剪刀,石头,纸,0,1,1,剪刀,1,0,1,石头,1,1,0,几点说明,行极小(-1)的极大值不等于列极大(+1)极小值;因此,对策没有鞍点意味着如果,Max,“偷看,”,,他能获得超过,Min,的好处,因此总能获胜具有等可能性选择的混合策略是该对策的一个“平衡点”冯.诺伊曼(,John von Neumann,,美国数学家,19031957)在1928年发表了著名的极小极大定理,断言对每个两人零和对策每个局中人都有一个最优混合策略极大极小定理,对于每个两人零和对策,每个局中人都存在一个混合策略使得双方的期望支付有相同的值,v且是每一方能得到的最优支付;因此,相应的混合策略是每方所用的最优策略。
一个零和对策的支付矩阵,局中人,B,局中人,A,B1,B2,A1,0,56,A2,1,12,可以证明,:,用,A-1,策略对局的概率为3/8,用,A-2,策略对局的概率为5/8,A,方将得到5/8的期望支付.,用,B-1,策略对局的概率为1/4,,用,B-2,策略对局的概率为3/4,,B,方将得到-5/8的期望支付.,大致而言,纳什所做的研究工作就是证明了一条定理,该定理把极小极大定理推广到有两个或更多个直接竞争的局中人的非零和对策即“非合作对策”的情形纳什定理,(美国数学家,,John Nash,1928),每个局中人有有限个纯策略的任一个,n,人非合作策略(零和或非零和)至少有一个策略平衡组注):,纳什引进了平衡对的概念(即极大化极小策略与极小化极大策略)这对策略告诉我们,局中人单方面背离平衡对中的平衡策略,比不背离所得到的期望支付要差一般,总是如此,当你越靠近现实世界复杂情况时,你就越远离程式化和结构化的数学世界单车道对策支付矩阵,司机,II,司机,I,C,D,C,(2,2),(3.4),D,(4,3),(1,1),(1)没有支配策略,(2)可见,极小极大原理不能作,为混合动机对策中合理的行,动步骤的基础,(3)有两个平衡的策略,性别之战对策支付矩阵,妻子,丈夫,C,D,C,(2,2),(4,3),D,(3,4),(1,1),囚徒两难对策支付矩阵,囚徒,II,囚徒,I,C,D,C,(,3,3),(1,4),D,(4,1),(2,2),其中支付,P,R,S,和,T,满足,:,(1),TRPS,(2)R(T+S)/2,的实数,一个引人入胜的心理学实验,:,(,Robert Axelrod),想弄清3个问题:,(1)在利己者群体中合作是怎样出现的?,(2)采用合作策略的人会比不合作的对手,生存得更好?,(3)哪些合作策略会表现得更好,它们是,如何达到支配地位的?,为此,他邀请了一些心理学家、数学家、,政治学家和计算机专家共同来参加一个,不同策略互相竞争的计算机竞赛。
规则很宽松:,(1)可利用先前对局中的任何信息;,(2)程序不必是确定性的,即可是随,机的方法唯一要求是每一轮对局程序必须得到一个确定的决策:合作(,C),或抗拒(,D)这样进行了200次对局,为光滑化由于非确定性策略带来的统计数字的波动,整个实验又进行了5次结果证明最好的策略(即胜的策略)是最简单的策略即称为针锋相对的策略“,T For T”,,只有三行程序,它由两条规则组成:,(1)对第一个合作者采用合作的策略;,(2)在以后的各轮对局中,执行你的,对手在前一轮中采用的策略经验表明:要让一个策略成功,它必须是好的又是宽容的进一步实验又发现:针锋相对但非恶意的反击也是重要的策略,只是要求你的行动简单明了,正确无误,避免给人以太复杂的印象对策论的必要前提是假设:局中人合理地行动,以一种本质上是无从区分是非的、自我服务的利己主义的方式作出决策对策论至少解决了哲学中的困难问题之一:,在合理和不合理行动之间的界限问题数值分析家曾说:“对策论的目的在于深刻的见解,而不是解法Five Golden Rules Great Theories of 20,th,-Century Mathematics,John L.Casti(1996),John Wiley&Sons,Inc.,谢 谢!,。












