
博弈论知识点总结完整版.docx
6页一):基本知识1.1 定义:博弈论,又称对策论,是使用严 谨的数学模型研究冲突对抗条件下最优决策 问题的理论,是研究竞争的逻辑和规律的数学 分支即,博弈论是研究决策主体在给定信息 结构下如何决策以最大化自己的效用,以及不 同决策主体之间的均衡1.2 基本要素:参与人、各参与人的策略 集、各参与人的收益函数,是博弈最重要的基 本要素1.3 博弈的分类:博弈论根据其所采用的 假设不同而分为合作博弈理论和非合作博弈 理论两者的区别在于参与人在博弈过程中是 否能够达成一个具有约束力的协议( binding agreement )倘若不能,则称非合作博弈 (Non-cooperative game )合作博弈强调的是集体主义,团体理性, 是效率、公平、公正;而非合作博弈则主要研 究人们在利益相互影响的局势中如何选择策 略使得自己的收益最大,强调个人理性、个人 最优决策,其结果有时有效率,有时则不然 目前经济学家谈到博弈论主要指的是非合作 博弈,也就是各方在给定的约束条件下如何追 求各自利益的最大化,最后达到力量均衡博弈的划分可以从参与人行动的次序和 参与人对其他参与人的特征、战略空间和支付 的知识、信息,是否了解两个角度进行。
把两 个角度结合就得到了 4种博弈:a、 完全信息静态博弈,纳什均衡,Nash(1950)b、 完全信息动态博弈,子博弈精炼纳什 均衡,泽尔腾(1965)c、 不完全信息静态博弈,贝叶斯纳什均 衡,海萨尼(1967-1968)d、 不完全信息动态博弈,精炼贝叶斯纳 什均衡,泽尔腾(1975) Kreps, Wilson(1982) Fudenberg, Tirole(1991)1.4 课程主要内容:完全信息静态博弈 完 全信息动态博弈 不完全信息静态博弈 机制 设计 合作博弈1.5 博弈模型的两种表示形式:策略式表 述 (Strategic form), 扩展式表述( Extensiveform)1.6 占优均衡:a、 占优策略:在博弈中如果不管其他参 与人选择什么策略,一个参与人的某个策略 给他带来的支付值始终高于其他策略,或至 少不劣于其他策略,则称该策略为该参与人 的严格占优策略或占优策略对于所有的s-i, si*称为参与人 i 的严格占优战略,如果满足: ui(si*,s-i)>ui(si',s-i) ? s-i, ? si' ?si*b、 占优均衡:一个博弈的某个策略组合 中,如果对应的所有策略都是各参与人的占优 策略,则称该策略组合为该博弈的一个占优均 衡。
1.7重复剔除严劣策略均衡:a、 “严劣”和“弱劣”的含义:设S;和Sf是参与人i可选择的两个策略, 若对其他参与人的任意策略组合 s-i, 均成立 u(s', s) < u(s', s),则说策略S,严劣于策略 Si'' 上面式子中,若将“ V"改为“W”,则 说策略S,弱劣于策略Sfb、 定义:重复剔除严格策略就是 各参与人在其各自策略集中, 不断剔除严劣策略…如果最终 各参与人仅剩下一个策略,则 该策略组合就被称为重复剔除 严劣策略均衡 二 ) : 纳 什 均 衡 ( Nash Equilibrium)2.1 纳什均衡定义:对于一个策略式表述 的博弈G= {N,Sj, u, i G N},称策略组合 S*=(S], ...s, sn)是一个纳什均衡,如果对于每 一个i G N, s*是给定其他参与人选择 S_*={s1*,…,s.^*, S+1*, ... , Sn*}情况下参与人 i 的 最优策略(经济理性策略),即:u.(s.*, s_*) > u.(s., S *),对于任意的s.GS.,任意的iG N均成 立通俗定义:纳什均衡是一种策略组合,给 定对手的策略,每个参与人选择自己的最优策 略。
纳什均衡是一种稳定的策略组合:当所有 参与人的选择公开以后,每个人都满意自己作 出了正确的选择;没有人能得到更好的结果 了在博弈论中这种结果被称为纳什均衡 (NE)2.2 定理:Nash在1950年证明:任何有限博弈,都 至 少 存 在 一 个 NE — — Existence of Nash Equilibrium即 在一个有n个参与人的策略 式博弈G={S1,…,Sn; ul,…,un}中,如果n是 有限的,且Si是有限集(i=1,…,n),则该博 弈至少存在一个纳什均衡(在混合策略意义 下)Wilson (1971)证明,几乎所有有限博弈, 都存在有限奇数个NE,包括纯策略NE和混 合策略 NE Oddness Theorem2.3 纳什均衡、占优均衡、重复剔除严劣 策略均衡的关系 定理 a 每一个占优均衡、重复剔除严劣策略 均衡一定是纳什均衡,但反过来不一定成立; 定理 b 纳什均衡一定不能通过重复剔除严劣 策略方法剔除2.4 划线法 先找出自己针对其他博弈方每种策略或策略 组合(对多人博弈)的最佳对策,即自己的可 选策略中与其他博弈方的策略或策略组合配 合,给自己带来最大得益的策略(这种相对最 佳策略总是存在的,不过不一定唯一),然后 在此基础上,通过对其他博弈方策略选择的判 断,包括对其他博弈方对自己策略判断的判断 等,预测博弈的可能结果和确定自己的最优策 略。
这就是划线法2.5 箭头法 箭头法对于理解博弈关系很有好处 ,是寻 找相对稳定性策略组合的分析方法对博弈中 的每个策略组合进行分析,考察在每个策略组 合处各个参与方能否通过改变自己的策略而 增加得益如能,则从所分析的策略组合对应 的得益数组引一箭头到改变策略后策略组合 对应的得益数组最后综合对每个策略组合的 分析情况,形成对博弈结果的判断划线法和 箭头法的结果是一致的,可以相互替代 (三) :混合策略( MixedStrategies)纳什均衡3.1 定义: 混合策略的定义: 在博弈 G={N, Si, ui, iGN}中,假设参与人i的纯策略 构成的策略集合为Si={si1,…,sik},若参与人 i以概率分布pi=(pi1,…,pik)在其k个可选策 略中随机选择“策略”,称这样的选择方式 为混合策略这里,0Wpij W 1,对于j=1 ,…, k都成立,且有,pi1+・・・+ pik=1纯策略可看 成特殊的混合策略上述定义是在有限博弈前 提下进行的3.2 混合策略意义下策略组合的表述{x1GX1,…,xnGXn},其中 Xi , i =1,…, n 表示参与人 i 所有纯策略生成的概率空间, xi为参与人i的一个具体混合策略猜硬币博弈的一个混合策略就可记为 {(1/2, 1/2) ,(1/2, 1/2)}3.3VNM 效用函数( Von Neumann and Morgenstern冯•诺依曼和摩根斯坦)如果某个随机变量X以概率Pi取值xi, i=1,2,…,n,而某人在确定地得到xi时的效用 为u(xi),那么,该随机变量给他的效用便 是: U(X) = P1u(x1) + P2u(x2) + ... + Pnu(xn) 表示关于随机变量X的期望效用。
因此U(X) 称为期望效用函数,又叫做冯•诺依曼一一摩 根斯坦效用函数(VNM函数)3.4 基于混合策略意义下的博弈策略式表 述定义:基于(v-N-M效用的)策略式博弈由 a、参与人集合b、每个参与人有一个(纯) 策略集合c、对于每一个参与人来说,由所 有参与人纯策略组合构成的风险结果空间,存 在一个v-N-M效用3.5 混合策略意义下的纳什均衡定义:对于博弈G= {N, Si, ui, iGN},基 于v-N-M效用的混合策略组合a *是一个纳什 均衡,若对于每一个i,以及i的任意一个混合 策略ai,a*对应的期望支付至少和(ai,a *-i )的期望支付一样大换句话说,称混合策略组合a *是一个纳 什均衡,如果没有一个参与人通过偏离策略a *i 实现支付的增加3.6 一个定理对于N-人静态博弈问题,设混合策略纳什均衡对应的策略组合为(Xi , X -i )对于任意的 i ,若最优混合策略为 Xi= {xl,…,xl, 0…0}(不失一般性,假设前1个分 量严格大于0),记分量xk (k=1「: 1)对应的 纯策略 sk,则对于参与人 i 而言, sk 与其他参与人的 最优混合策略组合 X - i 形成的局势的收益 值,等于纳什均衡混合策略组合 (Xi, X - i ) 的收益值。
即 ui (sk, X - i ) = ui (Xi, X - i ) 成立,k=1,…,13.7 方法:a、 求解混合策略均衡可以用期望收益等 值法b、 2X2双矩阵博弈的图解法:反应函数 的三个交点即是纳什均衡(四) :多重纳什均衡解及其分析4.l 帕雷托占优均衡帕雷托占优均衡的含义是:在多个纳什均 衡中,若存在一个纳什均衡,其支付结果针对 每个参与人而言都严格优于其它纳什均衡,则 该纳什均衡是帕雷托占优纳什均衡4.2风险占优均衡(risk-dominantequi1ibrium)参与人对风险占优均衡的选择倾向,有一 种强化的机制当部分或所有参与人选择风险 占优均衡的可能性增强的时候,任一参与人选 择帕雷托占优均衡策略的期望支付会进一步 减小,而这又使得帕雷托占优均衡策略的支付 更小,从而形成一种选择风险占优均衡策略的 正反馈机制,并使其出现的概率越来越大当参与人数目增加时,选择合作的风险将 会更大,可借助该点考虑招标机制如何减少投 标方勾结问题上述问题是我们知道建立诚信 机制社会的重要意义上述问题引出一个博弈 相关分支为协调博弈(coordination game)4.3 聚点均衡由实际问题抽象出来的博弈模型中,更多 的一类问题是:多个纳什均衡间不存在帕雷托 占优关系或明显的风险占优关系,如夫妻爱好 问题的两个纯策略均衡。
这时如何预测哪一个 纳什均衡会出现是一个很有意义的问题以夫妻爱好博弈为例,在实际中往往二人 很默契地知道如何进行博弈,双方往往知道怎 么进行选择策略,且能够相互了解(这里面排 除了互相协商后达成的一致)实际博弈中参与人往往会利用博弈模型 以外的信息,实现对特定博弈均衡一致关注的 “聚点”这些信息如:参与人共同的文化背景或规 范,共同的知识,具有特定意义事物的特征, 某些特殊的数量、位置关系等聚点均衡确实反映了人们在多重纳什均 衡选择中的某些规律性,但因为涉及因素太 多,对于一般博弈模型很难总结普遍规律,只 能具体问题具体分析聚点:人们通常会协调彼此的行为你 弱他就强);先例产生的影响远大于逻辑或者 法律效力;人们总是乐于安守现状或接受自然 形成的界线(三八线)4.4 相关均衡(correlated equilibrium)实际上,在现实中遇到选择困难时,特别 是在长期中反复遇到相似选择难题时,常会通 过收集更多信息,形成特定的机制和规则,为 某种形式的制度安排等主动寻找思路相关均衡就是这样的一种均衡选择机制对于实际中比较复杂的博弈问题,参与人 是否有能力设计这种机制,并且有足够能力理 解、信任这种机制,是有一定疑问的。
相关均衡作为社会经济制度创新的一种 解释也许更有意义4.5 防共谋均衡(coalition-proof equi1ibrium)定义:如果一个博弈的某个策略组合满足a、 没有任何单个参与人的“串通”会改 变博弈的结果,即单独改变策略无利可图(该 策略组合是纳什均衡)b、 给定选择偏离的参与人有再次偏离的 自由时,没有任何两个参与人通过“串通”改 变博弈的结果c、 依此类推,直到所有参与人都参加的 串通也不会改变博弈的结果满足上述要求的均衡策略组合称为“防共 谋均衡”在有多个参与人的博弈中。












