
博弈伦的数学模型.doc
10页博弈伦的数学模型博弈伦的数学模型博弈伦的数学模型博弈论的数学模型作者: 竺可桢学院 01 混合班王大方 何霈 邹铭摘要博弈论现在得到了广泛的应用,涉及到人的决策问题都可以用博弈论的模型加以解释本文首先用数学的方法表述实际生活中的博弈行为,并导出一般情况下的博弈的结果,进而讨论一些不同的外部约束条件对博弈过程的影响我们用经济学中的垄断竞争现象作为博弈问题的一个实例,讨论生产者在不同状态下的决策,进而分析双方共谋的动机和可能性一)基本博弈模型的建立一, 博弈行为的表述博弈的标准式包括:1. 博弈的参与者2. 每一个参与者可供选择的战略集3. 针对所有参与者可能选择的战略组合,每一个参与者获得的利益在 n 人博弈中,用 Si 为参与者 i 的可以选择战略空间,其中任意一个特定的纯战略为 si,其中任意特定的纯战略为 si,si∈Si,n 元函数 ui(s1,s2,……sn), 当 n 个博弈者的决策为s1,s2,……sn 时,表示第 I 各参与者的收益函数二, 博弈的解当博弈进入一个稳定状态时,参与者选择的战略必然是针对其他参与者既定战略的最优反应,在此状态下没有人愿意单独背离当前的局势。
这个局势叫纳什均衡:在 n 个参与者标准式博弈,G={ S1,S2,……Sn;u1,u2,……un}中,若战略组合{s1*,s2*,……sn*}满足对每一个参与者 i,si*是针对{ s1*,s2*,……si-1*,si+1*……sn*}的最优反应战略, ,目标战略组合{s1*,s2*,……sn*}为该博弈的纳什均衡即:ui { s1*,s2*,……si-1*,si*,si+1*……sn*}≥ui { s1*,s2*,……si-1*,si,si+1*……sn*},对一切 si∈Si 均成立纳什于 1950 年证明在任何有限个参与者,且每个参与者可选择的纯战略为有限个的博弈中,均存在纳什均衡 (包括混合战略)混合战略指认某种概率分布来取一个战略空间中的战略,在本文中不加讨论在一般情况中,纳什证明保证了我们的均衡分析有意义三, 博弈实例:单阶段博弈古诺竞争在古诺竞争中,少数厂商通过改变产量来控制价格,以使他们的收益最大化我们作如下假设:1. 厂商生产的商品是相同的,消费者没有对某家厂商的偏好2. 市场上价格与供给量的函数为 p=a-bQ,且供给增加不会导致过剩,而仅仅使价格降低,即厂商可以将生产的产品全部售出。
3. 厂商都是理性的,即面对既定的情况都做出决策使自己利益最大化4. 信息是完全的,每个厂商都知道其他厂商时理性的,且每个厂商知道别人是理性的这一事实为所有参与者的共识二)博弈模型的求解与讨论为了简单起见,我们从一家企业的情况做起:只有一家企业时,目标收益函数 u=Q(a-bQ)针对 max u 的解为 Q0=a/2b,u0=a2/4b当有两家企业时,设产量分别为 Q1,Q2,则p=a-b(Q1+Q2)u1(Q1,Q2)=p*Q1=Q[a-b(Q1+Q2)]u2(Q1,Q2)=p*Q2=Q[a-b(Q1+Q2)]纳什均衡点 Q1*,Q2*为方程组/ =0 (1)/ =0 (2) 的解整理,得到2bQ1+bQ2=a (3)bQ1+2bQ2=a (4)解得 Q1*=Q2*=a/3b,对应的 u1=u2=a2/9b纳什均衡点是一个极值点,一旦达到该点时双方都没有率先改变的动机下面我们讨论纳什均衡点的孤立性,即在对方初始决策不在纳什均衡时,双方能否通过理性的利益最大化策略使博弈形势变化至纳什均衡点1)式表示厂商 1 的最优函数,在给定对方产量 Q 时它根据(1)来使自己收益最大, 由(3)式, 厂商最优函数为 Q1=(a-bQ2)/2b 同样(2)时表示厂商(2)的最优函数,由(4)式,厂商 2 的最优函数为 Q2=(a-bQ1)/2b这是两条直线,如图,交点 E 为纳什均衡点。
AB 为厂商 1 的最优函数,CD 为厂商 2 的最优函数,当双方的初始选择点为 A,即 Q1=0,Q2=a/b,A 在厂商 1 最优函数上,故厂商 1 不会改变,但厂商 2 针对 Q1=0 的最有点为 C,于是双方的决策点转移到 C,在 C 点厂商 1 会调整自己的产量时双方决策点到 F,然厂商 2 又会调整策略到 CD 上,以此类推,最后将到达 E点,在第一象限的任何初始选择点,按以上分析双方都能经过一系列调整到达 E 点在完全信息的假设下,上面这一系列的调整过程在任何一方决策之前就能被预测到,任何一个厂商都回绝的任何一个异于 E 点的决策都不是在给定条件下最好的选择,于是双方会不约而同的按 E 点做出产量决策但是当Q1=Q2=1/2 * a/2b (5) 时双方才能获得最大收益Q1=Q2=1/2 * a2/4b (6)这一方面说明纳什均衡点并不是一个最好的决策点,另一方面也说明与独家垄断比起来两家厂商的竞争提高了社会效应,社会总产量从 a/2b 增加到了 2/3 * a/b=2a/3b当厂商数增加至 n 家时,模型变为p=a-b*∑ni=1Qi (7)ui=p*Qi,i=1,2,……n (8)/ =0 I=1,2……n (9)由归纳法可证明(9)可化为方程组(以矩阵形式表示)= a/b * (1)由线性代数分析可知,该方程组有唯一非零解Q1*=Q2*=…Qn*=a/(n+1)b,ui*=a2/(n+1)2b社会总产量为 na/(n+1)b。
这说明 h 厂商垄断竞争也必有纳什均衡点,同样方法可证明纳什均衡点不是孤立的,于是理智的各方均会按均衡点做产量决策另外 n 越大,竞争越彻底,社会总产量越高当 n 很大时,总产量趋于 a/b,此时价格 p 为 0,这时价格 p 为 0,此时这个模型不适用因为在 n 较小, (一般小于 5)时垄断厂商才有能力通过自己的产量来控制价格厂商们的整体最好选择是 Q1*=Q2*=……Qn*==a/2nb, 分别能获得收益,a2/4nb显然 n 越大,厂商们理性博弈的结果和他们的最好选择点间的差距越大三)多阶段博弈与共谋以上可以看出,作为博弈者的厂商很有必要共谋限制产量,但最好的选择点是不稳定的,率先违约的一方都能获取额外利润,因此需要一些条件来约束双方的行为另外共谋只有在长期过程中才有效益,双方需要不断检查是否已经违约,并决定自己是否要违约,每次这样的过程就是上文的单阶段博弈这里的信息条件为每企业在 n 阶段可以观察的前 n-1 阶段博弈结果规则为一旦对方违约,自己就违约,且永不守约,这为双方所共识我们新引入一个时间贴现因子 v,0 式 (16) , B 就没有动机在第一阶段背离如果 B 在第一阶段不合作,在第二阶段合作,第三阶段不合作,则他的各阶段期望收益为u1= 5P/36+(1-P)/9 u2=5/48 u3=5P/36+(1-P)/9总期望收益为 P/18+47/144 恒小于(16)式,此时 B 也没有动机在第一阶段背离。
综上,只要 A 有 20%的可能为投桃报李型的,B 在前两阶段就没有背离合作的动机对于 A,一旦他在第一阶段就背离合作,那么自第二阶段起 A 为理性的就成为博弈双方的共识,此时他的期望收益为5/36+1/9+1/9=13/36而 A 如果始终合作,其均衡收益为 1/8+1/8+1/9=13/36所以在三阶段时 A 是否要背离合作无所谓,不过这只是由于本问题数据特殊性的巧合多阶段的扩展从上面的三个阶段扩展就可以看出,随着阶段数的增多,每个博弈者更多的会考虑长久的收益情况,而非眼前这意味着之需要一个很小的信誉概率 P,就有可能约束对方不发生背叛的行为当共有 T 阶段博弈时,我们可以用归纳法证明理性的双方在从 1 到T-2 阶段选择合作,而在 T-1 和 T 阶段按照上文讨论的两回合博弈行动假设任何 t(t 显然提前违约的收益小于均衡收益对于 B, 由两阶段博弈可知, B 没有在前 T-2 阶段合作,T-1 阶段不合作的动机,B 只可能再 t≤T-3 的阶段背离合作 一旦 B 在 t阶段背离合作, 则无论投桃报李的还是理性的 A 都将在 t+1 阶段不合作, 于是在前t+1 阶段 B 无法确认 A 是否为理性,从 t+2 阶段起双方的博弈等同于一个 T-(t+1)阶段的博弈由归纳假设,这后一部分博弈中双方会合作到 T-2 阶段,然后按照上文的两阶段博弈进行B 的总收益为 u= 1/8 * (t-1) + 5/36 + 5/48+[T-2-(t+2)+1]*1/8 + [P/8 +(1-P)*5/48 +5P/36 + (1-P)/9]这小于 B 从 1 到 T 的均衡收益(T-2)/8+ [P/8+ 5(1-P)/48 + 5P/48 + (1-P)/9]所以 B 也没有只背离一次的动机更为一般的情况是在前(T-3)次博弈中 B 有多次的背离与合作,则按以上方法多次使用归纳法,可以发现获得的期望收益更少其根本原因是率先背约者无法判断对方的真正类型,所以无法保证自己的利益能够最大化,而一旦约定破裂后修复的成本很高,使得背信弃义的额外收益比双方合作来的少。 ( 5/36+5/48)<2*1/8 ) 这样的模型就使得共谋更有约束力小结与进一步的研究本文主要为静态博弈问题建立了数学模型,并用他分析了一个实例:垄断市场上的古诺竞争和共谋在静态博弈中,数学上的极大值就是博弈的均衡解理性决策迫使人们的行为向利益极大值点移动,而信息问题是理性决策最重要的前提条件,可以说不同的信息条件可以推导出不同的理性决策本文讨论的是最完美的信息假设:完全信息它不仅指双方彼此了解对方的情况,而且彼此知道对方了解自己情况这一事实,以此类推,等等,最后形成了一个无穷的递归链最后讨论的投桃报李模型不是完全信息的,但是它也有一套为双方所共知的评判标准来约束双方的决策总之,本文讨论的模型是双方都知道规则的情况下进行的博弈,这是一个对实际博弈相当理想化的简化在这样的简化下,如何妥善的处理无穷信息递归链,是个有待进一步研究的问题而就垄断这个经济问题本身而言,本模型最大的理想化就是价格与供给量成一次函数关系,进一步可将这个函数关系拟合得更符合实际,由此还可推导出不同的收益函数和多个纳什均衡点,做出进一步分析参考文献罗伯特.吉本斯: 《博弈论基础, A PRIMER IN GAME THEORY》约瑟夫. 斯蒂格利茨: 《经济学》 张涛 方城等, 基于累积期望差异评价策略的重复博弈仿真研究 《系统工程.》2002,20(3).-87-91霍沛军 双寡头的经济捕鱼策略 《数学的实践与认识》2002,32(2).-201-205薛伟贤, 冯宗宪, 陈爱娟 寡头市场的博弈分析 《系统工程理论与实践》, 2002 Vol.22 No.11。
