第五章重复博弈与合作行为.doc
9页第五章 重复博弈与合作行为第五章 重复博弈与合作行为目录5.1 重复博弈的特征5.2 有限博弈5.3 无穷博弈与合作重复博弈的特征重复博弈 同样结构的博弈重复多次,其中的每次博弈被称为“阶段博弈”三个特征:阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段的结构;所有参与人观察到博弈过去的历史;参与人的总得益是所有阶段博弈得益的贴现值之和重复博弈和信誉问题如果博弈不是一次的,而是重复进行的,参与人过去行动的历史是可以观察到的,参与人就可以将自己的选择依赖于其他人之前的行动,因而有了更多的策略可以选择,均衡结果可能与一次博弈大不相同重复博弈理论的最大贡献是对人们之间的合作行为提供了理性解释;在囚徒困境中一次博弈的唯一均衡是不合作(即坦白)但如果博弈重复进行会怎样呢? 00 -14不合作 4-1 33合作不合作合作A B囚徒困境的一般形式(R>T>P>S;(S+R)<T+T) PP SR不合作 RS TT合作不合作合作AB有限次博弈连锁店悖论无穷博弈与合作假定上述博弈重复多次或者无穷次,那么每个参与人有多个可以选择的策略:ALL-D:不论过去发生什么,总是选择不合作;ALL-C:不论过去发生什么,总是选择合作;合作与不合作交替进行;TIT-FOR-TAT:从合作开始,之后每次选择对方前一阶段的行动;TRIGGER STRATEGIES:从合作开始,一直到有一方不合作,然后永远不合作。
得益函数V( ALL-D; ALL-D)=P+??P+??2P+ ??3P+……=P/(1- ??)对?? 的解释:贴现率(DISCOUNT RATE):用来比较未来收到的一元和今天收到的一元之间的价值的一个利率博弈继续进行的概率二者的结合一般化:未来收益的重要程度无名氏定理FOLK THEOREM在无限次重复博弈中,如果参与人对未来足够重视( ??2 足够大),那么,任何程度的合作都可以通过一个特定的子博弈完美纳什均衡得到这里“合作程度”定义为整个博弈中合作出现的频率TIT-FOR-TAT纳什均衡,但不是子博弈完美纳什均衡: V( TFT; TFT)=T+??T+??2T+ ??3T+……=T/(1- ??)V( ALL-D; TFT)=T+??P+??2P+ ??3P+……=T+ ??P/(1- ??)假定A在t=5的时候没有合作根据TFT策略,在t=6的时候,B应该选择惩罚吗?如果B相信A采取的是TFT策略,那么B对A实施惩罚,预期的收入流为:R,S,R,S,R……反之,如果B原谅A,T,T,T,T,T……AXELROD在1984年证明TIT-FOR-TAT是成功率最高的策略TRIGGER STRATEGIES如果未来足够重要,子博弈完美纳什均衡:V( 合作; TRIGGER)=T+??T+??2T+ ??3T+……=T/(1- ??);V( 不合作; TRIGGER)=R+??P+??2P+ ??3P+……=R+ ??P/(1- ??)如果下列条件满足,合作就是均衡结果:T/(1- ??)≥R+ ??P/(1- ??)?? ≥(R-T)/(R-P)R-T可以理解为不合作的诱惑;R-P是合作的剩余(利益)给定未来的重要程度,不合作的一次性诱惑(R-T)相对于合作带来的利益(R-P)越小,合作的可能性就越大。
假如欺骗两次才被发现:V( 不合作; TRIGGER)=R+??R+??2P+ ??3P+……=R(1- ??)+ ??2P/(1- ??)?? ≥((R-T)/(R-P))1/2 >(R-T)/(R-P)解释:欺骗行为越难发现,欺骗产生的可能性越大;或者说,合作越困难在上面的例子中,如果欺骗一次就被发现,只要??>0.25合作就会出现;如果欺骗两次才被发现,只有当??>0. 5时合作才可能出现一般地,欺骗行为越不容易发现,合作越困难惩罚与合作ABREU1986年证明:最大合作策略是使用最严厉的可信惩罚;维护合作并不需要无限期的惩罚;只要惩罚期足够长就可以了;在确定的情况下,惩罚越严厉越有利于合作因为均衡情况下,欺骗从来不会发生,所以惩罚实际上是没有成本的胡萝卜加大棒(STICK AND CARROT):从合作开始,一直合作到:如果有任何一方在t期不合作,在t+1期,前期合作者选择“不合作”来实施惩罚,前期不合作者选择合作;如果应该合作的没有合作或者应该惩罚的没有惩罚,在t+2期继续按照上述t+1期的策略规定博弈;否则,合作恢复多重交易行为与合作关系 44 09不合作 90 55合作不合作合作A B比较两种交易关系在第一交易关系中,合作要求??>0.25;在第二交易关系中,合作要求??>0.8;如果两种交易在同样的两个人之间进行,只要??>0.25;两种交易中都会合作;设想实际的??=0.6,那么如果两种交易发生在不同的人之间,合作只出现在第一交易关系中,不会出现在第二交易关系中。
但如果两人之间同时存在两种交易,合作存在于两个交易关系中一般地,市场交易常常镶嵌在复杂的社会关系中这种关系可以提高交易的合作程度这也是人们愿意发展社会关系的原因应用:家庭血缘关系朋友关系同学关系老乡关系家族企业的困境:如果惩罚对惩罚者本身的损害太大,惩罚就不可信第三方实施的惩罚:受害者本人惩罚第三方惩罚,可信否?如果A欺骗了B,其他成员是否应该惩罚A?举例:厂家与消费者之间的博弈社会规范:集体抵制BOYCOTT:每个人都应该诚实;都有责任惩罚骗过人的人;不参与惩罚的人应该受到惩罚敌友规则:开始把所有的人当朋友:t期的朋友关系继续保持到t+1期,当且仅当他在t期不曾骗过任何人并且不曾与你的朋友合作;朋友的朋友是朋友;朋友的敌人是敌人;敌人的朋友是敌人;敌人的敌人未必是朋友信誉的条件:重复博弈;足够耐心;相对确定的环境;受骗人有积极性惩罚传统社会中的个人信誉匿名社会:法律与关系。





