纯策略纳什均衡基础教育

资源ID：467680514 资源大小：118.50KB 全文页数：8页
资源格式： DOC 下载积分：15金贝

快捷下载

账号登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要15金贝

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

1、金锄头文库是“C2C”交易模式，即卖家上传的文档直接由买家下载，本站只是中间服务平台，本站所有文档下载所得的收益全部归上传人（卖家）所有，作为网络服务商，若您的权利被侵害请及时联系右侧客服；
2、如你看到网页展示的文档有jinchutou.com水印，是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有jinchutou.com水印标识，下载后原文更清晰；
3、所有的PPT和DOC文档都被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；下载前须认真查看，确认无误后再购买；
4、文档大部份都是可以预览的，金锄头文库作为内容存储提供商，无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证，请慎重购买；
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据；
6、如果您还有什么不清楚的或需要我们协助，可以点击右侧栏的客服。

下载须知 | 常见问题汇总

1、会员注册 2、如何支付与充值 3、个人资料信息修改 4、我的收藏和“收藏文件夹” 5、我的读者群和加入读者群 6、我的书签 7、金锄头文库批量上传工具（绿色版）V1.0 8、下载文档（资源）相关问题整理 9、解决下载文档时，自动弹出迅雷的问题 10、下载时为什么支付不成功？

纯策略纳什均衡基础教育

纯策略纳什均衡出自 MBA智库百科(http:/wiki.mbalib.com/)纯策略纳什均衡（Pure Strategy Nash Equilibrium）编辑什么是纯策略纳什均衡纯策略纳什均衡是指在一个纯策略组合中,如果给定其他的策略不变，该节点不会单方面改变自己的策略，否则不会使节点访问代价变小。编辑存在纯策略纳什均衡的有限次重复博弈1如果重复博弈中有惟一纯策略纳什均衡，那么我们怎么找出它的纯策略纳什均衡呢?首先看下面囚徒的困境的博弈的例子：我们现在考虑该博弈重复两次的重复博弈，这可以理解成给囚徒两次坦白机会，最后的得益是两个阶段博弈中各自得益之和在两次博弈过程中，双方知道第一次博弈的结果再进行二次博弈用逆推归纳法来分析，先分析第二阶段，也就是第二次重复时两博弈方的选择很明显，这个第二阶段仍然是两囚徒之间的一个囚徒的困境博弈，此时前一阶段的结果已成为既成事实，此后又不再有任何的后续阶段，因此实现自身当前的最大利益是两博弈方在该阶段决策中的惟一原则因此我们不难得出结论，不管前一次的博弈得到的结果如何，第二阶段的惟一结果就是原博弈惟一的纳什均衡(坦白，坦白)，双方得益(-5，-5) 现在再回到第一阶段，即第一次博弈理性的博弈方在第一阶段就对后一阶段的结局非常清楚，知道第二阶段的结果必然是(坦白，坦白)，因此不管第一阶段的博弈结果是什么，双方在整个重复博弈中的最终得益，都将是第一阶段的基础上各加-5因此从第一阶段的选择来看，这个重复博弈与图l中得益矩阵表示的一次性博弈实际上是完全等价的于是我们可以得出惟一纯策略均衡的有限次重复博弈的结果就是重复原博弈惟一的纯策略纳什均衡，这就是这种重复博弈惟一的子博弈完美纳什均衡路径如果重复博弈中有多个纯策略纳什均衡，设某一市场有两个生产同样质量产品的厂商，他们对产品的定价同有高(H)、中(M)、低(L)三种可能设高价时市场总利润为10个单位，中价时市场总利润为6个单位，低价时市场总利润为2个单位再假设两厂商同时决定价格，价格不等时低价格者独享利润，价格相等时双方平分利润这时候两厂商对价格的选择就构成了一个静态博弈问题我们看一个三价博弈的重复博弈的例子：显然，这个得益矩阵有两个纯策略纳什均衡(M，M)和(L，L)，我们也可以看出实际上两博弈方最大的得益是策略组合(H，H)，但是它并不是纳什均衡现在考虑重复两次该博弈，我们采用一种触发策略(Trigger Strategy)：博弈双方首先试图合作，一旦发觉对方不合作也用不合作相报复的策略使得在第一阶段采用(H，H)成为子博弈完美纳什均衡，其双方的策略是这样的：博弈方1：第一次选H；如果第一次结果为(H，H)，则第二次选M，如果第一次结果为任何其他策略组合，则第二次选择L 博弈方2：同博弈方1在上述双方策略组合下，两次重复博弈的路径一定为第一阶段(H，H)，第二阶段(M，M)，这是一个子博弈完美纳什均衡路径因为第二阶段是一个原博弈的纳什均衡，因此不可能有哪一方愿意单独偏离；其次，第一阶段的(H，H)虽然不是原来的博弈纳什均衡，但是如果一方单独偏离，采用M能增加1单位得益，这样的后果却是第二阶段至少要损失2单位的得益，因为双方采用的是触发策略，即有报复机制的策略，因此合理的选择是坚持H这就说明了上述策略组合是这个两次重复博弈的子博弈完美纳什均衡从上述的例子我们可以看出，有多个纯策略纳什均衡的博弈重复两次的子博弈完美纳什均衡路径是，第一阶段采用(H，H)，第二阶段采用原博弈的纳什均衡(M，M) 如果这个重复博弈重复三次，或者更多次，结论也是相似的，仍然用触发策略，它的子博弈完美纳什均衡路径为除了最后一次以外，每次都采用(H，H)，最后一次采用原博弈的纳什均衡(M，M) 编辑存在纯策略纳什均衡的无限次重复博弈1与有限次重复博弈一样，无限次重复博弈也是基本博弈的简单重复，但是无限次重复博弈没有最后一次重复，因此无限次重复博弈与有限次有一些不同任何博弈中博弈方策略选择的依据都是得益的大小，这在重复博弈中仍然是成立的但是重复博弈又与一次性博弈有所不同，因为在重复博弈中，每一阶段都是一个博弈，并且各博弈方都有得益，因此对于重复博弈，我们要计算的就是博弈结束时的一个总的得益由于前一次博弈和后一次博弈之间会有损失，因此我们采用一种方法，就是将后一阶段的得益折算成当前阶段得益的(现在值)的贴现系数有了贴现系数，那么在无限次重复博弈中，某博弈方各阶段得益为1,2,.,则该博弈方总得益的现在值为：对于存在惟一纯策略纳什均衡博弈的无限次重复博弈，我们从下面的例子来看：其中博弈方1和博弈方2分别表示两个厂商，H和L分别表示高价和低价显然，该博弈的一次性博弈有惟一的纯策略纳什均衡(L，L)，但是这个纳什均衡并不是最佳策略组合，因为策略组合(H，H)的得益(4，4)比(1，1)要高的多但是由于(H，H)不是该博弈的纳什均衡，所以在一次性博弈中不会被采用根据上面的分析，此博弈在有限次重复博弈并不能实现潜在的合作利益，两博弈方在每次重复中都不会采用效率较高的(H，H)为了实现效率较高的合作利益(H，H)，假设两博弈方都采用触发策略，也即报复性策略：第一阶段采用H，在第t阶段，如果前t-l阶段的结果都是(H，H)，则继续采用L假设博弈方1已经采用了这种策略，现在我们来确定博弈方2在第一阶段的最优选择如果博弈方2采用L，那么在第一阶段能得到5，但这样会引起博弈方1一直采用L的报复，自己也只能一直采用L，得益将永远为1，总得益的现在值为如果博弈方2采用H，则在第一阶段他将得4，下一阶段又面临同样的选择若记V为博弈方2在该重复博弈中每阶段都采用最佳选择的总得益现在值，那么从第二阶段开始的无限次重复博弈因为与从第一阶段开始的只差一阶段，因而在无限次重复时可看作相同的，其总得益的现在值折算成第一阶段的得益为，因此当第一阶段的最佳选择是H时，整个无限次重复博弈总得益的现在值为或者因此，当解得时，博弈方2会采用H策略，否则会采用L策略也就是说当时，博弈方2对博弈方1触发策略的最佳反应是第一阶段采用H.这时我们就说双方采用上述触发策略是一个纳什均衡于是我们得出，在有限次重复博弈中，惟一纯策略纳什均衡不能实现最大得益(H，H)，而在无限次重复博弈中，通过触发策略却可以实现(H，H)。 1教学辅导

注意事项

本文（纯策略纳什均衡基础教育）为本站会员（汽***）主动上传，金锄头文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】，按提示上传提交保证函及证明材料，经审查核实后我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。