您所在位置：网站首页 > 中学教育 > 教学课件 > 竞争策略博弈论完全

竞争策略博弈论完全.ppt

86页

卖家[上传人]：宝路

文档编号：47919255

上传时间：2018-07-06

文档格式：PPT

文档大小：3.32MB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10金贝

下载

/ 86 举报版权申诉马上下载

文本预览

下载提示

常见问题

博弈论－－企业管理中的竞争问题董志勇博士副教授北京大学经济学院院长助理1市场竞争程度n（1）商品总量n（2）供大于求n（3）利润率n（4）企业寿命n（5）管理者思考时间2博弈论和策略行为 Game Theory & Strategic Behaviors3智猪博弈石头、剪刀、布田忌赛马麻将……4本讲计划（ Lecture Plan）：n博弈论（Game Theory ）n策略&支付矩阵（Strategy & Payoff Matrix ）n占优策略（ Dominant Strategies ）n纳什均衡（Nash Equilibrium）n最大最小策略& 混合策略（Maximin Strategy & Mixed Strategy ）n策略行为（Strategic Behavior） 5n念出纸片上的数字，计算平均数的2/3n找出获胜者猜数试验6n每个参与人意识到其他参与人的存在n参与人的行为会相互影响n每个参与人推测其他参与人可能采取的行为，根据其推测决定自己的行为n这是一个典型的博弈猜数试验分析7简单思路n每位同学随机提出0-100间的数，则平均数为 50，2/3*50=33，可以提出33n但是，如果预料到其他同学也这样分析，则应该提出2/3*33=22n以此类推，则应该提出2/3*22=14， 2/3*14=9，2/3*9=6，2/3*6=4。

0n如果是一群博弈专家作次试验，则答案为0，同学们知道彼此都不是博弈专家，所以多数没有提出08博弈试验2—拍卖试验n规则n拍卖物品n每位同学在纸片上写下自己的出价，价格必须大于零，没有上限n出价最高者得这n无论得或不得，必须支付所出价:其余出价人的报价将收集起来作为活动经费（eg. 一起出去吃顿饭）n思考1分钟，写下出价9拍卖试验n公布各个同学的出价，找出获胜者n各位同学是否后悔自己的出价？10试验分析n知道其他同学出价后，一定有同学会后悔自己的出价，本博弈不存在简单的均衡n如果参与博弈的人越多，你的出价会变化吗？怎么变化？n人数越多，出价越低11博弈论的基本概念:• 参与人（ Players ）: 参与人指的是一个博弈中的决策主体，他的目的是通过选择行动以最大化自己的支付水平 • 行动（ Action or Move）: 行动是参与人在博弈的某个时点的决策变量 • 信息（ Information）: 信息是参与人有关博弈的知识，特别是有关“自然”的选择、其他参与人的特征和行动的知识 • 策略（ Strategy）: 战略是参与人在给定信息集情况下的行动规则，它规定参与人在什么时候选择什么行动。

• 支付（ Payoffs ）: 支付或者是指在一个特定的战略组合下参与人得到的确定效用水平，或者是指参与人得到的期望效用水平12博弈与决策—一个例子n10位同学到餐厅用餐nA、如果分别点菜，分别付账，是博弈还是决策？nB、如果共同点菜，平均付账，是博弈还是决策？nA、决策， B、博弈13策略&支付（Strategy & Payoffs）n博弈论把人间一切竞争活动看成是玩策略游戏这种策略游戏是在一定的游戏规则之下进行n它的两个最基本的概念是策略与支付矩阵n一种策略(Strategy)表示游戏参与人的一套运作计划和手段如“降价15%”就是一种策略n收益矩阵(Payoff matrix)是表示游戏参与者在各种不同策略下的利润额的一套支付表格n寡头垄断，尤其是双寡头垄断竞争，特别适合使用博弈论研究14囚徒困境 (Prisoner’s Dilemma)：n两个嫌犯被捕并受到指控，但除非至少一人招供犯罪，警方并无充分证据将其按罪判刑n警方将他们分开审讯（不能沟通），并对他们说明不同行动带来的后果n如果二人都不坦白，只能判简单刑事罪，坐牢1个月n如果二人都坦白，两人都会定罪，判刑六个月；n如果其中一个坦白，另一个不坦白；那么坦白者马上释放（从宽）、不坦白者将会判刑九个月。

n请问两个嫌犯该怎么办？15囚徒困境 (Prisoner’s Dilemma)n策略(Strategy): “沉默” & “招认”n支付矩阵(Payoff Matrix)如下：囚犯2沉默招认囚犯1沉默-1， -1-9， 0 招认0， -9-6， -616n囚犯两难的问题在现实中常常出现n比如两家企业的价格战苏宁遵守协议违约降价国美遵守协议100，10030， 130违约降价130， 3070， 70囚徒困境 (Prisoner’s Dilemma)17一个例子n失效的石油协定n两个OPEC成员国：沙特与科威特n每个国家都有两种行动：增产或保持产量n保持产量可以获得稳定的利益；n一方增产一方保持，则增产的一方可以获得多一点的利益，而保持的一方利益受损；n双方都增产，供严重大于求，利益均损n两国如何决策呢？参与人（局中人）行动n结果和报酬18同时行动和纳什均衡n决策分析n假设：同时行动，不完全信息，各自追求自己的利益最大增产保持增产保持沙特科威特n科威特的策略：n不管沙特如何，我都增产；n不管沙特如何，我都保持；n沙特的策略：n不管科威特如何，我增产n不管科威特如何，我保持(6, 6)(7, 4)(4, 7)(5, 5)n结果：双方都增产……19同时行动和纳什均衡n决策分析n纳什均衡增产保持增产(5, 5)(7, 4)保持(4, 7)(6, 6)沙特科威特n一些结论n个人利益与集体利益的冲突n协议以及制度的安排，若要产生效力，需是纳什均衡20同时行动和纳什均衡n纳什均衡的关键：无人愿意打破僵局n给定一个状态，是否有人单独愿意去改变？增产保持增产(5, 5)(7, 4)保持(4, 7)(6, 6)沙特科威特纳什均衡点21性别战博弈 (The Battle of Sex)n一男一女试图安排一个晚上的娱乐内容n策略：“歌剧”、“拳击”；不过男女有别n支付矩阵(Payoff Matrix)如下：男 (The Man)歌剧拳击女 (The Lady)歌剧2， 10.5，0.5拳击0，01，222游戏：n规则：一群企业家，每一个人发给同样数目的货币例如１０００元，告诉他们可以全部、部分或者零地对一个名为“团体交换”的项目投资。

每一个人的投资额是保密的，并且每一个人都被告知在投资完成以后，所有人（不论投资与否）都将平均分配投资收益投资收益是实际的投资额乘以一个大于1但是小于全体人数的倍数n写出你的投资金额23纳什均衡 (Nash Equilibrium)n纳什均衡问题:n不存在纳什均衡的例子：n猜谜游戏（ Matching Pennies）：n零和博弈，一方所得即另一方所失，没有纳什均衡! B正面反面A正面1, -1-1, 1 反面-1，11, -124社会福利博弈：流浪汉寻找工作游荡政府救济3, 2-1, 3不救济-1，10, 025田忌赛马（左为田忌，上为齐王）2627策略&支付（Strategy & Payoffs）n其他例子：n协调博弈（Coordination games） n施密斯公司和琼公司分别决定生产何种大小的光盘和光驱n当两家公司卖的光驱和光盘配套时他们都将卖出较多的电脑n策略: “大” 或 “小” n支付矩阵如下28策略&支付（Strategy & Payoffs）n合作博弈: 支付矩阵琼公司大光驱小光驱施密斯公司大光盘2, 2-1, -1小光盘-1，-11, 129纳什均衡 (Nash Equilibrium )n纳什均衡问题:n例子：Insensitive to extreme payoffs (risks)琼公司大光驱小光驱施密斯公司大光盘2, 2-1000, -1小光盘-1，-11, 1In Practice, it is almost sure that Smith wants to “play safe” and never try “large”! 30支配策略 (Dominant Strategies )n如果某个参与人选择的最优策略不随其他参与人策略的变化而改变，这样的最优策略被称为“支配策略”。

n第一步：看参与人是否存在支配策略. n如何某个参与人存在支配策略，那么它必然会选择这个策略，而其他参与人将据此作出最优反应. n例子: n“囚徒困境”中是否存在“支配策略”? n“协调博弈”呢? 31被支配策略 (Dominated Strategies )n不论其他参与人选择什么策略，某参与人选择某个策略的支付都低于其他的策略，这样的策略被称为“被支配策略” n理性的参与人是不会选择被支配策略的 n如果存在支配策略，则其他策略都是被支配策略. n反之，如果存在被支配策略，则不一定存在支配策略32应用: 重复剔除的支配策略均衡n例子：33纳什均衡 (Nash Equilibrium )n对于相当多的博弈，我们无法使用重复剔除被支配策略的办法找出均衡解. n因而，必须找到一种求解均衡的一般方法. n纳什均衡的概念：n纳什均衡是完全信息静态博弈解的一般概念，构成纳什均衡的策略一定是重复剔除被支配策略过程中不能被剔除的战略 n在那身均衡中，没有人愿意选择其他的策略34纳什均衡 (Nash Equilibrium )n例子： n在下面的例子中，是否存在支配策略和被支配策略? 35纳什均衡问题n多重解! n例子: nBattle of Sex nCoordination Game男 (The Man) 歌剧拳击女 (The Lady)歌剧2， 10，0 拳击0，01，2 Jones LargeSmallSmithLarge2, 2-1, -1 Small-1，-11, 136纳什均衡 (Nash Equilibrium )n混合策略（ Mixed Strategies ）n混合策略是指参与人以一定的概率选择某种策略。

比如说，参与人以0.3的概率选择第一种策略，以以0.5的概率选择第二种策略，以 0.2的概率选择第三种策略n纳什均衡存在性定理: n每一个有限博弈至少存在一个纳什均衡（纯策略的或者混和策略的）. 37混合策略(Mixed Strategies )n例子：nCoordination GamenJones 以 (p, 1-p)的概率选择 (大, 小) nSmith 的期望支付为: n“大”: 2p+(-1)(1-p) = US(L |(p, 1-p))n“小”: (-1)p+1(1-p) = US(S |(p, 1-p)) n这两种选择对Smith来说应当是无差异的nUS(L |(p, 1-p)) = US(S |(p, 1-p))  p = 2/5 n因此Jones的最优混合策略为 (0.4, 0.6)n练习:找出Smith的最优混合策略.n猜谜游戏 n找出混合策略的纳什均衡 383940纳什均衡 (Nash Equilibrium )n纳什均衡不一定有效率• 蜈蚣虫游戏 (The Centipede Game ):• 在蜈蚣虫游戏中，有两个参与人, 1 和2，假设信息是完全的最初每个人的手中都只有1美元，他们轮流进行决策，来决定游戏是“继续”还是“停止”，游戏从参与人1开始。

当某个参与人选择“继续”时，他将失去1美元，而另一个参与人将得到2美元一旦某个参与人选择“停止”，则游戏结束否则，游戏将持续到两个参与人都获得100美元时结束41Player 1Player 2Player 1Player 2Player 1Player 2SCCC C CCSSSSS110 3 22 97100999998101100,10042最大最小策略 (Maxmin Strategies )n在博弈中参与人选择某种策略以最大化他可能得到的最小支付，我们把这种策略叫做最大最小策略 n通常发生在竞争市场的风险规避者身上43小中取大的保守策略将。

点击阅读更多内容