
竞争策略博弈论完全.ppt
86页博弈论-- 企业管理中的竞争问题董志勇 博士 副教授北京大学经济学院院长助理1市场竞争程度n(1)商品总量n(2)供大于求n(3)利润率n(4)企业寿命n(5)管理者思考时间2博弈论和策略行为 Game Theory & Strategic Behaviors3智猪博弈石头、剪刀、布田忌赛马麻将……4本讲计划( Lecture Plan):n博弈论(Game Theory )n策略&支付矩阵(Strategy & Payoff Matrix )n占优策略( Dominant Strategies )n纳什均衡(Nash Equilibrium)n最大最小策略& 混合策略(Maximin Strategy & Mixed Strategy )n策略行为(Strategic Behavior) 5n念出纸片上的数字,计算平均数的2/3n找出获胜者猜数试验6n每个参与人意识到其他参与人的存在n参与人的行为会相互影响n每个参与人推测其他参与人可能采取的 行为,根据其推测决定自己的行为n这是一个典型的博弈猜数试验分析7简单思路n每位同学随机提出0-100间的数,则平均数为 50,2/3*50=33,可以提出33n但是,如果预料到其他同学也这样分析,则 应该提出2/3*33=22n以此类推,则应该提出2/3*22=14, 2/3*14=9,2/3*9=6,2/3*6=4。
0n如果是一群博弈专家作次试验,则答案为0, 同学们知道彼此都不是博弈专家,所以多数 没有提出08博弈试验2—拍卖试验n规则n拍卖物品n每位同学在纸片上写下自己的出价,价格 必须大于零,没有上限n出价最高者得这n无论得或不得,必须支付所出价:其余出价 人的报价将收集起来作为活动经费(eg. 一起出去吃顿饭)n思考1分钟,写下出价9拍卖试验n公布各个同学的出 价,找出获胜者n各位同学是否后悔 自己的出价?10试验分析n知道其他同学出价后,一定有同学会后 悔自己的出价,本博弈不存在简单的均 衡n如果参与博弈的人越多,你的出价会变 化吗?怎么变化?n人数越多,出价越低11博弈论的基本概念:• 参与人( Players ): 参与人指的是一个博弈中的决策 主体,他的目的是通过选择行动以最大化自己的支付 水平 • 行动( Action or Move): 行动是参与人在博弈的某个 时点的决策变量 • 信息( Information): 信息是参与人有关博弈的知识 ,特别是有关“自然”的选择、其他参与人的特征和行 动的知识 • 策略( Strategy): 战略是参与人在给定信息集情况下 的行动规则,它规定参与人在什么时候选择什么行动 。
• 支付( Payoffs ): 支付或者是指在一个特定的战略 组合下参与人得到的确定效用水平,或者是指参与人 得到的期望效用水平12博弈与决策—一个例子n10位同学到餐厅用餐nA、如果分别点菜,分别付账,是博弈 还是决策?nB、如果共同点菜,平均付账,是博弈 还是决策?nA、决策, B、博弈13策略&支付(Strategy & Payoffs)n博弈论把人间一切竞争活动看成是玩策略游戏 这种策略游戏是在一定的游戏规则之下进行n它的两个最基本的概念是策略与支付矩阵n一种策略(Strategy)表示游戏参与人的一套运作计划和 手段如“降价15%”就是一种策略n收益矩阵(Payoff matrix)是表示游戏参与者在各种不 同策略下的利润额的一套支付表格n寡头垄断,尤其是双寡头垄断竞争,特别适合使 用博弈论研究14囚徒困境 (Prisoner’s Dilemma):n两个嫌犯被捕并受到指控,但除非至少一人招供 犯罪,警方并无充分证据将其按罪判刑n警方将他们分开审讯(不能沟通),并对他们说明不 同行动带来的后果n如果二人都不坦白,只能判简单刑事罪,坐牢1个月n如果二人都坦白,两人都会定罪,判刑六个月;n如果其中一个坦白,另一个不坦白;那么坦白者马上释放(从 宽)、不坦白者将会判刑九个月。
n请问两个嫌犯该怎么办?15囚徒困境 (Prisoner’s Dilemma)n策略(Strategy): “沉默” & “招认”n支付矩阵(Payoff Matrix)如 下:囚犯2沉默招认囚犯1沉默-1, -1-9, 0 招认0, -9-6, -616n囚犯两难的问题在现实中常常出现n比如两家企业的价格战苏宁遵守协议违约降价国美遵守协议100,10030, 130违约降价130, 3070, 70囚徒困境 (Prisoner’s Dilemma)17一个例子n失效的石油协定n两个OPEC成员国: 沙特 与 科威特n每个国家都有两种行动:增产 或 保持产 量n保持产量可以获得稳定的利益;n一方增产一方保持,则增产的一方可以获得多一 点的利益,而保持的一方利益受损;n双方都增产,供严重大于求,利益均损n两国如何决策呢?参与人 (局中人)行动n结果和报酬18同时行动和纳什均衡n决策分析n假设:同时行动,不完全信息,各自追求自己的利益最大增产保持增产保持沙特科 威 特n科威特的策略:n不管沙特如何,我都 增产;n不管沙特如何,我都 保持;n沙特的策略:n不管科威特如何,我增 产n不管科威特如何,我保 持(6, 6)(7, 4)(4, 7)(5, 5)n结果:双方都增产……19同时行动和纳什均衡n决策分析n纳什均衡增产保持增产(5, 5)(7, 4)保持(4, 7)(6, 6)沙特科 威 特n一些结论n个人利益与集体利益 的冲突n协议以及制度的安排 ,若要产生效力,需 是纳什均衡20同时行动和纳什均衡n纳什均衡的关键:无人愿意打破僵局n给定一个状态,是否有人单独愿意去改变?增产保持增产(5, 5)(7, 4)保持(4, 7)(6, 6)沙特科 威 特纳什均衡点21性别战博弈 (The Battle of Sex)n一男一女试图安排一个晚上的娱乐内容n策略:“歌剧”、“拳击”;不过男女有别n支付矩阵(Payoff Matrix)如下:男 (The Man)歌剧拳击女 (The Lady)歌剧2, 10.5,0.5拳击0,01,222游戏:n规则:一群企业家,每一个人发给同样数目 的货币例如1000元,告诉他们可以全部 、部分或者零地对一个名为“团体交换”的项 目投资。
每一个人的投资额是保密的,并且 每一个人都被告知在投资完成以后,所有人 (不论投资与否)都将平均分配投资收益 投资收益是实际的投资额乘以一个大于1但是 小于全体人数的倍数n写出你的投资金额23纳什均衡 (Nash Equilibrium)n纳什均衡问题:n不存在纳什均衡的例子:n猜谜游戏( Matching Pennies):n零和博弈,一方所得即另一方所失,没有纳什均衡! B正面反面A正面1, -1-1, 1 反面-1,11, -124社会福利博弈:流浪汉寻找 工作游荡政府救济3, 2-1, 3不救 济-1,10, 025田忌赛马(左为田忌,上为齐王 )2627策略&支付(Strategy & Payoffs)n其他例子 :n协调博弈(Coordination games) n施密斯公司和琼公司分别决定生产何种大 小的光盘和光驱n当两家公司卖的光驱和光盘配套时他们都 将卖出较多的电脑n策略: “大” 或 “小” n支付矩阵如下28策略&支付(Strategy & Payoffs)n合作博弈: 支付矩阵琼公司大光驱小光驱施密斯公司大光盘2, 2-1, -1小光盘-1,-11, 129纳什均衡 (Nash Equilibrium )n纳什均衡问题:n例子:Insensitive to extreme payoffs (risks)琼公司大光驱小光驱施密斯公司大光盘2, 2-1000, -1小光盘-1,-11, 1In Practice, it is almost sure that Smith wants to “play safe” and never try “large”! 30支配策略 (Dominant Strategies )n如果某个参与人选择的最优策略不随其他参与人 策略的变化而改变,这样的最优策略被称为“支 配策略”。
n第一步: 看参与人是否存在支配策略. n如何某个参与人存在支配策略,那么它必然会选择这 个策略,而其他参与人将据此作出最优反应. n例子: n“囚徒困境”中是否存在“支配策略”? n“协调博弈”呢? 31被支配策略 (Dominated Strategies )n不论其他参与人选择什么策略,某参与人 选择某个策略的支付都低于其他的策略, 这样的策略被称为“被支配策略” n理性的参与人是不会选择被支配策略的 n如果存在支配策略,则其他策略都是被支配策 略. n反之,如果存在被支配策略,则不一定存在支 配策略32应用: 重复剔除的支配策略均衡n例子:33纳什均衡 (Nash Equilibrium )n对于相当多的博弈,我们无法使用重复剔 除被支配策略的办法找出均衡解. n因而,必须找到一种求解均衡的一般方法. n纳什均衡的概念:n纳什均衡是完全信息静态博弈解的一般概念,构成 纳什均衡的策略一定是重复剔除被支配策略过程中 不能被剔除的战略 n在那身均衡中,没有人愿意选择其他的策略34纳什均衡 (Nash Equilibrium )n例子: n在下面的例子中,是否存在支配策略和被支配策略? 35纳什均衡问题n多重解! n例子: nBattle of Sex nCoordination Game男 (The Man) 歌剧拳击 女 (The Lady)歌剧2, 10,0 拳击0,01,2 Jones LargeSmallSmithLarge2, 2-1, -1 Small-1,-11, 136纳什均衡 (Nash Equilibrium )n混合策略( Mixed Strategies )n混合策略是指参与人以一定的概率选择某种 策略。
比如说,参与人以0.3的概率选择第一 种策略,以以0.5的概率选择第二种策略,以 0.2的概率选择第三种策略n纳什均衡存在性定理: n每一个有限博弈至少存在一个纳什均衡(纯策略的 或者混和策略的). 37混合策略(Mixed Strategies )n例子:nCoordination GamenJones 以 (p, 1-p)的概率选择 (大, 小) nSmith 的期望支付为: n“大”: 2p+(-1)(1-p) = US(L |(p, 1-p))n“小”: (-1)p+1(1-p) = US(S |(p, 1-p)) n这两种选择对Smith来说应当是无差异的nUS(L |(p, 1-p)) = US(S |(p, 1-p)) p = 2/5 n因此Jones的最优混合策略为 (0.4, 0.6)n练习:找出Smith的最优混合策略.n猜谜游戏 n找出混合策略的纳什均衡 383940纳什均衡 (Nash Equilibrium )n纳什均衡不一定有效率• 蜈蚣虫游戏 (The Centipede Game ):• 在蜈蚣虫游戏中,有两个参与人, 1 和2,假设信息 是完全的最初每个人的手中都只有1美元, 他们 轮流进行决策,来决定游戏是“继续”还是“停止”, 游戏从参与人1开始。
当某个参与人选择“继续”时 ,他将失去1美元,而另一个参与人将得到2美元 一旦某个参与人选择“停止”,则游戏结束否则, 游戏将持续到两个参与人都获得100美元时结束41Player 1Player 2Player 1Player 2Player 1Player 2SCCC C CCSSSSS110 3 22 97100999998101100,10042最大最小策略 (Maxmin Strategies )n在博弈中参与人选择某种策略以最大化他 可能得到的最小支付,我们把这种策略叫 做最大最小策略 n通常发生在竞争市场的风险规避者身上43小中取大的保守策略将。
