gametheory2-3.ppt
47页12 完全信息静态博弈完全信息静态博弈2.1 基本分析思路和方法基本分析思路和方法2.2 纳什均衡纳什均衡2.3 无限策略博弈分析和反应函数无限策略博弈分析和反应函数2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡 2.5 纳什均衡的存在性纳什均衡的存在性2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展2 2 完全信息静态博弈完全信息静态博弈完全信息静态博弈完全信息静态博弈2混合策略引例:警察与小偷混合策略引例:警察与小偷2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡32.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡u猜硬币博弈猜硬币博弈 1 -1 -11 -1 1 1-1反面反面正面正面反面反面正面正面没有一个策略组合构成纳什均衡没有一个策略组合构成纳什均衡盖币方盖币方猜猜币币方方该如何行动?该如何行动?((1)严格竞争博弈和混合策略的引进)严格竞争博弈和混合策略的引进42.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡行动原则行动原则: : ü 自己的策略选择不能预先被另一方知道或自己的策略选择不能预先被另一方知道或猜测猜测ü 在博弈的多次重复中,要避免自己的选择在博弈的多次重复中,要避免自己的选择带有规律性带有规律性ü 保证自身策略选择的随机性保证自身策略选择的随机性ü 以以一定的概率分布一定的概率分布在策略空间中随机选择在策略空间中随机选择混合策略混合策略52.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡l 博弈方博弈方按照一定的概率按照一定的概率,,随机地随机地从纯策略空间从纯策略空间中选择一种纯策略作为实际的行动。
中选择一种纯策略作为实际的行动u定义定义1:混合策略:混合策略62.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡l如猜币博弈中:博弈方的策略空间(正面,反面)如猜币博弈中:博弈方的策略空间(正面,反面)混合策略:混合策略:((q,,1-q)) 以概率以概率q选择选择正面正面,以概率,以概率1-q选择选择反面反面l 纯策略可以理解为混合策略的特例纯策略可以理解为混合策略的特例l如石头、剪刀、布中:博弈方的策略空间(石头,如石头、剪刀、布中:博弈方的策略空间(石头,剪刀,布)剪刀,布)混合策略:混合策略:((1/2,,1/4,,1/4)) 以概率以概率1/2选择选择石头石头,以概率,以概率1/4选择选择剪刀剪刀,,以概率以概率1/4选择选择布布7l 混合策略伴随的是混合策略伴随的是支付的不确定性支付的不确定性 面对不确定的结果时,该如何进行面对不确定的结果时,该如何进行策略选择呢?策略选择呢?盖币方盖币方猜币方 -1 11 -1 1 -1-1 1反面反面正面正面反面反面正面正面面对不确定的结果时,博弈方关心的是面对不确定的结果时,博弈方关心的是期望支付期望支付。
猜币博弈猜币博弈2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡8u定义定义2 2:混合策略纳什均衡:混合策略纳什均衡ü 纯策略纳什均衡是混合策略纳什纯策略纳什均衡是混合策略纳什均衡的特殊情形均衡的特殊情形ü 纳什均衡的实质:纳什均衡的实质:单独偏离没有单独偏离没有好处好处2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡9u社会福利博弈社会福利博弈 2 3 3-1 1-1 00游荡游荡流浪汉流浪汉政府政府救济救济不救济不救济寻找工作寻找工作没有一个策略组合构成纳什均衡没有一个策略组合构成纳什均衡2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略纳什均衡举例:混合策略纳什均衡举例:10例:社会福利博弈例:社会福利博弈 3 2-1 3 -1 1 0 0游荡游荡流浪汉流浪汉救济救济 0.5不救济不救济 0.5寻找工作寻找工作政府政府假定:政府的混合策略(假定:政府的混合策略(0.50.5,,0.50.5)。
在政府混合策略(在政府混合策略(0.5,0.50.5,0.5)下,)下,流浪汉的任何策流浪汉的任何策略(略(纯的纯的或或混合的混合的)带来的期望支付都是)带来的期望支付都是1.51.5因此,因此,流浪汉的流浪汉的任何一种策略任何一种策略都是对政府混合策略(都是对政府混合策略(0.50.5,,0.50.5)的)的最优反应最优反应0.50.5××2 2+0.5 +0.5 ××1 1=1.5=1.5则流浪汉:则流浪汉:EUEUL L(寻找工作)(寻找工作)= = EUEUL L(游荡)(游荡)= =0.50.5××3 3+0.5 +0.5 ××0 0=1.5=1.5表明:表明:2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡11 3 2-1 3 -1 1 0 0游荡游荡0.8流浪汉流浪汉救济救济不救济不救济寻找工作寻找工作0.2政府政府假定:流浪汉的混合策略(假定:流浪汉的混合策略(0.20.2,,0.80.8))表明:在流浪汉混合策略(表明:在流浪汉混合策略(0.2,0.80.2,0.8)下,政府)下,政府的任何策的任何策略(略(纯的纯的或或混合的混合的)带来的期望支付都是)带来的期望支付都是-0.2-0.2。
因此,政府因此,政府的的任何一种策略任何一种策略都是对流浪汉混合策略(都是对流浪汉混合策略(0.20.2,,0.80.8)的)的最优反应最优反应则政府:则政府:EUEUG G(救济)(救济)= = EU EUG G(不救济)(不救济)= = 0.20.2××((- -1 1)) +0.8 +0.8 ××0 0=-0.2=-0.20.20.2××3 3+0.8 +0.8 ××((- -1 1))=-0.2=-0.22.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡12ü 流浪汉的流浪汉的任何一种策略任何一种策略都是对政府都是对政府混合策略混合策略((0.50.5,,0.50.5))的的最优反应最优反应ü 政府政府的的任何一种策略任何一种策略都是对流浪汉都是对流浪汉混合策略混合策略((0.20.2,,0.80.8))的的最优反应最优反应• 流浪汉的流浪汉的混合策略(混合策略(0.20.2,,0.80.8))是对政府是对政府混合策略(混合策略(0.50.5,,0.50.5))的的最优反应最优反应。
• 政府的政府的混合策略(混合策略(0.50.5,,0.50.5))是对流浪汉是对流浪汉混合策略(混合策略(0.20.2,,0.80.8))的的最优反应最优反应得到混合策略组合:政府(得到混合策略组合:政府(0.50.5,,0.50.5)) 流浪汉(流浪汉(0.20.2,,0.80.8)) 每个参与人的混合策略都是给定对方每个参与人的混合策略都是给定对方混合策略时的最优策略混合策略时的最优策略混合策略混合策略纳什均衡纳什均衡2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡13社会福利博弈中的混合策略纳什均衡:社会福利博弈中的混合策略纳什均衡: 政府:政府:((0.50.5,,0.50.5))???? 流浪汉:流浪汉:((0.20.2,,0.80.8))????如何求解混合策略纳什均衡?如何求解混合策略纳什均衡?2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡14u 求解混合策略纳什均衡求解混合策略纳什均衡盖币方盖币方猜猜币币方方 -1 11 -1 1 -1-1 1反面反面正面正面反面反面正面正面• 支付等值法支付等值法• 支付最大化法支付最大化法例例1:猜币博弈:猜币博弈2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡15盖盖币币方方猜币方猜币方 -1 1 1 -1 1 -1 -1 1反面反面正面正面反面反面正面正面l支付等值法支付等值法 如果一个混合策略(而不是纯策略)是盖币方的最优如果一个混合策略(而不是纯策略)是盖币方的最优选择,一定意味着盖币方在正面与反面之间是无差异的。
选择,一定意味着盖币方在正面与反面之间是无差异的2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡16盖盖币币方方猜币方 -1 1 1 -1 1 -1 -1 1反面反面正面正面反面反面正面正面l支付最大化法支付最大化法猜币方以猜币方以0.50.5的概率选择正面,的概率选择正面,以以0.50.5的概率选择反面的概率选择反面2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡17盖盖币币方方猜币方猜币方 -1 1 1 -1 1 -1 -1 1反面反面正面正面反面反面正面正面盖币方以盖币方以0.50.5的概率选择正面,的概率选择正面,以以0.50.5的概率选择反面的概率选择反面2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡18猜币方猜币方反面反面盖币方盖币方 -1 11 -1 1 -1-1 1反面反面正面正面反面反面正面正面2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡盖盖币币方方猜币方猜币方盖币方盖币方正面正面猜币方猜币方正面正面盖币方盖币方反面反面19 3 2-1 3 -1 1 0 0游荡游荡流浪汉流浪汉救济救济不救济不救济寻找工作寻找工作政府政府2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡例例2:社会福利博弈:社会福利博弈20 3 2-1 3 -1 1 0 0游荡游荡流浪汉流浪汉救济救济不救济不救济寻找工作寻找工作政府政府2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡21政府政府不救济不救济流浪汉流浪汉流浪汉流浪汉 3 2-1 3 -1 1 0 0游荡游荡救济救济不救济不救济寻找工作寻找工作政府政府救济救济流浪汉流浪汉2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡22u例例3 3:激励的悖论:激励的悖论——小偷和守卫的博弈小偷和守卫的博弈偷偷不偷不偷不睡不睡睡睡 小偷小偷守卫守卫 一一小偷小偷欲偷窃有欲偷窃有守卫守卫看守的仓库,若小偷去偷看守的仓库,若小偷去偷时守卫睡觉(不负责任),则小偷偷窃成功(令其时守卫睡觉(不负责任),则小偷偷窃成功(令其价值为价值为V V),若守卫没有睡觉(尽职尽责),则小偷),若守卫没有睡觉(尽职尽责),则小偷会被抓住坐牢(设其效用为会被抓住坐牢(设其效用为-P);-P);假设守卫睡觉而未假设守卫睡觉而未被偷的效用为被偷的效用为S S,守卫睡觉而被偷则被解雇,其效用,守卫睡觉而被偷则被解雇,其效用为为-D-D。
V,,-D -P,,0 0,,S 0,,0纯策略均衡??纯策略均衡??•存在混合策略均衡存在混合策略均衡2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡232.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡24u例例4 4:监督博弈:监督博弈——以税收检查为例以税收检查为例检查检查不检查不检查不逃税不逃税逃税逃税税收机关税收机关纳税人纳税人•不存在纯策略均衡不存在纯策略均衡•计算混合策略纳什均衡计算混合策略纳什均衡为什么应纳税款越多,纳税人逃税的概率越小?为什么应纳税款越多,纳税人逃税的概率越小?说明说明……2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡25足球足球芭蕾芭蕾芭蕾芭蕾足球足球小小明明小红小红2,10,0-1,-11,22.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡 纳什均衡:纳什均衡:纳什均衡:纳什均衡:( ( ( (足球足球足球足球, , , ,足球足球足球足球) ) ) )、、、、( ( ( (芭蕾芭蕾芭蕾芭蕾, , , ,芭蕾)芭蕾)芭蕾)芭蕾)((2)多重均衡博弈和混合策略)多重均衡博弈和混合策略Ø 博弈方的决策思路和原则与博弈方的决策思路和原则与博弈方的决策思路和原则与博弈方的决策思路和原则与没有纯策略纳什均没有纯策略纳什均没有纯策略纳什均没有纯策略纳什均衡的严格竞争博弈衡的严格竞争博弈衡的严格竞争博弈衡的严格竞争博弈有所不同有所不同有所不同有所不同。
Ø 在纯策略范围内,无法对博弈方的选择提出确在纯策略范围内,无法对博弈方的选择提出确在纯策略范围内,无法对博弈方的选择提出确在纯策略范围内,无法对博弈方的选择提出确定性建议定性建议定性建议定性建议26足球足球芭蕾芭蕾芭蕾芭蕾足球足球小小明明小红小红2,10,0-1,-11,22.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡博弈方通过协商可获得较高的得益博弈方通过协商可获得较高的得益博弈方通过协商可获得较高的得益博弈方通过协商可获得较高的得益27以社会福利博弈为例:以社会福利博弈为例: 3 2-1 3 -1 1 0 0游荡游荡流浪汉流浪汉救济救济不救济不救济寻找工作寻找工作政府政府2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡((3)混合策略反应函数)混合策略反应函数28政府的最佳反应函数:2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡29 3 2-1 3 -1 1 0 0游荡游荡流浪汉流浪汉救济救济不救济不救济寻找工作寻找工作政府政府2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡30流浪汉的最佳反应函数流浪汉的最佳反应函数::2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡31流浪汉的最佳反应函数流浪汉的最佳反应函数::政府的最佳反应函数:政府的最佳反应函数:2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡32乙乙甲甲ACRT3,,10,,21,,0M0,,21,,02,,1B1,,2-1,,30,,1练习练习练习练习1 1:博弈:博弈:博弈:博弈GG的得益矩阵如图所示,求混合策的得益矩阵如图所示,求混合策的得益矩阵如图所示,求混合策的得益矩阵如图所示,求混合策略纳什均衡。
略纳什均衡略纳什均衡略纳什均衡2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡甲:甲:甲:甲:B B是相对于是相对于是相对于是相对于T T的严格下策的严格下策的严格下策的严格下策乙:乙:乙:乙:R R是相对于是相对于是相对于是相对于A A的严格下策的严格下策的严格下策的严格下策33博弈方博弈方2博博弈弈方方1左左右右上上1,,01,,0中中2,,00,,2下下0,,33,,0练习练习练习练习2 2:博弈:博弈:博弈:博弈GG的得益矩阵如图所示,求混合策略的得益矩阵如图所示,求混合策略的得益矩阵如图所示,求混合策略的得益矩阵如图所示,求混合策略纳什均衡纳什均衡纳什均衡纳什均衡2.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡342.4 2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡352 完全信息静态博弈完全信息静态博弈2.1 基本分析思路和方法基本分析思路和方法2.2 纳什均衡纳什均衡2.3 无限策略博弈分析和反应函数无限策略博弈分析和反应函数2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡 2.5 纳什均衡的存在性纳什均衡的存在性2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展2 2 完全信息静态博弈完全信息静态博弈完全信息静态博弈完全信息静态博弈362.5 2.5 纳什均衡的存在性纳什均衡的存在性纳什均衡的存在性纳什均衡的存在性((1)纳什定理)纳什定理 在一个由在一个由n个博弈方的博弈个博弈方的博弈 中,如果中,如果n是有限的,且是有限的,且 都是有限集都是有限集 (对对 ),则该博弈至少存在一个纳什均衡,但可能包含混合策则该博弈至少存在一个纳什均衡,但可能包含混合策略。
略 每一个每一个有限博弈有限博弈至少存在一个纳什均衡(纯策至少存在一个纳什均衡(纯策略的或混合策略的)略的或混合策略的)372 完全信息静态博弈完全信息静态博弈2.1 基本分析思路和方法基本分析思路和方法2.2 纳什均衡纳什均衡2.3 无限策略博弈分析和反应函数无限策略博弈分析和反应函数2.4 混合策略和混合策略纳什均衡混合策略和混合策略纳什均衡 2.5 纳什均衡的存在性纳什均衡的存在性2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展2 2 完全信息静态博弈完全信息静态博弈完全信息静态博弈完全信息静态博弈382.6 2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展((1)帕累托和风险上策均衡)帕累托和风险上策均衡v帕累托上策均衡帕累托上策均衡甲甲乙乙 9 90 0 0 07 7RUDL•纯策略纳什均衡:纯策略纳什均衡:((U U,,L L)、()、(D D,,R R))((U U,,L L)帕累托上策均衡)帕累托上策均衡 在多重纳什均衡中,在多重纳什均衡中,可能存在某个纳什均衡可能存在某个纳什均衡,给,给所有博弈方带来的利益,都大于其它所有纳什均衡带所有博弈方带来的利益,都大于其它所有纳什均衡带来的利益。
来的利益39v风险上策均衡风险上策均衡甲乙 9 90 8 8 07 7RUDL•纯策略纳什均衡:纯策略纳什均衡:((U U,,L L)、()、(D D,,R R))((D D,,R R)风险上策均衡)风险上策均衡2.6 2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展 如果所有博弈方在预计其他博弈方采用两种纳如果所有博弈方在预计其他博弈方采用两种纳什均衡的策略的概率相同时,都偏爱其中某一纳什什均衡的策略的概率相同时,都偏爱其中某一纳什均衡,则该纳什均衡就是一个均衡,则该纳什均衡就是一个风险上策均衡风险上策均衡402.6 2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展((2)聚点和相关均衡)聚点和相关均衡v聚点均衡聚点均衡博弈方可能使用某些被抽象掉的信息达到一个均衡博弈方可能使用某些被抽象掉的信息达到一个均衡((SchellingSchelling,,19601960))例例1 1:情侣博弈:纳什均衡:情侣博弈:纳什均衡( (足球足球, ,足球足球),(),(芭蕾芭蕾, ,芭蕾芭蕾) )例例2 2:分钱博弈:分钱博弈假设两个人分一百块钱,每个人独立地把自己要假设两个人分一百块钱,每个人独立地把自己要求的数额(分别记为求的数额(分别记为x1x1和和x2 x2 )写在纸上,然后由公)写在纸上,然后由公正的第三方来主持和判定最终的分配数额。
正的第三方来主持和判定最终的分配数额规则:如果规则:如果x1+x2 ≤100x1+x2 ≤100,则每个人得到自己要,则每个人得到自己要求的数额;否则两个人一分钱都得不到求的数额;否则两个人一分钱都得不到纳什均衡纳什均衡:任何满足:任何满足x1+x2 =100x1+x2 =100的(的( x1 x1,,x2x2))41v相关均衡相关均衡2.6 2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展 博弈方在博弈开始之前通过磋商并决定建立一博弈方在博弈开始之前通过磋商并决定建立一种种““信号装置信号装置””,他们一致同意选择策略依赖于,他们一致同意选择策略依赖于““信号装置信号装置””的某种信号的随机发生通过这种建立的某种信号的随机发生通过这种建立在博弈之外的随机过程而达到的结果称为在博弈之外的随机过程而达到的结果称为相关均衡相关均衡((Aumann,1974Aumann,1974) )42甲乙 6 1 0 0 5 5 1 6RUDL•纯策略纳什均衡:纯策略纳什均衡:((U,LU,L)) ((D,RD,R))v相关信号规则相关信号规则1(1(丢硬币丢硬币) )::ü甲:正面选甲:正面选U U;反面选;反面选D Dü乙:正面选乙:正面选L L;反面选;反面选R Rv相关信号规则相关信号规则2(2(掷色子掷色子) )::ü甲:甲:1 1或或2 2选选U U;;3-63-6选选D Dü乙:乙:1-41-4选选L L;;5 5或或6 6选选R R(U,L), (D,R) (U,L), (D,R) 各以各以1/21/2的概的概率发生率发生(U,L), (D,R)(U,L), (D,R)和和(D,L)(D,L)各以各以1/31/3的概率出现的概率出现•混合策略纳什均衡混合策略纳什均衡((((1/2,1/21/2,1/2)), ,((1/2,1/21/2,1/2))))(期望得益((期望得益(3 3,,3 3))))2.6 2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展双方期望得益多少?双方期望得益多少?双方期望得益多少?双方期望得益多少?432.6 2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展((3)共谋和防共谋均衡)共谋和防共谋均衡v多人博弈的共谋问题多人博弈的共谋问题0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3——A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3——B•纯策略纳什均衡:纯策略纳什均衡: ((U,,L,,A)、()、(D,,R,,B))前者帕累托优于后者前者帕累托优于后者博弈的结果会是什么呢?博弈的结果会是什么呢?存在存在共谋共谋(Coalition)的可能性的可能性44v防共谋均衡防共谋均衡2.6 2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展如果一个博弈的某个策略组合满足下列要求:如果一个博弈的某个策略组合满足下列要求:((1)没有任何单个博弈方的)没有任何单个博弈方的“串通串通”会改变博弈的会改变博弈的结果,即单独改变策略无利可图;结果,即单独改变策略无利可图;((2)给定选择偏离的博弈方有再次偏离的自由时,)给定选择偏离的博弈方有再次偏离的自由时,没有任何两个博弈方的串通会改变博弈的结果;没有任何两个博弈方的串通会改变博弈的结果;((3)依此类推,直到所有博弈方都参加的串通也不)依此类推,直到所有博弈方都参加的串通也不会改变博弈的结果。
会改变博弈的结果满足上述要求的均衡策略组合称为满足上述要求的均衡策略组合称为“防共谋均衡防共谋均衡” 一个策略组合,不仅要求参与人在这个策略组一个策略组合,不仅要求参与人在这个策略组合下没有单独偏离的激励,而且也要求没有合伙集合下没有单独偏离的激励,而且也要求没有合伙集体偏离的激励体偏离的激励452.6 2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3——A-2,-2,0-5,-5,0-5,-5,0-1,-1,5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3——B•纯策略纳什均衡:纯策略纳什均衡: ((U,,L,,A)、()、(D,,R,,B))防共谋纳什防共谋纳什均衡均衡46练习练习1::下图是两人博弈的标准式表述:下图是两人博弈的标准式表述:上上下下右右左左参与人参与人1参与人参与人23,30,11,02,2((1 1)找出此博弈的所有纯策略纳什均衡找出此博弈的所有纯策略纳什均衡2 2)哪个纳什均衡是帕累托上策均衡?)哪个纳什均衡是帕累托上策均衡?((3 3)哪个纳什均衡是风险上策均衡?)哪个纳什均衡是风险上策均衡?2.6 2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展47练习练习2::下述三人博弈中,博弈方下述三人博弈中,博弈方1选择行策略选择行策略U或或D,博弈方,博弈方2选择列策略选择列策略L或或R,博弈方,博弈方3选择矩阵选择矩阵A或矩阵或矩阵B。
UDRL博博弈弈方方1博弈方博弈方25,5,8 0,0,50,0,5 7,7,0博弈方博弈方3——矩阵矩阵AUDRL博博弈弈方方1博弈方博弈方2博弈方博弈方3——矩阵矩阵B((1 1)找出此博弈的所有纯策略纳什均衡找出此博弈的所有纯策略纳什均衡2 2)在所有纯策略纳什均衡中,哪个是抗共谋均衡)在所有纯策略纳什均衡中,哪个是抗共谋均衡??2.6 2.6 纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展纳什均衡的选择和分析方法扩展3,3,5 0,0,50,0,5 4,4,6。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


