
微分博弈理论.ppt
19页博弈论 汇报人:张甲乐什么是博弈论•博弈论亦称对策论,运筹学的一个分支是研究有利害冲突的双方在竞争性活动中,如何制胜对方的最优策略的数学理论和方法博弈论的发展史《战国策》《孙子兵法》《博弈论和经济行为》《博弈·动态规划和计算机》微分对策理论古代产生了朴素的博弈论的思想1944年美国的J·冯诺意曼和O·摩根司坦发表了巨著美国的数学家贝尔曼于1951年又发表了名著1965年埃萨克提出了在追踪问题中双方都能自由决策行动的微分对策理论发展中博弈论的基本要素•构博弈论由三个基本要素成: 局中人(如竞争的双方); 策略(每个局中人可供选择的行动方案; 一局对策的得失博弈论的基本模型•博弈论最基本的模型是两人、零和对策•每一个局中人,不管他选择什么方案,另一局中人总希望使对方损失最大化,也就是每个局中人将选择使另一局中人把对方损失最大化的企图最小化的策略,这就是博弈论的最佳策略准则纳什均衡点•纳什平衡,又称为非合作赛局平衡,是博弈论的一个重要概念,以约翰·纳什命名如果某情况下无一参与者可以独自行动而增加收益,则此策略组合被称为纳什均衡点。
经典案例:囚徒困境•一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年如果两人均不招供,将最有利,只被判刑半年经典案例:囚徒困境•两人同时陷入招供还是不招供的两难处境 但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供, 这种情况就称为纳氏均衡点• 这时,个体的理性利益选择是与整体的理性利益选择不一致的鞍点(Saddle point)•在微分方程中,沿着某一方向是稳定的,另一条方向是不稳定的奇点,叫做鞍点•在泛函中,既不是极大值点也不是极小值点的临界点,叫做鞍点•在矩阵中,一个数在所在行中是最大值,在所在列中是最小值,则被称为鞍点•在物理上要广泛一些,指在一个方向是极大值,另一个方向是极小值的点鞍点问题•在证券市场上,股民们总想“在最小风险下获得最大收益”生产着总想“在最小投入下获得最大产出”,都是这一辨证思想的体现将这一思想用数学模型表述,己不再是单纯的极大或极小问题,而是“极大中的极小”或“极小中的极大”•在数学中,把函数上具有上述“极大一极小”性质的点称为鞍点(Sadd了lePoint)。
把同鞍点有关的数学问题称为鞍点问题形象地说,鞍点就是处于“马鞍中央的点”,从纵向看取极小值,从横向看取极大值鞍点的含义•下面用二元函数z=f(x,y)来说明鞍点的含义: 对于二元函数z=f(x,y),(x*,y*)为其上一点若 在邻域|x-x*|<£,|y-y*|<£内 恒成立则称(x*,y*)为函数z=f(x,y)的鞍点 鞍点具有这样的特征:当x=x*为常数,y变化时,函数f(x,y)在(x*,y*)取极小值:当y=y*为常数,x变化时,函数f(x,y)在(x*,y *)取极大值鞍点规划(Saddle Point Programming)•鞍点具有特殊的性质,无论是理论上还是实践上,有许多问题与鞍点有关于是一种与鞍点对应的数学规划就产生并发展起来,称为鞍点规划•所谓鞍点规划就是以寻求目标函数的鞍点为目的的一种数学规划,用以解决“极大值的极小化”或“极小值的极大化”问题鞍点规划的数学模型•鞍点规划的数学模型:•上述鞍点规划模型中,决策变量x,y没有加任何限制实际上,x,y经常受到一定的约束,于是有以下约束鞍点规划问题:工程应用实例:防侧翻控制器设计•它给出了一种基于微分博弈理论和进化遗传算法的防侧翻控制器设计方法。
•将防侧翻问题描述为一个非合作,零和,二人微分博弈模型•分别把驾驶员转向角输入和主动防侧倾杆视为扰动方和控制方汽车前视图微分博弈模型•方程(1)和(2)分别为汽车系统的状态方程和博弈的目标函数上述方程中U(控制方)试图使L最小,而W(扰动方)试图使L最大•方程(3)将这一微分博弈描述成最小最大值优化问题•L被设为在一个给定的仿真周期中,汽车侧翻角绝对值的最大值,如方程(4)所示纳什均衡解•分析可得存在纳什均衡解(u*,w*),使得鞍点不等式(5): 成立•纳什均衡解的含义是在最坏扰动W*(试图使L最大)工况下,最好的控制器输入是U*(试图使L最小);反之亦然纳什均衡解•其均衡解是通过进化遗传算法得到的,对进化遗传算法的适应性估计是在汽车仿真软件Carsim上进行的进化遗传算法的适应性估计进化遗传算法流程图数值仿真及结论•通过分析伯德图和在Carsim中的仿真结果,证明它设计的控制器保证了在最坏的转向角输入工况下最坏防侧翻性能,同时分别通过抵抗路面扰动以及侧向加速度,提供了良好的乘坐质量以及防侧翻性能。












