
微分对策的具体应用.doc
4页微分对策的具体应用对策这一概念有许多推广,微分对策是其中之一,而且出现较 早,发展也较成熟微分对策是局中人在每一时刻t皆要做岀一个决 定的连续情况,例如追逃问题追和逃的每时每刻皆要做出某种选择 设在时刻t,对局的状态变量(例如,位置、方向、速度等)为 x(t)=(X](t),x2(t), , Xn(t))o设在此时,局中人甲选取的策略(方向速度等)为y=(yi,y2, ,yp),其中yi=yi(t),—般可设逐<=沪=6如6是常数;局中人乙选取的策略z二⑵,Z2,……,Zq)也满足类似的关系 y,z称为控制变量(策略),他们按照微分方程组dxi/dt=fj(x;y;z) (i=l,2,……,n)来控制状态变量的运动当状态主变量达到某一给定 的闭集时对局即告结束寻求最优的y,z是微分对策的基本课题之一下面看一道运用微 分对策的题冃Velociraptor,是生活在距今约七千五百万年前的一种食肉恐龙 古生物学家认为这是一种非常顽强地猎食其它动物的野兽,而且可能 是成对或成群地外出追猎然而,不幸的是,无法像观察现代哺乳食 肉动物在野外是如何追猎其食物的行为那样,观察到Velociraptor在 野外的追猎行为。
一组古生物学家来到你们队请求你们在Velociraptor 的追猎行为的建模方面给予帮助,他们希望把你们的结果和研究狮 子、老虎及其它类似的食肉动物行为的生物学家的研究报告相比较成年的Velociraptor平均长三米,骯高0.5米,体重约为45千克 据估计,这种动物跑得非常快速度可达六十千米每小时,持续时间 约十五秒在一开始的突然加速后,它要停下来并在其肌肉中积聚乳 酸以恢复体力假设Velociraptor捕食一种称为Thescelosaurus的大小,与 Velociraptor差不多的双足食草动物从Velociraptor化石的生物力学 分析得知Velociraptor可以五十千米每小时的速度长时间奔跑假设Velociraptor是一只独居的猎食其它动物的野兽,试设计单 个的Velociraptor潜近猎物并追猎一只单个的Thescelosaurus策略以及 被追捕物逃避追捕的策略的数学模型假设当Velociraptor潜近到 Thescelosaurus的十五米范围内时,Thescelosaurus总能觉察到,根据 栖息地及气候条件的不同,甚至在(多达五十米的)更大的范围内觉 察欲捕食它的动物的存在。
此外,由于Velociraptor的身体结构及体 能,它在全速奔跑时的拐弯半径是受到限制的据估计,拐弯半径大 约是其骯高的三倍另一方面,Thescelosaums却是极其灵活的,其 拐弯半径只有0.5米更现实地假设Velociraptor成对外出追猎,试设计一个新的关于 成对的Velociraptor潜近猎物并追猎一只单个的Thescelosaurus的策略 以及被追捕物逃避追捕的策略的数学模型利用前面给出的假设和限 制下面我们用对策数论语表示这一问题的数学陈述捕食者和被捕食者之间的拦截和逃避的竞争属于线性微分对策 的广泛而形式不同的范筹在追捕者和逃跑者的微分对策中,两个或 多个局中人在遵从对它们的运动的某些限制下试图极大化或极小化 它们Z间的距离和经典的对策论不同,微分对策必须包括微分方程方法的应用 以及利用定义局中人的状态和目标的连续的波动在传统的或者微分的对策中,局中人试图在一组可供选择的策 略中挑选策略使得称为支付函数的值极大化,其中每个局中人的支付 是由所有局中人的选择的某个函数确定的在零和对策情形,所有局 中人互相都处于直接竞争的地位使得由他们的支付函数表示的目标 正好符号相反。
追逃对策属于这个分类;追逐者试图使自己和逃跑者 Z间的距离极小,而逃跑者却试图使这个距离极大在Velociraptor Thescelosaumsp这样的追逐对策的情形,支付函数是一个简单 的二元函数:仅有的有关的结果就是抓住或者逃走相对于度对策, 这种对策称为类对策,度对策的支付可以在更大的可能值上取值在 有些情形,把类对策嵌入到度对策中,同时,把抓住时间(或者逃跑 者的分离时间)作为支付函数可能是有用的尽管在纯粹确定性的试 验中这不是必要的,但是一对特定的策略对的平均抓住时间可能提供 了一个策略的功效的有用的统计度量在微分对策中有两类变量:状态变量,它规定了任意给定时刻 整个系统的完全的结构,还有控制变量,对策的参与者用它以有利于 极大化它们自己的支付函数的方式来改变状态函数在惯用的追逃对 策中通常的状态变量是参与者的空间坐标;控制变量可以包括最犬旋 转角或者加速度向量所有局中人都可存取在任意给定点和时刻处的状态变量的一个 完全集的对策称为完全信息对策;若不是这样的对策称为非完全信息 对策非完全信息对策缺少精确的解析方法通常,评论这种对策的 最好的方法是用离散模型,它可以借助于简单的计算算法来实现。
不 幸的是,纯粹离散模型往往会冒如下的风险,即会模糊可能依赖于没 有量化的值的连续性的系统的本质细节仍然容许进行求解的计算方 法的合理的妥协就是半离散方法;时间离散化了,而空间坐标仍可取 整个实数值我们把猛禽捕猎作为一种半离散计算算法来实现Velociraptor问题具体化了两个局中人追逃对策中最有趣的情 形如果逃避者的最大速度大于追逐者的最大速度,那么逃避者的最 优策略就是以最大速度直接逃离追逐者,并总能成功地逃掉类似地, 如果追逐者在速度和机动性方面都更强,那么追逐者的最优策略就是 直接向逃避者运动,并保证能成功地猎得逃避者但在追逐者速度较 高,而逃避者更为灵活地情形,那就没有平凡的解法,最优对局可能 需要复杂的或非决定性的策略。












