
二人有限对策浅析.doc
14页二人有限对策浅析才商要:对策论的应用随着社会的发展越来越受到重视,而正确的解决方法对对策论的应用有 着决定性意义文章从一些最基本的对策论知识着手,较为系统地介绍了应用最广泛的一一 二人有限对策模型及其解法,尤其是对二人有限零和对策及其解法的介绍从而使人们对于对 策论的应用有了一个深入的了解关键词:对策论;最优策略;最优解现代对策理论是由匈牙利大数学家冯•诺伊曼于20世纪20年代开始创 立,伯44年他与经济学家奥斯卡•摩根斯特恩合作出版的巨著《博弈论与经 济行为》,标志着现代系统博弈理论的初步形成而其得到发展则是在50年 代以后从20世纪60年代开始设立的若贝尔经济学奖,至今已有4次将该奖项颁给对 策论研究者先后得奖的有10人这也从一个方面说明对策论的价值之重随着社会的不断发展,人们对问题的解决的要求也越来越高而对策论的出 现从理论上为问题的解决提供了一个较为理想的平台目前对策论已在军事部 署、自动控制、基本建设、地质勘探、海洋捕捞、农业抗灾、贸易斗争、税收激 励、医治疾病、体育竞赛中广泛运用在未来战争中,对策论也将扮演及其重要 的角色1. 对策论及其基本概念我们将具有斗争或竞争性质的现象称作对策现象。
对策论(GameTheory)又称为博弈论,是研究对策现象的数学理论与方法的 一门学科属于运筹学(OR)的一个分支它主要研究竞争的各方是否存在着最合 理的行动方案和如何找到这个合理方案也可以说对策论是关于利益冲突的一类 数学模型在讨论开始时,我们先来熟悉对策模型的一些基本概念局中人(Player)是指在一场竞争中有权决定自己行动方案的对策参与者 需要注意的是,局中人一定有决策权;局中人可以是个人也可以是集体,甚至可 以是物;当大自然充当局中人时,认为它是按自然规律变化的策略(Strategy)是指局中人在一场竞争或冲突中,一个可行的、自始自终通 盘筹划的行动方案一个局中人所有可能采取的策略总体称为该局中人的策略集 合在这里,策略不是指竞争过程中的某一步行动方案,而是指自始自终采取的 一整套行动方案,即一个决策序列效用(Utility) 一场竞争或冲突结束以后,对每个局中人的最终结果,统称 为得失或支付(pay off),即可以用数字或函数来表示每一局中人在货币、物质或 是精神、心理上的得失将这种衡量“得失”的标准,认为是局中人对于竞争 结果的价值观,称为效用全体局中人的“得失或支付”相加总是等于零,该对 策称为零和对策,否则称为非零和对策。
定义1.1】 G = {N,Si,Hi}称为对策(game),其中:N——局中人的集合,网=〃,n为局中人数目;Sl——第i个局中人的策略集,其元素s,E为第i个局中人某一策略;S——结局集合,S =SlxS2x...xSn;%——第i个局中人对于结局集合S的支付或效用对策论的模型G = {N,Si,Hi},充分体现了对策现象的三要素因此可以根 据这三个基本要素对各种对策进行分类而本文介绍的二人有限对策论模型,是 指一类具有二个局中人、且对策数目有限的模型可以用G = {Sl,S2,Hl,H2}表示 同时,可以根据其策略数目的不同将二人有限对策分为二人有限零和对策和二人 有限非零和对策文章将从这两个方面对二人有限对策进行分析2. 二人有限零和对策(矩阵对策)模型及其解法二人有限零和对策(Finite Zero Sum Two-person Game)也叫矩阵对策(Matrix Game),是指只有两个人参加对策的局中人,每个局中人都只有有限个策略可供 选择在任一局势下,两个局中人的赢得之和(h1+h2=o)总是等于零,即双方 的利益是激烈对抗的2.1矩阵对策的数学模型【定义2.1】在G = {Sl,S2,A}中,如果分别是局中人1、2的纯策略集,且Sl={a1,a2,...,am},S2 =(/?p/?2,.,雉车△ = 表示局中人 1 的赢得矩阵,则称G为矩阵对策(Matrix Game)。
其中%,时= =l,...,n)称为纯策略(pure strategy)A的元素为表示局中人1取策略% ,局中人2取策略片,结局为{%}时,局中人1的效用值,此时局中人2的效用值为-%例1】齐王赛马的故事战国时期,齐王和大将田忌进行赛马,双方约定各出三匹马一对一分别赛一 局,每胜一场赢一千金诚然,在相同的等级中,齐王的马比田忌的要好,似乎田忌必输无疑但田忌手下的谋士孙膑出了个主意,让田忌用下等马对付齐王的 上等马(输),用中等马对齐王的下等马(胜),用上等马对付齐王的中等马(胜), 结果反而净胜一千金从对策论的角度来看,“齐王赛马”是一个矩阵对策问题齐王的赢得表如 下:齐王\ 1的\蓊 效\齐王的策露、7\A上 中 下A上 下中A 中 上 下A 中 下 上A下 中 上A下上 中a,(上中下)31111-1%(上下中)1311-11% (中上下)1-13111%(中下上)-111311«5 (下中上)11-1131% (下上中)111-113于是,齐王的赢得矩阵可写成<31111-1]1311-111-13111A = (%)6x6 =-11131111-113111-11那么,田忌的赢得矩阵为-A。
2.2矩阵对策的求解 2.2.1纯策略(即有鞍点的矩阵对策)【定义2.2】(最优纯策略)设G = {禹,禹;A}为一矩阵对策,其中S] = {%%,•••%},禹={岗,”2,• • •片},人=,女睐 匕=max min {q〃"岭=minmax{%}使% = V2成立则称Vg=V]=V2为对策G的值,称使上式成立的结局(%*,艮*)为&的鞍点(saddle point),或称(%*,")为对策G在纯策中的解(或平衡局势),简称纯策略解,%•与分别称为局中人A、B的最优纯策略例2】某单位采购员在秋天要决定冬季取暖用煤的储量问题已知在正常的冬 季气温条件下要消耗15吨煤,在较暖和较冷的气温条件下要消耗10吨和20吨 假定冬季时的煤价随天气的冷暖程度有所变化,在较暖、正常、较冷条件下每吨 的煤价分别为100元、150元、200元,又设秋季时煤价每吨100元在没有关 于当年冬季准确的气象预报的条件下,秋季储煤多少吨能使单位的支出最少? 解:这一储量问题可以看成一个对策问题:把采购员当做局中人A,他又3个策略:在秋天时买10吨、15吨、20吨, 分别记为把大自然当做局中人B,大自然(冬季气温)又3个策略:较暖、正常、较冷,分别记为现在把该单位冬季取暖用煤实际费用(秋季买的和冬季补充的总和)作为局 中人A的赢得,得矩阵如下:岗(较暖顾较冷腐()%(10吨)f-1000 -1750 -3000、%(15吨)T500 -1500 -2500%(20吨)[-2000 -2000 -2000,max min % = min max aif = a33 = -2000i j J j i 1故对策的解为(%,四),即秋季储煤20吨合理。
对于有鞍点的对策,除过上述的矩阵方法求解之外,还可以用表格方式求解 当鞍点不惟一时,局中人的最优策略步惟一,即矩阵对策中存在着多个平衡结局, 但对策的值是惟一确定的例3】按表格方法求解矩阵对策G = {§,S2,A},期 A为局中人1的赢得矩阵'7474、-131-2A =9464、o374 ,解:求解过程如下表所示A A A Amin jax74744%-131-2-2以394644%03740max i9474SP = ( %,片),(%,腐),(%,82),(%' 04 ) ”42.2.2混合策略(即无鞍点的矩阵对策)【定义2.3】(混合策略)对给定矩阵对策G = {S]S2;A},其中Sl=[a1a2,...am},S2 ={"*2,…属},△ = (%)“"记S]* = e E"' |x; > 0,z = 1,...m;工xt = 1 ?日 JS; = \y^En\yt >O,i = l,...n-,Yjyi =1 >jT .则分别称S;和S;为局中人1和2的混合策略集(或策略集);对于xeS;和y e S;称 x和y为混合策略(或策略),称(x,y)为一个混合局势(或局势)。
定理2.1】(对策基本定理)任何一个给定的矩阵对策G在混合策略意义下一定 有解,即有V1=V2=V=min£(X,y) = meu£(X,y)o如果矩阵对策G的值为V, 则一下两组不等式的解就是局中人A与局中人B的最优策略mZ = 1>natj 根据定义2. 1我们容易得出矩阵A没有鞍点,也就是说“齐王赛马”问题没有 最优纯策略设齐王的最优混合策略为X =(%15%2,%3,%4,%5,%6),设田忌的最优混合策略为 K = (M,无,力,月,为,%),根据定理2. 2 (对策基本定理),当(X, V)为混合结局时, 得3邑 + x2 + x3 - x4 + x5 + x6 > V f + 3x2 - x3 + x4 + x5 + x6 > V 邑 + 易 + 3x3 + x4 - x5 + x6 > V 尤1 + 尤2 ++ 3x4 + x5 - x6 > V %! - x2 + x3 + x4 + 3x5 +x6 > V 一邑 + x2 + x3 + x4 + x5 + 3x6 > V6£ 改=1 > 0 z = 1,2,... 6i=\<3出+兜+一 一 >4 + 月 + —6 MV 为+3巧一% + ■ + * +-6 " 力+呢+3为+为一及+ % " 为+呢+巧+3. +月一-6 " 乂―晃+力+为+3为+呢 " 一工1 + x2 + x3 + x4 + x5 + 3x6 < V6yj =。
