动态规划的应用举例
第二节 动态规划应用举例本节将通过动态规划的三种应用类型资源分配问题、复合系统可靠性问题、设备更新问题,进一步介绍动态规划的特点和处理方法。一、资源分配问题1. 问题的一般提法设有某种资源,总数量为a,用于生产n种产品 ;若分配数量xi用于生产第i种产品,其收益为 gi(xi)。问应如何分配,可使总收益最大?2. 数学规划模型模型的特点变量分离。3.用动态规划方法求解阶段k状态sk决策xk=1,n表示把资源分配给第k种产品的过程;表示在给第k种产品分配之前还剩有的资源量;表示分配给第k种产品的资源量;状态转移sk+1= sk- xk ;阶段指标vk指标函数vkn 12S1=ax1x2g1(x1 )g2(x2)nxnsngn(xn) s2s3.例3 某公司拟将某种高效设备5台分配给所属甲、 乙、丙3厂。各厂获此设备后可产生的效益如下 表。问应如何分配,可使所产生的总效益最大?效益厂设备台数甲 乙 丙0 0 0 0 1 3 5 4 2 7 10 6 3 9 11 11 4 12 11 12 5 13 11 12解:阶段k状态sk决策xk=1,2,3依次表示把设备分配给甲、乙、丙厂的过程;表示在第k阶段初还剩有的可分台数;表示第k阶段分配的设备台数;状态转移sk+1= sk- xk ;阶段指标vk指标函数vk3 问题:本问题是属于离散型还是属于连续型?怎样解?离散型,用表格的方式求解。效益厂设备台数甲 乙 丙0 0 0 0 1 3 5 4 2 7 10 6 3 9 11 11 4 12 11 12 5 13 11 12k Sk xk vk vk+fk+1 fk30 1 2 3 4 50 1 2 3 4 5046 11 12 120+04+06+0 11+0 12+0 12+0046 11 12 120 1 2 3 4 5k Sk xk vk vk+fk+1 fk01234520 0 0+0 0 0-0 0 0 0+41 5 5+0 5 1-00 0 0+61 5 5+42 10 10+010 2-00 0 0+111 5 5+62 10 10+43 11 11+014 2-10 0 0+121 5 5+112 10 10+63 11 11+44 11 11+016 1-32-20 0 0+121 5 5+122 10 10+113 11 11+64 11 11+45 11 11+021 2-3k Sk xk vk vk+fk+1 fk150 1 2 3 4 50379 12 130+21 3+16 7+14 9+10 12+5 13+021 0-2-32-2-1最优策略:P*13 为0-2-3或2-2-1,即分给甲厂0台、分给乙厂2台、分给丙厂3台,或分给甲厂2台、分给乙厂2台、分给丙厂1台。最优值: f1=21。可见,最优解可以是不唯一的,但最优值是唯一的。资源分配问题的应用很广泛,例如:1.某学生正在备考4门功课,还剩7天时间 ,每门功课至少复习1天。若他已估计出各门 功课的复习天数与能提高的分数之间的关系 ,问他应怎样安排复习时间可使总的分数提 高最多?2.背包问题:旅行者携带的背包中能装的 物品重量为a,现他要从n种物品中挑选若干 数量装入背包,问他应如何挑选可使所带的 物品总价值最大?二、复合系统工作可靠性问题 1. 问题的一般提法设某工作系统由n个部件串接而成,为提 高系统的可靠性,在每个部件上装有备用件。 已知部件i上装有xi个备用件时,其正常工作的 概率为pi(xi);每个部件i的备用件重量为wi,系 统要求总重量不超过W。问应如何安排备用件 可使系统可靠性最高?串接:122. 数学规划模型模型的特点变量分离。3.用动态规划方法求解12S1=Wx1x2p1(x1 )p2(x2)nxnsnpn(xn) s2s3.阶段k状态sk决策xk=1,n表示安排第k个部件备用件的过程;表示在给第k个部件安排之前还剩有的容许重量;表示第k个部件上安排的备用件数量;状态转移sk+1= sk- wkxk ;阶段指标vk指标函数vkn 可靠性问题的应用很广泛,例如:1.某重要的科研攻关项目正在由3个课题 组以3种不同的方式进行,各组已估计出失败 的概率。为减少失败的概率,选派了2名高级 专家去充实科研力量。若可估计出各组增加 专家后的失败概率,问应如何分派专家可使 总的失败概率最小?2.已知x1+x2+xn=c,求z=x1x2xn的最大 值。三、设备更新问题例4 某运输公司购进一批卡车投入运营,公司每年初需 对卡车作出更新或继续使用的决定。假设第k年中,rk(tk) 表示车龄为tk的车使用一年的收入,uk(tk)表示车龄为tk的 车使用一年的维修费用,ck(tk)表示车龄为tk的车更新成新 车的费用。现公司需制定一个10年计划,以决定如何安排 使10年的总收入最大。12S1=?x1x210x10s10v1v2v10 s2问题:状态和决策怎样设置? 决策是更新与否,可用0-1变量表示;状态可设为车龄。阶段k状态sk决策xk= 1,10表示第k年的决策过程;= tk表示第k年的车龄;状态转移tk+1= tk +1(1-xk)阶段指标vk指标函数vkn = rktk - uktk - ck(tk)(1-xk)(1-xk)xk四、其他随机型问题举例例5 某瓷厂接受订制一个瓷瓶的任务。瓷瓶用电炉烧制。据技术分析估计,每个瓷瓶出炉后的合格率为0.5,各瓶合格与否相互独立(即一炉如装有n个瓷瓶,那么出炉后都不合的概率为0.5n)。制造一个瓷瓶的原料费为100元,烧一炉的费用为300元。现因厂中条件限制最多只能烧3炉,每炉最多装4个瓷瓶。若3炉的瓷瓶无1个合格,则因不能履行合同而被罚款1600元。试用动态规划方法确定一种生产方案(即每炉该装几个瓷瓶),使总的期望成本为最小。