
最优控制讲义.docx
83页第一章 绪论§1.1最优控制问题 静态最优化问题:输入—输出—代数方程 动态最优化问题:输入—输出—微分方程 确定性最优控制:系统参数确定,无随机输入 随机性最优控制:系统参数确定,有随机输入u(t勻 被控对象 X(t) C fY(t)x(t) Ax(t) Bu (t) Y (t) Cx (t)x(t) Ax(t) Bu(t) w (t) Y (t) Cx (t) v(t)例:飞船的月球软着陆问题推力运动方程dtd2xdmmf mgkmgdt2dtJtf[dm]dtm (t )m (t )t0dt0f初始条件约束条件为t t ,x0t t ,xfx(t ) h0x(t ) 0fdmdtmin§1.2 最优控制的数学模型一 控制系统的数学模型(集中参数系统) 直接法建立:动力学、运动学的基本定律,即解析法. 间接法建立:通过“辩识”的途径确定系统的结构与参数.x(t) f(x(t),u(t),t)其 中 x(t) [x (t),x (t) ,x (t)]T , u(t) [u (t),u (t) ,u (t)]T , f [f ,f , f ]1 2 n 1 2 r 1 2 nx(t)为n维状态向量,u (t)为r维控制向量,f为n维函数向量.二 目标集通过u(t)使x(t)由x(t0)到x(tf),其中x(t°)为初始状态,并且通常为已知;x(tf)为终端状态,即控制所要求达到的目标。
一般来说对终端状态的要求可用如下的约束条件表示 g (x(t ),t ) 0,g (x(t ),t ) 0.1 f f 2 f f三 容许控制u.具有不同的物理属性,一般有|u| ,i 1,2 r,即在控制域U内.凡在闭区间1 i[t0,tf]上有定义,且控制域U内取值的每一个控制函数u(t)均称为容许控制四 性能指标 主要取决于问题所要解决的主要矛盾表达式为: J[u()] S(x(t ),t ) tf L(x,u,t)dtf f t0其中x(t)是动态系统起始于x(t0) X对应于u(t)的状态轨线x(tf)是此轨线在终端时 刻的值五 最优控制的提法 受控系统的状态方程及给定的初态x(t) f(x(t),u(t),t),x(t ) t00规定的目标集为M {x(t ):x(t ) R n ,g (x(t ),t ) 0,g (x(t ),t ) 0}f f 1 f f 1 f f求一容许控制u(t) U ,t [t0,tf],使指标函数J[u()] S (x(t ),t ) tf L(x(t),u(t),t)dtf f t00为最小如果问题有解,记为u*(t),则称u*(t)为最优控制。
相应的曲线x* (t) 叫做最优轨线而性能指标J* J[u*()]则称为最优性能指标§1.3 最优控制在实际问题应用的几个方程一 时间最优控制J tf dtt0二 线性调节的问题 使线性系统的状态保持在平衡位置状态的误差最小,控制能量也最小J tf[xT Qx uT Ru ]dtt0该问题为线性二次型问题三 跟踪问题系统的状态跟踪某一个确定的状态xrJ tf[(x x )T Q (x x ) uT Ru ]dtt0rr四 最少燃料问题dm 丁 t 11u ——,J tf u|dtdt t0五 终端控制问题J Q [x(t ),t ]ff1.4 最优控制的发展第二章 变分法及其在最优控制的应用§2.1 变分法的基本概念一 泛函对于某一类函数集合中的每一个函数y (x),均有一个确定的数J与之对应,那么就称J为依赖于函数y(x)的泛函,记作J J[y (x)],或简称 J其中y(x)称为泛函的宗量自变量)二 容许函数类(空间) 满足一定条件的一类函数称为泛函的容许函数类(空间)例:所有在区间[a,b]上连续函数的全体是一函数空间,记C[a,b]所有在区间[a,b]上连续且一次可微函数的全体是一函数空间,记C 1 [a,b]所有在区间[a,b]上连续且二次可微函数的全体是一函数空间,记C 2 [a,b]三 泛函的极值最简单的一类函数J[y]x1F (x,y,y)dx对任何一条与y y0 (x)接近的曲线上,x0有J[y(x)]J[y (x)]0则称J [y (x)]在曲线上y°(x)上达到极小值。
1.接近定义两个函数具有零阶接近度:|y(x)y° ©,(x1两个函数具有一阶接近度:|y(x) y°(x)| ,(x1x 2)|y(x)y0(x),(x x )12当y(x)为函数空间的一个点时,接近度可用点距来表示:零阶距离d0(y,y0)max a x b|y(x) y°(x)|—阶距离 d (y,y ) max |y(x) y (x)|,|y(x) y (x)|a x bk 阶距离 d (y, y ) max |y(x) y (x) y(k) (x) y (k) (x)k 0 I 0 0a x b2. 泛函的强相对极小对于容许函数y0 (x)的强领域d (y,y )00总有J[y°] J[y],则称泛函J[y]在函数y° (x)上达到强相对极小3. 泛函的弱相对极小对于容许函数y0 (x)的弱领域d (y,y )10总有J[y°] J[y],则称泛函J[y]在函数y (x)上达到弱相对极小显然,强相对极小必为弱相对极小,反之不成立4.泛函的变分 泛函的连续性:对于任何—个正数 ,可以找到这样—个当 d (y,y )0时,就有J[y(x)] J[y (x)]0那么,则称泛函J [y(x)]在点y(x)处是连续的。
当d(y,y ) d (y, y )时,称为n阶连0 0 n 0续5.线性泛函连续泛函J [y (x)]如果满足以下两个条件:J[y (x) y (x)] J[y (x)] J[y (x)]1 2 1 2J[cy(x)] cJ[y(x)]其中C是任意常数,则称为线性泛函6. 泛函的变分若连续泛函J [y (x)]的增量可以表示为J J[y(x) y(x)] J[y(x)] L[y(x),y(x)] r[y(x),y(x)]其中L是(y)的线性连续泛函,r是关于y(x)的高阶无穷小,那么L叫做泛函的变分,记为J L[y(x), y(x)]也称为泛函的微分引理 2.1泛函J [y (x)]的变化J J[y(x) y(x)]o定理 2.1若可微泛函J [y (x)]在y° (x)上达到极小大)值,则在y y° (x)上有J0 例 求泛函的变分J x1 F (x,y(x),y(x))dxxoJ J[y (x) y (x)] x1 F [x, y a y, y y]o xo ox F (x,y,y) F (x,y,y)1[ y yJdxxo y y在上例中应用了宗量变分的导数等于导数变分的性质,即( .y) y。
§2.2 欧拉方程变分法上研究泛函极值的一种方法,为古典变分法拉格朗日问题:求一容许函数x(t),使泛函取最小值J tf F (t,x(t),x(t))dttoT面利用泛函J [x (t)]达到极值的必要条件:J o,导出欧拉方程引理: 设连续函数x M (t)对于任一具有下述性质的函数(t)(1)在[t0,tf]上, (t)连续(2)(t) (t ) oof总有J tf M (t) (t)dt oto则对于 t [t°,tf],Mo(t) o 定理:若最简单的泛函J[x(t)] tf F (t,x(t),x(t))dt; x(t ) x ,x(t ) x t 0 0 f f t0在曲线X x(t)处达到极值,则X x(t)必为欧拉方程dF F 0x dt x 的解证明 因为泛函J[x(t)]在X x(t)处达到极值,所以有J tf (F x F x)dt 0xx其中 x(t0) x(tf ) 0而代入得tf F由引理可得还可写成F x|tf tfx±(F)dtx t0 t0dt xJtf(Ftx0dF )dt xxdtF—Fx dt0xxdttft00F F xF xF 0 x tx xx xxdx一 (F )dtdt x欧拉方程是二阶常微分方程。
两个积分常数由两个边界条件确定例 求泛函满足边界条件x(0) 0,x()J [x (t)] 2(X201的极值曲线x2)dt解 F x2 x2 ,欧拉方程为 dF F 2x 2x 0°,C] 1故得极值曲线为xsintx dt x含有多个未知函数的变分问题J[X]tf F (t,X ,X )dtt0其中 X (t) [x (t),x (t), x(t)]T01 2 n有相似结论Fd F 0Xdt X边界条件为 X (t0) X0,X (tf)Xf求得x qcost C 2 sint,由边界条件可得J§2.3条件极值的变分问题问题:求泛函J tf f (tx(t),x(t)dt在约束条件t0f(t,x,x) 0,f [f,f, f]T1 2 m求满足边界条件x(t0) x0,x(tf) xf的极值求解步骤:Stepl作系统 J tf [F (t, x(t),x(t)) T f(t,x(t),x(t))c]t0其中向量算子 T(t) [(t), (t),(t)]12mStep2:解欧拉方程—H 0Hxct x其中 H/、 1F (t,x(t),x(t))T f(t,x(t),x(t))将欧拉方程与约束方程联合求解,可得x(t)和(t),积分常数由边界条件确定。
§2.4在一点处的变分积分中值定理:f (x)连续,(x)在[a,b]上不变号且可积,则有 满足b f(x) (x)cx f() b (x)cx,a b aa下面建立泛涵 J t1F(t,x,x)ct在一点t处的变分概念如下:设 x x(t^x x(t)都属于 C 1 [t , t ],且 x(t) x(t) x(t)其中这样选取 (x):(1) (x) C1[t,t]01(2) (x): 非零值在t的零域(t ,t)之内0在t的零域(t ,t)之外且(x)保持定号并设二曲线X x(t)与X x(t)之间的小块面积t [x(t)tx(t。












