智能控制技术——神经网络控制论
智能控制技术,神经网络控制论,主要内容,2,5. 神经网络控制论 5.1 引言 5.1.1 神经网络控制的优越性 5.1.2 神经网络控制的研究领域 5.1.3 神经网络控制的研究重点 5.1.4 神经网络控制系统的结构类型 5.2 非线性系统的神经网络辨识 5.2.1 神经网络辨识基础 5.3 神经网络控制的学习机制 5.4 神经网络控制器的设计 5.4.1 直接逆模型神经网络控制器的设计 5.4.2 直接神经网络控制器的设计,3,5.1 引言,5.1.1 神经网络控制的优越性,神经网络可以处理那些难以用模型或规则描述的过程或系统。 神经网络采用并行分布式信息处理,具有很强的容错性。 神经网络是本质非线性系统,可实现任意非线性映射。 神经网络具有很强的信息综合能力,能同时处理大量不同类型的输入,并能很好解决输入信息之间的互补性和冗余性问题。 神经网络的硬件实现愈趋方便。,4,5.1 引言,5.1.2 神经网络控制的研究领域,基于神经网络的系统辨识 将神经网络作为被辨识系统的模型,可在已知常规模型结构的情况下,估计模型的参数。 利用神经网络的线性、非线性特性,可建立线性、非线性系统的静态、动态、逆动态及预测模型,实现非线性系统的建模和辨识。 神经网络控制器 神经网络作为实时控制系统的控制器,对不确定、不确知系统及扰动进行有效的控制,使控制系统达到所要求的动态、静态特性。 神经网络与其他算法相结合 将神经网络与专家系统、模糊逻辑、遗传算法等相结合,可设计新型智能控制系统。,5,5.1 引言,5.1.3 神经网络控制的研究重点,神经网络的稳定性与收敛性问题; 神经网络控制系统的稳定性与收敛性问题; 神经网络学习算法的实时性; 神经网络控制器和辨识器的模型和结构。,6,5.1 引言,5.1.4 神经网络控制系统的结构类型,神经网络在控制系统中的作用:充当对象的模型、控制器、优化计算环节等。 神经网络的结构形式较多,分类标准不统一;对于不同结构的神经网络控制系统,神经网络本身在系统中的位置和功能各不相同,学习方法也不尽相同。 几种实际的神经网络控制系统: 神经网络监督控制; 神经网络直接逆控制; 神经网络自适应控制; 神经网络内模控制; 神经网络预测控制; 神经网络自适应评判控制; 神经网络混合控制。,7,5.1 引言,(1) 神经网络监督控制 神经网络控制器是前馈控制器,建立被控对象的逆模型; 神经网络控制器基于传统控制器的输出,在线学习调整网络的权值,使反馈控制输入趋近于零,从而使神经网络控制器逐渐在控制作用中占据主导地位,最终取消反馈控制器的作用; 一旦系统出现干扰,反馈控制器重新起作用。 可确保控制系统的稳定性和鲁棒性,有效提高系统的精度和自适应能力。,5.1.4 神经网络控制系统的结构类型,8,5.1 引言,5.1.4 神经网络控制系统的结构类型,图中, 是的函数,是的函数,是的函数,又是网络权值的函数,因此 最终是网络权值的函数。故可通过使 逐渐趋于0来调整网络权值。当 =0时,从前馈通路看,有: = = = 1 = , 此时再从反馈回路看,有:= =0。,9,5.1 引言,5.1.4 神经网络控制系统的结构类型,(2) 神经网络直接逆控制 将对象的神经网络逆模型直接与被控对象串联起来,使期望输出与对象实际输出之间的传递函数为1。 缺点:无反馈,用作控制器的神经网络逆模型不准确时,抗干扰能力差,缺乏鲁棒性。,10,5.1 引言,5.1.4 神经网络控制系统的结构类型,在开环结构的基础上增加了神经网络2,以实现对于网络1权值的在线调整;网络1和2映射特性相同。 系统通过偏差调整两个网络的权值。当=0时,网络具有对象的逆特性,因为此时意味着= ,故 对网络2: = 1 (); 对网络1: = 1 ( ); 显然, 1 = 1 ( )= ( 1 ( )= 。,11,5.1 引言,5.1.4 神经网络控制系统的结构类型,用评价函数()作为性能指标,调整神经网络控制器的权值; 当性能指标为0时,神经网络控制器即为对象的逆模型。,12,5.1 引言,5.1.4 神经网络控制系统的结构类型,(3) 神经网络自适应控制 自适应控制的对象常含未知因素。 自校正控制 直接自校正控制 间接自校正控制 模型参考自适应控制 直接模型参考自适应控制 间接模型参考自适应控制 神经网络自校正控制:根据系统正向或逆模型的输出结果调节神经或传统控制器的内部参数,使系统满足给定的指标。 神经网络模型参考自适应控制:闭环控制系统的期望性能用一个稳定的参考模型来描述。,13,5.1 引言,5.1.4 神经网络控制系统的结构类型,(3) 神经网络自适应控制 自适应控制的对象常含未知因素。 自校正控制 直接自校正控制 间接自校正控制 模型参考自适应控制 直接模型参考自适应控制 间接模型参考自适应控制 直接自校正:调整的是神经网络控制器本身的参数,本质等同于神经网络直接逆控制。 间接自校正:同时使用常规控制器和神经网络估计器,神经网络估计器主要用来调整常规控制器的参数。,14,5.1 引言,5.1.4 神经网络控制系统的结构类型,神经网络间接自校正控制 假定被控对象为仿射非线性系统:=+ 常规控制器的映射关系通常含有非线性映射关系, 神经网络估计器主要用来逼近非线性函数和,得到 和 ,此时常规控制器的输出为: = ,15,5.1 引言,5.1.4 神经网络控制系统的结构类型,神经网络直接模型参考自适应控制 控制目的:使实际输出跟踪期望输出 。 通过使 最小,调整神经网络的权值。若 =0,则= ,进而有= ,该量作为控制器的输入并产生控制作用。 需要知道对象的数学模型(Jacobian信息 )才能通过误差反向传播算法修正网络权值,但对象通常含有未知参数。,16,5.1 引言,5.1.4 神经网络控制系统的结构类型,神经网络间接模型参考自适应控制 神经网络辨识器向神经网络控制器提供对象的Jacobian信息。,17,5.1 引言,5.1.4 神经网络控制系统的结构类型,(4) 神经网络内模控制 正向模型作为被控对象的近似模型,与实际对象并联; 控制器与对象的逆有关,可以是对象的逆; 滤波器通常为线性的,可提高系统的鲁棒性。 蓝色实线为基本原理图,加上绿色虚线后可构成内模控制的一种具体实现。,主要内容,18,5. 神经网络控制论 5.1 引言 5.1.1 神经网络控制的优越性 5.1.2 神经网络控制的研究领域 5.1.3 神经网络控制的研究重点 5.1.4 神经网络控制系统的结构类型 5.2 非线性系统的神经网络辨识 5.2.1 神经网络辨识基础 5.3 神经网络控制的学习机制 5.4 神经网络控制器的设计 5.4.1 直接逆模型神经网络控制器的设计 5.4.2 直接神经网络控制器的设计,19,5.2非线性系统的神经网络辨识,5.2.1 神经网络辨识基础,概念 辨识:是在输入和输出数据的基础上,从一组给定的模型中,确定一个与所测系统等价的模型。 辨识的三要素: 数据:能量测到的被辨识系统的输入/输出数据,是辨识的基础。 模型类:要寻找的模型的范围,即所考虑系统的结构。 等价准则:辨识的优化目标,用来衡量模型接近实际系统的标准,也称误差准则或损失函数。,20,5.2非线性系统的神经网络辨识,5.2.1 神经网络辨识基础,神经网络辨识 用神经网络作为被辨识对象的正模型、逆模型、预测模型等,也称为神经网络建模。 说明: 本质上,神经网络辨识的目的是建立所考查对象的模型,因此最简单的情况下,辨识只需利用对象本身的输入输出数据即可。 神经网络建模本身不涉及诸如某一具体控制任务之类的其它目的,因此与作为神经网络控制系统的结构框图相比,辨识的原理结构图要简单得多,只要能完成建模的任务即可;一般地,辨识结构图只涉及对象系统本身和所用的神经网络两大主体。,21,5.2非线性系统的神经网络辨识,5.2.1 神经网络辨识基础,建模的两种基本情况 前向建模:建立系统本身的模型,也称正向建模; 逆向建模:建立系统的逆模型。 正向建模 指利用神经网络逼近对象本身的动力学特性。 简化结构图: 网络与系统并联; 输出之差用作训练信号; 对网络而言,系统的实 际输出构成了期望的导 师信号,故为有导师学 习;可用多层前馈神经 网络实现;可进行离线辨识,也可进行在线辨识。,22,5.2非线性系统的神经网络辨识,5.2.1 神经网络辨识基础,逆向建模 一般而言,建立逆模型对神经网络控制意义重大。 直接逆建模简化结构图: 可用于离线辨识,也可 用于在线辨识。 缺点:不是目标导向的,系统输入也不可能预先定义。 实际常采用正-逆建模结构。,23,5.2非线性系统的神经网络辨识,5.2.1 神经网络辨识基础,正-逆建模 辨识的主要目的:建立对象的逆模型; 训练误差性能: = ()或 = ()。 优点:是目标导向的,即训练信号是期望输出与实际输出之差。 一般用于在线辨识。,24,5.2非线性系统的神经网络辨识,5.2.1 神经网络辨识基础,离线辨识与在线辨识 在线辨识是在对象系统实际运行的过程中进行的,辨识过程要求实时性,即必须在一个采样周期的时间间隔内至少进行一次网络权值的调整;离线辨识则是在取得对象系统的一批输入输出数据后再进行辨识,故辨识过程与实际系统是分离的,无实时性要求。 离线辨识在系统工作前预先完成网络的学习或训练,但输入输出训练集很难覆盖对象所有可能的工作范围、且难以适应系统在工作过程中的参数变化,故最好的辨识方式是:先进行离线训练、再进行在线学习,将离线训练得到的权值作为在线学习的初始权,以加快在线学习的速度。(由于网络具有学习能力,故当被辨识对象的特性变化时,神经网络也能通过不断地调整权值和阈值自适应地跟踪对象系统的变化。) 对于神经网络控制系统,其中的辨识是以系统在闭环控制下所得到的观测数据进行的,因此一般属在线辨识。对于时变系统,则只能使用在线辨识。,25,5.2非线性系统的神经网络辨识,5.2.1 神经网络辨识基础,神经网络建模的考虑因素 模型的选择 精确性和复杂性的权衡;对神经网络辨识而言,权衡表现为网络隐含层数的选择和隐含层内节点的选择。 权衡的有效途径:进行多次仿真实验。 输入信号的选择 时域上,要求输入信号持续加在系统对象上,以便在辨识时间内充分激励系统的所有模态、反映系统对象的完整动态过程。(这里的输入信号是加在系统上的信号,也将构成神经网络的输入或输出信号) 频域上,要求输入信号的频谱覆盖系统的频谱。 等价准则的选择 等价意味着按照某种误差评价准则,使确定的神经网络模型最好地拟合所关心的被辨识系统的静态或动态特性。,26,5.2非线性系统的神经网络辨识,5.2.1 神经网络辨识基础,误差评价准则通常是误差的泛函: = 其中,为常数,通常取1或 1 2 ;通常为神经网络的权系数;()通常为平方函数,即: = 2 () ():神经网络模型与系统的广义误差,有不同情形下的定义: 第一种,正向模型辨识 = = ( 1 ),27,5.2非线性系统的神经网络辨识,5.2.1 神经网络辨识基础,第二种,逆模型辨识 = = 1 ( +1 ) 第三种,广义模型辨识 = 1 2 1 +1,28,5.2非线性系统的神经网络辨识,5.2.1 神经网络辨识基础,用什么类型的神经网络建模? 对于静态系统,其输入输出间只是某种非线性映射关系,因此可以直接利用前向神经网络进行建模。 对于动态系统,可利用动态神经网络建模,也可利用静态前向神经网络进行建模。一般而言,后者更便于分析,但需要将动态系统的神经网络建模转化为静态系统的神经网络的建模。,29,5.2非线性系统的神经网络辨识,5.2.1 神经网络辨识基础,神经网络辨识的特点(与传统辨识方法相比) 神经网络本身作为一种辨识模型,其可调参数反映在网络内部的极值上,无需建立实际系统的辨识格式。 借助网络外部的输入/输出数据拟合系统的输入/输出关系,可对本质非线性系统进行辨识。(网络内部隐含着系统的特性) 辨识的收敛速度不依赖于被辨识系统的维数,只与神经网