好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第3章 人工神经元网络控制论-控制基础.ppt

86页
  • 卖家[上传人]:豆浆
  • 文档编号:11456155
  • 上传时间:2017-08-18
  • 文档格式:PPT
  • 文档大小:1.48MB
  • / 86 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 第3章 人工神经元网络控制论-控制基础,智能控制基础,2/68,3.1  引言,3.2  前向神经网络模型,3.6 神经网络控制基础,3.7  非线性动态系统的神经网络辨识,3.8  神经网络控制的学习机制,3.9  神经网络控制器的设计,3.3  动态神经网络模型,3.10 单一神经元控制法,目录,,3/68,3.6.1 引言,神经网络控制的优越性神经网络控制器的分类神经网络的逼近能力,神经网络是一种具有高度非线性的连续时间动力系统,它有着很强的自学习功能和对非线性系统的强大映射能力,已广泛应用于复杂对象的控制中神经网络所具有的大规模并行性、冗余性、容错性、本质的非线性及自组织、自学习、自适应能力,给不断面临挑战的控制理论带来生机4/68,神经网络控制的优越性,研究重点,5/68,神经网络的稳定性与收敛性问题;神经网络控制系统的稳定性与收敛性问题; 神经网络学习算法的实时性; 神经网络控制器和辨识器的模型和结构;,6/68,根据神经网络在控制器中的作用不同,神经网络控制器可分为两类,一类为神经控制,它是以神经网络为基础而形成的独立智能控制系统;另一类为混合神经网络控制,它是指利用神经网络学习和优化能力来改善传统控制的智能控制方法,如自适应神经网络控制等。

      综合目前的各种分类方法,可将神经网络控制的结构归结为以下六类神经网络控制器的分类,7/68,神经网络控制器的分类,导师指导下的控制器,逆控制器,自适应网络控制器,前馈控制结构,自适应评价网络,混合控制系统,,神经网络控制器,8/68,(1) 导师指导下的控制器,学习样本取自于专家经验输入来自传感器,输出为控制信号缺点是静态过程缺乏学习机制,系统为根据视觉信息对机械手臂进行控制,使其能够准确地对不规则形状物体进行抓举系统组成:(1)神经网络控制器NC为一块嵌入式DSP处理器,神经网络算法根据上述原理由程序实现2)对象P为被控对象机械臂,其各关节驱动电机的信号线与NC输出端相连,作为神经网络的输出1) 导师指导下的控制器,(3)系统的输入为机器视觉信息经转化后的数字信号(多维),其中包含了物体的位置和形状信息;输出为机械臂各部分的位置电信号及传感器信号(多维)4)NC包含训练引脚,其与有人手控制的机械臂的驱动信号相连该信号作为以人为导师的导师值训练信号1) 导师指导下的控制器,,(1) 导师指导下的控制器,12/68,(2) 逆控制器,神经网络的训练目的是逼近系统的逆动力学模型,Yd期望输出作为神经网络输入以便使期望输出与对象实际输出之间的传递函数为1,则被控对象的输出为期望输出。

      13/68,(3) 自适应网络控制器,模型参考自适应网络控制器,利用神经网络代替线性系统中的线性处理单元控制误差反馈到控制器进行修改使误差最小,14/68,(4) 前馈控制结构,基于鲁棒性问题提出反馈的目的在于提高抗随机扰动的能力非线性成分由网络控制器完成难点是如何在系统模型未知条件下找到有效的学习方法,,15/68,(4) 前馈控制结构,,,16/68,(4) 前馈控制结构,,,17/68,(4) 前馈控制结构,,,18/68,(4) 前馈控制结构,,,19/68,(4) 前馈控制结构,,,20/68,(4) 前馈控制结构,(5) 神经网络自适应评价控制  通常由两个单元组成:搜索单元和自适应评价单元自适应评判网络通过不断的奖励、惩罚等再励学习,使自己逐渐成为一个合格的“教师”,学习完成后,根据系统目前的状态和外部激励反馈信号产生一个内部再励信号,以对目前的控制效果作出评价6) 神经网络混合控制 该控制方法是集成人工智能各分支的优点,由神经网络技术与模糊控制、专家系统等相结合而形成的一种具有很强学习能力的智能控制系统 由神经网络和模糊控制相结合构成模糊神经网络,由神经网络和专家系统相结合构成神经网络专家系统。

      神经网络混合控制可使控制系统同时具有学习、推理和决策能力23/68,3.6.2 神经网络的逼近能力,相关结论: 含一个隐层以上的多层前向传播神经网络不仅可以以任意精度逼近连续函数本身,还可以逼近函数的导数项24/68,3.1  引言,3.2  前向神经网络模型,3.6 神经网络控制基础,3.7  非线性动态系统的神经网络辨识,3.8  神经网络控制的学习机制,3.9  神经网络控制器的设计,3.3  动态神经网络模型,3.10 单一神经元控制法,目录,,25/68,,,3.7.1 辨识基础,3.7.2 神经网络辨识模型的结构,3.7.3 非线性动态系统的神经网络辨识,,3.7 非线性动态系统的神经网络辨识,26/68,L.A.Zadeh曾经下过这样的定义:“辨识是在输入和输出数据的基础上,从一组给定的模型中,确定一个与所测系统等价的模型”使用非线性系统的输入输出数据来训练神经网络可认为是非线性函数的逼近问题 多层前向传播网络能够逼近任意L2非线性函数 (双隐层比单隐层具有更高的逼近精度),3.7.1 辨识基础,输入输出数据——能够测量到的输入输出模型类——系统的结构 等价准则——辨识的优化目标,27/68,,,辨识的基本要素,模型的选择 隐含层数和节点数的选择——多次仿真实验得到(兼顾精确性和复杂性)输入信号的选择 时域:激励系统的所有模态 频域:足以覆盖系统的频谱(白噪声或伪随机信号)误差准则的选择,28/68,,,,神经网络辨识的特点,不要求建立实际系统的辨识格式可以对本质非线性系统进行辨识,非算法式收敛速度不依赖于待辨识系统的维数,只与神经网络本身即其学习算法有关权值在辨识中对应于的模型参数可以用于控制,29/68,30/68,,,3.7.1 辨识基础,3.7.2 神经网络辨识模型的结构,3.7.3 非线性动态系统的神经网络辨识,,3.7 非线性动态系统的神经网络辨识,31/68,3.7.2 神经网络辨识模型的结构,32/68,前向建模法,所谓前向建模法是利用神经网络来逼近非线性系统的前向动力学模型 。

      动态系统的建模:一个办法是对神经网络本身引入动态环节,如动态回归网络和动态神经元模型另一个办法是将输入输出的滞后信号加到多层前向网络中形成动态关系前向建模法,33/68,34/68,逆模型法,直接法:,待辨识系统的输出作为神经网络的输入,神经网络的输出与动态系统的输入进行比较,相应的输入误差用来训练神经网络,35/68,存在的问题,存在的问题学习过程不一定是目标最优的 (学习样本)一旦非线性系统对应关系不是一对一的,那么不准确的逆模型可能会被建立 克服方法——增加使用已建模的神经网络正向模型,36/68,,,3.7.1 辨识基础,3.7.2 神经网络辨识模型的结构,3.7.3 非线性动态系统的神经网络辨识,,3.7 非线性动态系统的神经网络辨识,非线性动态系统的神经网络辨识,前向神经网络具有良好的学习性能利用静态神经网络描述动态系统误差反向传播是一般BP学习算法的精髓动态反向传播的关键是找到反映该动态过程的关系式带时滞的多层感知器网络+动态误差反向回归学习算法,37/68,38/68,,并行结构,,,串行结构,,串行结构更稳定根据可分离性和线性性,有4种结构辨识的两种结构,39/68,,含线性部分的辨识问题(模型1、2),,,,模型1,,模型2,,40/68,线性部分的参数已知,41/68,线性部分的参数未知,42/68,线性部分学习方法,最小二乘法其中初始条件完全未知时,可取,,,43/68,非线性部分学习方法,BP学习,44/68,例3-8,考虑以下模型: y(k+1)=a·y(k)+b·y(k-1)+g(u) 其中a=0.3, b=0.6 g(u)=u3+0.3u2-0.4u试辨识该系统,45/68,解,线性部分,采用递推最小二乘学习法非线性部分采用前向传播多层神经网络来逼近。

      选择神经网络结构为,,,,,,46/68,辨识效果,校验输入信号 :,,47/68,非线性可分离系统(模型3),,48/68,BP学习,,,,,49/68,例3- 9,考虑如下非线性离散系统:求:采用双模型法解决该系统的辨识问题50/68,两种方法的学习曲线,单一模型网络:两模型网络:,51/68,两模型法的辨识效果,52/68,3.1  引言,3.2  前向神经网络模型,3.6 神经网络控制基础,3.7  非线性动态系统的神经网络辨识,3.8  神经网络控制的学习机制,3.9  神经网络控制器的设计,3.3  动态神经网络模型,3.10 单一神经元控制法,目录,,53/68,3.8 神经网络控制的学习机制,神经元控制器的目的在于如何设计一个有效的神经元网络去完成代替传统控制器的作用,使得系统的输出跟随系统的期望输出为了达到这个目的,神经网络的学习方法就是寻找一种有效的途径进行网络连接权阵或网络结构的修改,从而使得网络控制器输出的控制信号能够保证系统输出跟随系统的期望输出54/68,分类,3.8.1 监督式学习离线学习法学习法反馈误差学习法多网络学习法3.8.2 增强式学习,55/68,1. 离线学习法,系统的逆模型样本空间应尽量遍及整个控制域适合静态环境,56/68,2. 学习法,学习只能在期望输出yd值域内进行适合模型已知的动态环境,57/68,学习方法,采用最速下降法,,假设系统的Jacobian矩阵已知,,58/68,3. 反馈误差学习法,反馈控制的输出作为网络的训练误差信号反馈控制保持系统稳定并消除误差;前馈控制加快速度,并逐渐占主导地位适用于非线性系统线性绝对占优条件下的网络学习,59/68,4. 多神经网络学习法1,前向建模多网络控制建立位置非线性动态系统的前向模型利用此前向模型实现误差反向传播完成网络控制的权阵学习,60/68,多神经网络学习法2,逆模型建模的多网络控制结构图建立逆模型yd为逆模型输入信号由此产生期望的控制信号udud与u比较产生的误差作为Nc的学习信号,61/68,3.8.2 增强式学习,当某些被控系统的导师信号无法获得时利用当前控制是否成功来决定下一次控制该如何走的学习方式。

      修正的办法是对某一成功的行为进行鼓励,而对不成功的行为进行惩罚 用神经网络来实现时, 则可在权值空间进行调整62/68,3.1  引言,3.2  前向神经网络模型,3.6 神经网络控制基础,3.7  非线性动态系统的神经网络辨识,3.8  神经网络控制的学习机制,3.9  神经网络控制器的设计,3.3  动态神经网络模型,3.10 单一神经元控制法,目录,,63/68,,,3.9.1 直接逆模型控制法,3.9.2 直接网络控制法,3.9.3 多网络自学习控制法,,3.9 神经网络控制器的设计,64/68,3.9.1 直接逆模型控制法,训练结构示意图,逆模型训练完毕后直接投入控制系统的运行,65/68,直接逆模型控制的结构示意图,不进行学习,运行于静态参数环境缺乏鲁棒性,可在外环增加一个反馈控制,66/68,,,3.9.1 直接逆模型控制法,3.9.2 直接网络控制法,3.9.3 多网络自学习控制法,,3.9 神经网络控制器的设计,67/68,3.9.2 直接网络控制法,在网络的输入端引入系统的状态信号(带时滞的多层前向网络)将学习机制(BP算法)实时用于网络控制器的调整,68/68,例3-10,考虑被控系统 假设动力学逆模型成立 ,为 试用直接网络控制法控制。

      n=3,m=2,,,69/68,解,构造神经网络结构为Π5,25,12,1 输出单元层的神经元的激励函数为线性单元其余层的神经元为Sigmoid激励元 取η=0.05 期望输出为:,。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.