电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

基于伪逆的反复学习控制(翻译一)

13页
  • 卖家[上传人]:工****
  • 文档编号:585949
  • 上传时间:2017-04-05
  • 文档格式:DOC
  • 文档大小:743.50KB
  • / 13 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 1、基于伪逆的反复学习控制学习控制是用于一固定时间间隔内重复作用的跟踪控制的有效方法。本文给出一种反复学习控制算法,适用于一些具有扰动和初始误差的非线性非最小相位对象。该算法要求对一线性对象的近似转换而非精确转换。这种方法的一个优点是不需区分对象的输出。渐进轨迹误差的范围通过一精确的试验列出,并且可以看到其随着扰动范围持续的增大。该控制器的结构是这样的,其低频部分的轨迹汇合要比高频部分快。索引术语反复学习控制,非线性跟踪,伪逆。I. 绪论反复学习控制用到了一类自调整控制器,其某一特定任务的系统性能在同一任务先前性能的基础上逐渐改善和完美。学习控制的最常见应用是在工业生产的机器人控制领域,这里要求机器人执行一个单一的任务,比方说反复在一给定轨迹下取放物体。单独一个反馈控制器时,相同的轨迹误差会一直在反复的试验中存在。相反,学习控制器可以利用前一次执行信息来改进下一次轨迹执行的性能。而在一些应用中,多次重复一个轨迹的要求不利于学习,所以我们将注意力集中在别的一些场合,那里来说学习控制是自然的解决方案。本文中我们在1提出一种反复学习控制算法的修正以使其适用于带有输入扰动和输出传感噪声的非线性非最

      2、小相位对象。在章节 出一个在起始位置描述一伪逆线性装置的学习控制器。在章节 出仿真例子以展示所提学习控制器的性能。最后,章节 全文总结。有扰动的非线性非最小相位对象本节中,我们为非线性系统提出一个鲁棒迭代学习算法。我们仅考虑方(相同的输入和输出)时不变非线性系统。A 系统描述来考察一个在 x = 0 时起始近似稳定(也就是说线性对象的所有特征根都在复平面的左半部分)而且输入稳定的非线性系统这里 i 为 迭代系数, 是输入顺序集合, 及 ,。方程 表示系统反复随机的有界扰动;它可以是持续的,非可再生摩擦力,和状态独立的模型误差等等。 代表传感器噪声。所期待的轨迹 维持在有限的时间域。学习的目的是构建一个输入轨迹的顺序 如 ,这样 使系统在0,T 间“尽可能近的”跟踪轨迹 。我们做以下假设:(程 是连续可微的,而 是连续的。(,这里的 是 间的封闭子集。(统是第一渐进稳定和输入状态稳定。(备注:如果系统不稳定,可以运用我们的方法使其稳定)。(动 和 分别由 制(也就是说, 且 ) 。(期待的轨迹 非常接近于轨迹 , 其满足以下方程:针对该系统,在图 给出一个反复学习控制。 1 所示的学习控

      3、制器的一个好的候选者可以这样获得,首先对对象进行线性化,然后用一个伪逆的线性装置作为学习控制器。现代的反复学习控制法则由因式 P,线性对象 ,其伴随矩阵 和时域 t0,T组成,也就是:注意到对所有的 i 如果 (注意在图 1 中,减因子 放置在汇合点之前) 。定义 : 由于非线性系统(1)是输入状态稳定(且 是连续的( ,因此这样定义一个因果关系的非线性输入到输出的映射P: 。因为 P 是第一状态渐近稳定的(,我们定义一稳定时不变的输入到输出线性因式 , 需要对系统(1)在内 线 性 化 :图 1, 非 线 性 学 习 控 制 系 统 P: 非 线 性 对 象 , 学 习 控 制 器 , : 负 因 子这 里 , 因 此 ,。 由 于 且 A 为 赫 兹 【 在 ( 4) 中 】 , 我 们 可 以 用代 替 而 不 必 改 变 ( 4) 中 定 义 的 输 入 输 出 ( 映 射 , 因 此 得 到 的唯 一 映 射 是 11。定 义 : 考 察 伴 随 系 统 的 IO 映 射由 于 A 是 赫 兹 , 双 曲 线 的 ( 也 就 是 , 所 有 的 特 征 值 都 没 有 零 实

      4、 部 ), 从 而 ( 5) 式 定 义了 唯 一 的 无 关 联 映 射 , 如 给 出 的 ( 参 见 附 录 ) 。 伴 随 系 统 满 足 忽略较高阶限制,我们可以在方程(1)的解 附 近 获 得 一 个 线 性 对 象 :这 里 。 因 为 ( 4) 是 稳 定 的 , 可以 根 据 李 亚 普 诺 夫 方 法 证 明 , 如 果 有 界 那 么 ( 6) 也 是 有 界 输 入 输 出 稳 定 的 。 注 意 , 这 里我 们 也 可 以 用 代 替 ( 如 ( 4) 中 ) 而 且 没 有 改 变 输 入 输 出 映 射 。定 义。 线 性 稳 定 系 统 ( 6) 有 解 并且 定 义 了 一 个 线 性 输 入 输 出 映 射 : 。定 义 : 由 伪 逆 【 4】 的 观 念 启 发 , 我 们 通 过 下 面 的 线 性 因 子 来 定 义 学 习 控 制 器 :因 为 , 我 们 把 “近 似 反 转 ”称 为 的 伪 逆 。 为 简 单 起 见 , 下 文 把 伪 逆 称为 简 单 伪 逆 。 在 时 域 下 用 ( 4) 和 ( 5) :因 为 是 稳 定

      5、的 , ( 8) 是 具 有 特 征 根 的 双 曲 线 , 因 此 , 【 2】 中且 是 无 关 联 的 。 在 ( 8) 中 解 , 我 们 可 以看 到 反 向 算 子 为 :上 面 系 统 的 特 征 根 的 连 续 函 数 。 在 极 限 为 双 曲 线 的 ( 因 为 A 为 赫 兹 ) 。 从 而我 们 通 常 对 双 曲 线 选 择 一 个 。 系 统 ( 9) 可 以 根 据 等 人 的 稳 定 无 关 解 方 法 解 决 。因 此 ,学 习 控 制 器 是 伪 逆 且 在 时 域 中 给 出 : 对 角 块 , 因 此 特 征 根 是 ( 9) 和 的 特 征 根 。 由 于 是 双 曲 线 的 , 因 此 双 曲 线 。 从 而 , 及 (10)所 描 述的 线 性 控 制 器 的 解 可 以 利 用 稳 定 无 关 解 2求 得 。 ( 使 用 时 而 不 是 时 的 初 始 条 件可 以 通 过 控 制 ) 。 因 此 跟 踪 性 能 可 以 根 据 假 设 和得 到 改 善 。C 集 中 分 析定 义 1: 我 们 为 方 程 定 义 标 准 :注 意 意

      6、 味 着 和 是 等 价 的 标 准 。 集 中 结果 可 以 用 任 一 标 准 证 实 。导 致 的 标 准 :定 义 的 傅 立 叶 变 换 。条 件 1: ( 也 就 是 说 , 轴 上 没 有 确 定 或 者 非 确 定 的 零 点 ) , 遵 循。法 则 1: 如 果 假 设 ( 和 条 件 1 满 足 , 没 有 扰 动 ( 即 且 ) 和 初 始 误 差 () , 那 么 算 则 ( 3) 导 出 了 一 个 输 入 顺 序 , 输 入 汇 合 于 。 如 果 , 及 初始 状 态 误 差 是 有 界 的 ( ) , 随 着 , 汇 合 于 。 球的 半 径 r 连 续 的 取 决 于 扰 动 , 和 初 始 误 差 界 限 。 如 果 存 在 一 个 具 有的 , 那 么 将 汇 合 于 期 望 的 输 入 解 。验证:验证依赖于对输入顺序应用不同的收缩映射定理5。验证的主要想法是在时 展 现 出 。 这 表 明 了 极 限 , 这 儿 为 扰 动 和 初 始 误 差 界 限 的 连 续 因 子 。 通 过 以 下 定 义 构 造 序 列: 为 简 单 起 见 下 文

      7、 用 表 示 。 现 在 , 维 持 页 尾 所 示 的 从 ( 3) 到 关 断 器( 12) 的 线 性 。 在 6后 , 我 们 用 表 示 P 的 分 叉 , 也 即 满 足在 式 ( 13) 中 , 这 样 定 义 : 。 从 ( 13)式 , 我 们 可 以 发 现 s 就 是 , 为 表 示 , 我 们 重 写 ( 12) 如 下 :因为 是 ,这表明 ,如限制 和 :由假设 :,从而 。由(6) ,我们列写:因此,利用三角不等式, 及 的限制,我们得到。利用 等 式 ( 见 )。 用 乘 式 ( 15) , 定 义且 假 设 , 我 们 得 到 :注 意 到 对 一 常 数 , 在 上 较 大 值 , 我 们 有 :和(4)相似,可以证明:这里 为式(4)的输入。定义 :定义一线性因子 ,所以:根据式(6) ,因子 的输出为: ,且由式(4)因子 的输出为 。这表明因此,利用式(16) , (17) ,及 的范围,我们可以得到:列出压缩映射:由式(12) ,我们可以得到下文页底所示的方程。定义。从以下可看到,如果 满足条件 1,当 ,那么 。当 选择足够小,可以使得 任

      8、意小。令 且 ,( 傅立叶变换)如果条件 1 满足,那么 ,这里 0。重新考虑式(19) ,令,因此 。注意到:因此,我们可以写为, (利用式(19) ),当。随着 的选择,可以使得 任意小。如果相应于 的传递函数确实恰当,那么在 时,条件 1 无法满足。那么随着1,而且,直观地,输入序列的高频部分会缓慢的汇合。在那种情况下,学习控制器得以以下方式加以修正:不是把 当作学习因子,而是把 当作修正后的学习控制器,这里 可以通过对 加入一个前馈期获得。因此,可以根据修正式(4)给出如下:这里 。修正后的因子满足条件 1 并且集总分析可以在 足够小时以相同的方式进行。从式(19)代人限制条件 ,且将式(19)乘以 我们可以在 上取大列写式(19)的 型如下:这里 为初始状态误差的标准范围。 和 分别为输入及输出扰动的标准范围。由于 ,当 足够小,我们可以发现 ,这使得 。因此,得到:。这里 包括了控制器的初始状态误差和扰动的标准范围。因此,极限 ,即 ,如,这里 为收缩映射 的固定点,且 为半径,球心为 的开球体。如果没有扰动和初始误差, ,从而 汇合于。如果 如 ,收缩映射 的固定点 表示

      9、为没有 和初始误差的。如果 且 。这表明学习控制器的输出 为 0。因此,收缩一旦得以证实,可以看出 (如前定义)也是从 空间( )的封闭子空间到其自身的映射。因此, 为收缩映射。为说明这个,来考察一期望轨迹 。从式(2) ,因 , 。在式(12)中,如果考虑 那么,由于(这里 ) , 是从 附近一封闭球到其自身的收缩映射。注意, 附近球的尺寸必须足够小这样式(14)也得到满足。因此,如果初始轨迹位于 附近, 对所有的 从其附近到其本身构成映射。不失一般性,我们考虑另一对 及 (如(2)所给) 。从连续性来说,尽管 充分接近 , 也从其附近到其本身构成映射。这便是 的动机。仿真结果具有输入扰动的仿真结果本节中,我们展示一个单输入单输出非线性非最小相位对象 P 的仿真研究,其起始渐进稳定,输入状态稳定,具有以下描述的输入扰动:首先,我们考虑没有输出扰动 。这样给出参考输出轨迹:0, 其他。通过线性化系统(21)这样定义 :由于线性控制器是非稳定的,我们应用稳定无关解方式2。我们引入 作为有界的输入扰动。 通常为限制于 间的随机数。 仿真图 2(a)和(b) 展示了两个反复后期望输出的近似完美的跟踪。注意高频部分缓慢汇合所引起的余差。具有输入输出扰动的仿真结果现在,我们引入 作为(21)所给的相同非线性系统的随机有界输出扰动。同时存在先前引入的输入扰动 。 仿真图图 3展示了三次反复后期望输出轨迹的良好跟踪。A 讨论这里的 案比1中给出的多了一些优点。在1中,线性对象的逆 被当做学习因子。这使得用输出的分叉颠倒系统成为必要。实际上,在具有输出传感噪声时分叉无法可靠的计算。进一步说,对象本

      《基于伪逆的反复学习控制(翻译一)》由会员工****分享,可在线阅读,更多相关《基于伪逆的反复学习控制(翻译一)》请在金锄头文库上搜索。

      点击阅读更多内容
    最新标签
    监控施工 信息化课堂中的合作学习结业作业七年级语文 发车时刻表 长途客运 入党志愿书填写模板精品 庆祝建党101周年多体裁诗歌朗诵素材汇编10篇唯一微庆祝 智能家居系统本科论文 心得感悟 雁楠中学 20230513224122 2022 公安主题党日 部编版四年级第三单元综合性学习课件 机关事务中心2022年全面依法治区工作总结及来年工作安排 入党积极分子自我推荐 世界水日ppt 关于构建更高水平的全民健身公共服务体系的意见 空气单元分析 哈里德课件 2022年乡村振兴驻村工作计划 空气教材分析 五年级下册科学教材分析 退役军人事务局季度工作总结 集装箱房合同 2021年财务报表 2022年继续教育公需课 2022年公需课 2022年日历每月一张 名词性从句在写作中的应用 局域网技术与局域网组建 施工网格 薪资体系 运维实施方案 硫酸安全技术 柔韧训练 既有居住建筑节能改造技术规程 建筑工地疫情防控 大型工程技术风险 磷酸二氢钾 2022年小学三年级语文下册教学总结例文 少儿美术-小花 2022年环保倡议书模板六篇 2022年监理辞职报告精选 2022年畅想未来记叙文精品 企业信息化建设与管理课程实验指导书范本 草房子读后感-第1篇 小数乘整数教学PPT课件人教版五年级数学上册 2022年教师个人工作计划范本-工作计划 国学小名士经典诵读电视大赛观后感诵读经典传承美德 医疗质量管理制度 2
    关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
    手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
    ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.