电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本
换一换
首页 金锄头文库 > 资源分类 > DOC文档下载
分享到微信 分享到微博 分享到QQ空间

基于伪逆的反复学习控制(翻译一)

  • 资源ID:585949       资源大小:743.50KB        全文页数:13页
  • 资源格式: DOC        下载积分:2金贝
快捷下载 游客一键下载
账号登录下载
微信登录下载
三方登录下载: 微信开放平台登录   支付宝登录   QQ登录  
二维码
微信扫一扫登录
下载资源需要2金贝
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
如填写123,账号就是123,密码也是123。
支付方式: 支付宝    微信支付   
验证码:   换一换

 
账号:
密码:
验证码:   换一换
  忘记密码?
    
1、金锄头文库是“C2C”交易模式,即卖家上传的文档直接由买家下载,本站只是中间服务平台,本站所有文档下载所得的收益全部归上传人(卖家)所有,作为网络服务商,若您的权利被侵害请及时联系右侧客服;
2、如你看到网页展示的文档有jinchutou.com水印,是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已,我们并不对上传的文档进行任何编辑或修改,文档下载后都不会有jinchutou.com水印标识,下载后原文更清晰;
3、所有的PPT和DOC文档都被视为“模板”,允许上传人保留章节、目录结构的情况下删减部份的内容;下载前须认真查看,确认无误后再购买;
4、文档大部份都是可以预览的,金锄头文库作为内容存储提供商,无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证,请慎重购买;
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确),网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据;
6、如果您还有什么不清楚的或需要我们协助,可以点击右侧栏的客服。
下载须知 | 常见问题汇总

基于伪逆的反复学习控制(翻译一)

基于伪逆的反复学习控制学习控制是用于一固定时间间隔内重复作用的跟踪控制的有效方法。本文给出一种反复学习控制算法,适用于一些具有扰动和初始误差的非线性非最小相位对象。该算法要求对一线性对象的近似转换而非精确转换。这种方法的一个优点是不需区分对象的输出。渐进轨迹误差的范围通过一精确的试验列出,并且可以看到其随着扰动范围持续的增大。该控制器的结构是这样的,其低频部分的轨迹汇合要比高频部分快。索引术语反复学习控制,非线性跟踪,伪逆。I. 绪论反复学习控制用到了一类自调整控制器,其某一特定任务的系统性能在同一任务先前性能的基础上逐渐改善和完美。学习控制的最常见应用是在工业生产的机器人控制领域,这里要求机器人执行一个单一的任务,比方说反复在一给定轨迹下取放物体。单独一个反馈控制器时,相同的轨迹误差会一直在反复的试验中存在。相反,学习控制器可以利用前一次执行信息来改进下一次轨迹执行的性能。而在一些应用中,多次重复一个轨迹的要求不利于学习,所以我们将注意力集中在别的一些场合,那里来说学习控制是自然的解决方案。本文中我们在1提出一种反复学习控制算法的修正以使其适用于带有输入扰动和输出传感噪声的非线性非最小相位对象。在章节 出一个在起始位置描述一伪逆线性装置的学习控制器。在章节 出仿真例子以展示所提学习控制器的性能。最后,章节 全文总结。有扰动的非线性非最小相位对象本节中,我们为非线性系统提出一个鲁棒迭代学习算法。我们仅考虑方(相同的输入和输出)时不变非线性系统。A 系统描述来考察一个在 x = 0 时起始近似稳定(也就是说线性对象的所有特征根都在复平面的左半部分)而且输入稳定的非线性系统这里 i 为 迭代系数, 是输入顺序集合, 及 ,。方程 表示系统反复随机的有界扰动;它可以是持续的,非可再生摩擦力,和状态独立的模型误差等等。 代表传感器噪声。所期待的轨迹 维持在有限的时间域。学习的目的是构建一个输入轨迹的顺序 如 ,这样 使系统在0,T 间“尽可能近的”跟踪轨迹 。我们做以下假设:(程 是连续可微的,而 是连续的。(,这里的 是 间的封闭子集。(统是第一渐进稳定和输入状态稳定。(备注:如果系统不稳定,可以运用我们的方法使其稳定)。(动 和 分别由 制(也就是说, 且 ) 。(期待的轨迹 非常接近于轨迹 , 其满足以下方程:针对该系统,在图 给出一个反复学习控制。 1 所示的学习控制器的一个好的候选者可以这样获得,首先对对象进行线性化,然后用一个伪逆的线性装置作为学习控制器。现代的反复学习控制法则由因式 P,线性对象 ,其伴随矩阵 和时域 t0,T组成,也就是:注意到对所有的 i 如果 (注意在图 1 中,减因子 放置在汇合点之前) 。定义 : 由于非线性系统(1)是输入状态稳定(且 是连续的( ,因此这样定义一个因果关系的非线性输入到输出的映射P: 。因为 P 是第一状态渐近稳定的(,我们定义一稳定时不变的输入到输出线性因式 , 需要对系统(1)在内 线 性 化 :图 1, 非 线 性 学 习 控 制 系 统 P: 非 线 性 对 象 , 学 习 控 制 器 , : 负 因 子这 里 , 因 此 ,。 由 于 且 A 为 赫 兹 【 在 ( 4) 中 】 , 我 们 可 以 用代 替 而 不 必 改 变 ( 4) 中 定 义 的 输 入 输 出 ( 映 射 , 因 此 得 到 的唯 一 映 射 是 11。定 义 : 考 察 伴 随 系 统 的 IO 映 射由 于 A 是 赫 兹 , 双 曲 线 的 ( 也 就 是 , 所 有 的 特 征 值 都 没 有 零 实 部 ), 从 而 ( 5) 式 定 义了 唯 一 的 无 关 联 映 射 , 如 给 出 的 ( 参 见 附 录 ) 。 伴 随 系 统 满 足 忽略较高阶限制,我们可以在方程(1)的解 附 近 获 得 一 个 线 性 对 象 :这 里 。 因 为 ( 4) 是 稳 定 的 , 可以 根 据 李 亚 普 诺 夫 方 法 证 明 , 如 果 有 界 那 么 ( 6) 也 是 有 界 输 入 输 出 稳 定 的 。 注 意 , 这 里我 们 也 可 以 用 代 替 ( 如 ( 4) 中 ) 而 且 没 有 改 变 输 入 输 出 映 射 。定 义。 线 性 稳 定 系 统 ( 6) 有 解 并且 定 义 了 一 个 线 性 输 入 输 出 映 射 : 。定 义 : 由 伪 逆 【 4】 的 观 念 启 发 , 我 们 通 过 下 面 的 线 性 因 子 来 定 义 学 习 控 制 器 :因 为 , 我 们 把 “近 似 反 转 ”称 为 的 伪 逆 。 为 简 单 起 见 , 下 文 把 伪 逆 称为 简 单 伪 逆 。 在 时 域 下 用 ( 4) 和 ( 5) :因 为 是 稳 定 的 , ( 8) 是 具 有 特 征 根 的 双 曲 线 , 因 此 , 【 2】 中且 是 无 关 联 的 。 在 ( 8) 中 解 , 我 们 可 以看 到 反 向 算 子 为 :上 面 系 统 的 特 征 根 的 连 续 函 数 。 在 极 限 为 双 曲 线 的 ( 因 为 A 为 赫 兹 ) 。 从 而我 们 通 常 对 双 曲 线 选 择 一 个 。 系 统 ( 9) 可 以 根 据 等 人 的 稳 定 无 关 解 方 法 解 决 。因 此 ,学 习 控 制 器 是 伪 逆 且 在 时 域 中 给 出 : 对 角 块 , 因 此 特 征 根 是 ( 9) 和 的 特 征 根 。 由 于 是 双 曲 线 的 , 因 此 双 曲 线 。 从 而 , 及 (10)所 描 述的 线 性 控 制 器 的 解 可 以 利 用 稳 定 无 关 解 2求 得 。 ( 使 用 时 而 不 是 时 的 初 始 条 件可 以 通 过 控 制 ) 。 因 此 跟 踪 性 能 可 以 根 据 假 设 和得 到 改 善 。C 集 中 分 析定 义 1: 我 们 为 方 程 定 义 标 准 :注 意 意 味 着 和 是 等 价 的 标 准 。 集 中 结果 可 以 用 任 一 标 准 证 实 。导 致 的 标 准 :定 义 的 傅 立 叶 变 换 。条 件 1: ( 也 就 是 说 , 轴 上 没 有 确 定 或 者 非 确 定 的 零 点 ) , 遵 循。法 则 1: 如 果 假 设 ( 和 条 件 1 满 足 , 没 有 扰 动 ( 即 且 ) 和 初 始 误 差 () , 那 么 算 则 ( 3) 导 出 了 一 个 输 入 顺 序 , 输 入 汇 合 于 。 如 果 , 及 初始 状 态 误 差 是 有 界 的 ( ) , 随 着 , 汇 合 于 。 球的 半 径 r 连 续 的 取 决 于 扰 动 , 和 初 始 误 差 界 限 。 如 果 存 在 一 个 具 有的 , 那 么 将 汇 合 于 期 望 的 输 入 解 。验证:验证依赖于对输入顺序应用不同的收缩映射定理5。验证的主要想法是在时 展 现 出 。 这 表 明 了 极 限 , 这 儿 为 扰 动 和 初 始 误 差 界 限 的 连 续 因 子 。 通 过 以 下 定 义 构 造 序 列: 为 简 单 起 见 下 文 用 表 示 。 现 在 , 维 持 页 尾 所 示 的 从 ( 3) 到 关 断 器( 12) 的 线 性 。 在 6后 , 我 们 用 表 示 P 的 分 叉 , 也 即 满 足在 式 ( 13) 中 , 这 样 定 义 : 。 从 ( 13)式 , 我 们 可 以 发 现 s 就 是 , 为 表 示 , 我 们 重 写 ( 12) 如 下 :因为 是 ,这表明 ,如限制 和 :由假设 :,从而 。由(6) ,我们列写:因此,利用三角不等式, 及 的限制,我们得到。利用 等 式 ( 见 )。 用 乘 式 ( 15) , 定 义且 假 设 , 我 们 得 到 :注 意 到 对 一 常 数 , 在 上 较 大 值 , 我 们 有 :和(4)相似,可以证明:这里 为式(4)的输入。定义 :定义一线性因子 ,所以:根据式(6) ,因子 的输出为: ,且由式(4)因子 的输出为 。这表明因此,利用式(16) , (17) ,及 的范围,我们可以得到:列出压缩映射:由式(12) ,我们可以得到下文页底所示的方程。定义。从以下可看到,如果 满足条件 1,当 ,那么 。当 选择足够小,可以使得 任意小。令 且 ,( 傅立叶变换)如果条件 1 满足,那么 ,这里 0。重新考虑式(19) ,令,因此 。注意到:因此,我们可以写为, (利用式(19) ),当。随着 的选择,可以使得 任意小。如果相应于 的传递函数确实恰当,那么在 时,条件 1 无法满足。那么随着1,而且,直观地,输入序列的高频部分会缓慢的汇合。在那种情况下,学习控制器得以以下方式加以修正:不是把 当作学习因子,而是把 当作修正后的学习控制器,这里 可以通过对 加入一个前馈期获得。因此,可以根据修正式(4)给出如下:这里 。修正后的因子满足条件 1 并且集总分析可以在 足够小时以相同的方式进行。从式(19)代人限制条件 ,且将式(19)乘以 我们可以在 上取大列写式(19)的 型如下:这里 为初始状态误差的标准范围。 和 分别为输入及输出扰动的标准范围。由于 ,当 足够小,我们可以发现 ,这使得 。因此,得到:。这里 包括了控制器的初始状态误差和扰动的标准范围。因此,极限 ,即 ,如,这里 为收缩映射 的固定点,且 为半径,球心为 的开球体。如果没有扰动和初始误差, ,从而 汇合于。如果 如 ,收缩映射 的固定点 表示为没有 和初始误差的。如果 且 。这表明学习控制器的输出 为 0。因此,收缩一旦得以证实,可以看出 (如前定义)也是从 空间( )的封闭子空间到其自身的映射。因此, 为收缩映射。为说明这个,来考察一期望轨迹 。从式(2) ,因 , 。在式(12)中,如果考虑 那么,由于(这里 ) , 是从 附近一封闭球到其自身的收缩映射。注意, 附近球的尺寸必须足够小这样式(14)也得到满足。因此,如果初始轨迹位于 附近, 对所有的 从其附近到其本身构成映射。不失一般性,我们考虑另一对 及 (如(2)所给) 。从连续性来说,尽管 充分接近 , 也从其附近到其本身构成映射。这便是 的动机。仿真结果具有输入扰动的仿真结果本节中,我们展示一个单输入单输出非线性非最小相位对象 P 的仿真研究,其起始渐进稳定,输入状态稳定,具有以下描述的输入扰动:首先,我们考虑没有输出扰动 。这样给出参考输出轨迹:0, 其他。通过线性化系统(21)这样定义 :由于线性控制器是非稳定的,我们应用稳定无关解方式2。我们引入 作为有界的输入扰动。 通常为限制于 间的随机数。 仿真图 2(a)和(b) 展示了两个反复后期望输出的近似完美的跟踪。注意高频部分缓慢汇合所引起的余差。具有输入输出扰动的仿真结果现在,我们引入 作为(21)所给的相同非线性系统的随机有界输出扰动。同时存在先前引入的输入扰动 。 仿真图图 3展示了三次反复后期望输出轨迹的良好跟踪。A 讨论这里的 案比1中给出的多了一些优点。在1中,线性对象的逆 被当做学习因子。这使得用输出的分叉颠倒系统成为必要。实际上,在具有输出传感噪声时分叉无法可靠的计算。进一步说,对象本

注意事项

本文(基于伪逆的反复学习控制(翻译一))为本站会员(工****)主动上传,金锄头文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】,按提示上传提交保证函及证明材料,经审查核实后我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.