好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

FPGA抗单粒子效应设计概述.docx

6页
  • 卖家[上传人]:鲁**
  • 文档编号:417575574
  • 上传时间:2023-03-03
  • 文档格式:DOCX
  • 文档大小:41.92KB
  • / 6 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • FPGA抗单粒子效应设计概述摘要:辐射效应是影响航天电子可靠性的重要问题,本文首先分析了宇宙空间 中的辐射效应和其对空间电子设备的影响,紧接着比较了 ASIC、SRAM型FPGA 和反熔丝FPGA在实际宇航应用中的性能,最后根据FPGA单粒子故障效应的特点, 讨论了单粒子效应故障加固设计的一般方法1引言2000年和2003年美国成功举行了两次太空战演习,这预示着21世纪太空将成 为国际军事竞争的制高点,因此我们要有争夺制天权的准备⑴随着技术的发展和 科技的进步,航天电子设备对诸如现场可编程门阵列(FieldProgiammable Gate Airay, FPGA)、数字信号处理器(Digital Signal Processor, DSP)等超大规模集成电路的依 赖性越來越强另一方面,宇宙中存在各种辐射射线,使得高性能芯片受太空射线 影响而产生单粒子效应的概率大大提高,并且器件的集成度越高,单粒子效应的影 响就越显著,这严重影响和制约着航天电子仪器设备的正常工作因此开发具有高 速度、强抗辐射能力的集成电路技术对于发展我国航天技术及在辐射环境下工作的 武器系统具有重要的意义2辐射环境概述空间辐射主要来自宇宙射线,太阳耀斑和太阳风辐射。

      宇宙射线是指来自宇宙 空间的高能量的粒子辐射,它们主要由高能质子和电子、X射线和丫射线、中子组成 这些高能量粒子能在局部淀积足够量的电荷,不仅会造成逻辑翻转还会对加工的芯 片产生辐射损伤囚国内外对航天故障的统计显示,40%左右的故障源自太空辐射[叭 1993年8月21 H,美国有五颗卫星同时失效,原因是使用的同一批定时器芯片, 均因宇宙射线辐照而失效;我国1994年发射的“风云二号”气象卫星失去控制, 也是由于一块超大规模集成电路(Very Large Scale Integration, VLSI)芯片受到空间 辐射影响而失效〔% 2003年10月太阳风暴引起强烈的北极光,导致日本高级地球 观测卫星Midori-2等多颗卫星失灵因此抗辐射技术是保障航天电子设备高可靠长 寿运行的关键技术,是航天电子领域的研究重点和热点⑴3辐射效应概述空间电子设备由于其所处的轨道不同,受到的辐射影响也不相同总的來讲,空间中的辐射效应主要有:总剂量效应(Total Ionizing Dose, TID)、位移损伤(Displacement Damage )> 单粒子翻转(Single Event Upset, SEU)、单粒子功能中断(Single Event Functional Iiitenupt, SEFI)、单粒子烧毁(Single Event Bum out, SEB)、单粒子瞬态脉冲(Single Event Transient, SET)等回。

      其中对FPGA影响较大的辐射效应主要是总剂量效应和单粒子效应随着工艺水平的提高,FPGA内核电压逐步降低,器件的辐射总剂量承受能力 会越來越高,因此对采用先进工艺的高性能FPGA來讲,总剂量效应影响会相对减 小但是随着器件核电压的降低、门数的剧增,单粒子翻转、单粒子功能中断和单 粒子瞬态脉冲等一系列单粒子效应会越來越明显卩]单粒子效应可以造成某个器件 或者器件的某个区域较长时间其至永久性的失效因此FPGA的抗单粒子效应设计 将极大程度上影响以FPGA为重要组成部分的航天电子设备的可靠性4单粒子效应的产生机理单个粒子可能击中硅片中的组合逻辑,也可能击中时序逻辑当一个带电粒子 击中存储单元的某一敏感节点时,如截止态晶体管的漏极时,其产生的瞬时电流脉 冲能够开启对面晶体管的栅极这种作用将产生存储值的倒置,也就是存储单元中 的位翻转存储单元有两个稳定状态,一个表示存储“0”,而另一个表示存储“1” 每种状态都有两个晶体管开启和两个晶体管关闭(SEU以漏极为目标)存储单元 中的位翻转发生在高能粒子引起电路中晶体管状态翻转的时刻,这种效应就是SEU 效应,也是数字电路中需要重点关注的问题之一当一个带电粒子冲击组合逻辑块时,同样会产生瞬时电流脉冲,这种现象称为 单粒子瞬态脉冲效应(SET)。

      如果逻辑运行速度足够快,以至于传播了引入的瞬时 电流脉冲,那么该SET将最终出现在第二个锁存器的输入端,并被认为是有效的信 号该SET是否会被当作真正数据而得到保存,取决于当时它到达的时间和时钟下 降沿或上升沿之间的关系SET有转变为SEU的可能基于静态随机访问存储器(Static Random Access Memorizer, SRAM) 1'艺的 FPGA受空间高能粒子影响较大,其内部配置存储器的逻辑状态常常发生SEU如 果翻转发生在RAM单元,可能导致数据错误或丢失;如果翻转发生在逻辑功能区, 可能导致航天器的功能中断冈因此,研究提高其抗单粒子效应能力的新方法是相 当具有吸引力的工作5宇航应用中的芯片选择在实际宇航工程应用中,可选择的芯片包括专用集成电路(Application Specific hitegiated Circuit, ASIC)、以SRAM为基础的FPGA和以反熔丝为基础的FPGA 由于没有一项技术是万能的,设计人员需要针对特定的应用权衡取舍各种特性,从 而得到最佳方案对于多数航天系统而言,ASIC是具有最高密度、最小重量和最低功耗的解决 方案,但它却缺乏FPGA的灵活性。

      除此之外,当把设计工具成本、校验时间和非 经常性工程费用(Non Reclining Engineering Cost, NRE) 一并考虑之后,ASIC也是 成本最高的解决方案[刃以SRAM为基础的FPGA可以现场编程,设计人员可在运行的航天器中重新配 置逻辑电路因此,SRAM型的FPGA成为多数设计人员在应用中的首选不过这 种灵活性所要付出的代价是:所有SRAM都易受高强度宇宙辐射的影响,易发生 SEUo对于大多数航天应用而言,以反熔幺幺为基础的FPGA比ASIC和SRAM产品具 有更多优势它拥有最低的FPGA能耗且具有高可靠性,采用耐辐射的反熔丝FPGA, 设计人员可以免除ASIC设计中那些NRE成本和工程延误风险,并且能享受只有 FPGA才能提供的设计灵活性此外,耐辐射反熔丝FPGA所需元件较少,因此能 简化板级设计、减轻重量和节省板卡的空间6抗单粒子效应的加固设计6.1看门电路FPGA设计中防止单粒子翻转的硬件措施是釆取看门电路,一旦发生单粒子翻 转导致的程序走飞,可通过狗咬信号对FPGA进行复位,从而达到自动恢复此外, 在FPGA内部状态机设置状态陷阱,使由于单粒子翻转而产生的错误状态可以自动 恢复初始状态,从而避免死锁[切。

      目前此项技术已在中俄火星探测中崭露头角 6.2三模冗余图1为典型的基于硬件的三模冗余(Triple Module Redundancy ,TMR)逻辑原 理示意图,三个相同的模块Mo、Mi和M2分别接收三个相同的输入Input,产生的三 个结果送至三选二表决逻辑若有一个模块发生SEU故障,另外两个正常模块的输 出可将故障模块的输出掩蔽,从而不会在表决器输出产生差错[⑴此设计思想基于 的假设前提为:任意两个存储单元的同一位不会在统一时间发生SEU[12]o图1基于硕件的TMR表决机制IMR技术的优点在于速度快,缺点是所需附加硬件资源多,一个受保护模块 的冗余至少需要备份两次,同时表决时分别需要三个2输入与门,三个2输入或门, 从而造成功耗、体积及质量增大6.3刷写SRAM型FPGA上电时通过配置电路将配置存储单元的内容写入其中当FPGA发生SEU效应时,存储单元的“位翻转”是一个常见的现象由于翻转的位 置可能恰好不在FPGA编程布线区,故配置数据中的一个位(bit)的翻转不一定直 接导致FPGA发生功能故障然而,如果不及时釆取恢复措施,翻转位数量会不断 积累,达到一定程度终究会导致功能错误。

      刷写(Scrub)的直接功能就是阻止翻转 位的累积由于FPGA是可重复编程的逻辑器件,可以通过周期性刷写存储单元中 的内容,來减小存储单元受到SEU而发生位翻转的概率〔⑴从许多空间飞行器中 搜集到的数据显示:频繁地刷写可以直接提高存储器的抗SEU能力;而且存储单元 刷写的时间间隔越大,可靠性越低〔间刷写无需冗余的附加硬件逻辑资源,仅需适当增加自适应周期性刷新操作因 此,存储区域的重新刷写是目前国外FPGA和DSP空间应用时解决单粒子翻转问题 的最有效的方法,尤其是对未作防护的标准商用货架器件(Commercial Off Hie Shelf, COTS)器件2】但是,该方法只能解决时序逻辑的瞬时故障,不能解决由SEU导 致的错误传播效应因此,刷写技术仅适合片外FPGA配置存储单元的抗SEU设 计6.4结构设计6.4.1金字塔形体系结构设计基本概念从结构设计上研究提高系统抗单粒子效应能力的方法是目前国内外正在研究 的重点[⑴设计中常采用金字塔形体系结构,金字塔形体系结构的含义是扌乩高等 级、高可靠性的器件实施对中等级、中可靠性的器件的状态监控,中等级、中等可 靠性的器件实施对低等级、低可靠性器件的监控,依此类推,构成一个金字塔形的 层层监控的可靠性体系结构。

      Actel宇航级FPGA是国内外星载设备上普遍使用的高可靠单元(Higli Reliable Uiiit,HRU),它位于信号处理平台的金字塔塔尖,负责系统故障的诊断、控制、调 配和重构,是系统的大脑由于Actel的宇航级FPGA的规模较小,不适合进行复 杂的信号处理[⑴,因此它必须结合具有自主重构能力、高性能的FPGA或DSP才 能完成复杂的信号处理,如测控、通信、数据压缩等处于第二层结构的是SRAM 型FPGA,它可以是军品级、工业级,其至商业级器件,它完成多通道高速并行信 号处理、DSP阵列的数据管理和待处理数据流向的控制第三层是多个地位平等的 高性能DSP,它们构成了一个具有高速数据处理能力的信号处理网络6.4.2配置存储器的回读和重配置Actel高可靠性的反熔丝FPGA负责从非易失大容量存储器中读取Xilinx FPGA 的配置数据并对其进行配置,然后在系统运行期间,对最容易受辐射效应影响的配 置存储器按列进行读操作,回读出数白7J配置锁存器中的FPGA配置信息后,将其 与原始配置文件进行逐位比对[⑹如果有不同,则说明可能有单粒子翻转,且能同 时准确定位到时哪一帧数据的哪一位发生了翻转,从而对出现错误的列进行局部重 配置。

      6.4.3 FPGA状态的分析与重配置在金字塔形体系结构设计基本概念的基础上,Actel高可靠性的反熔丝FPGA 担任系统的监控模块,通过XilinxFPGA内部的功能模块提供的状态信息,对当前 FPGA功能的正常性做出分析与判断这些状态信号是配合内部程序产生的一种具 有一定宽度的脉冲串,如果FPGA检测到存储区发生SEU或者运算单元发生故障, 将停止产生状态信号;如果某些故障引起FPGA程序“跑飞”或“死机”,此状态 信号也将自行终止卩】根据评估结果,如果发生辐射失效的概率足够大时,Actel FPGA将对Xilinx FPGA进行复位、重配置或者局部重配置,以恢复其正常功能[叭 6.5分区设计由单粒子翻转引发的单粒子效应故障具有伴随性,其传递范围一般局限在儿何 相邻或者有逻辑关联的功能模块之间,因此,如果把逻辑关系联系紧密的功能模块 按照区域放在一起,那么当单个粒子入射引起配置存储器单粒子翻转时,故障空间 和逻辑扩散范围就将局限于该区域〔⑴最重要的是,在某个区域的功能模块出现故 障的时候,采用这种分区设计措施可以在不影响其他区域正常工作的情况下,对该 区域的配置存储器进行快速动态重配置。

      7结束语21世纪的国防已经开始向遥远的太空延伸,空间必将成为继陆、海、空之外的 第四维战场,空间应用、。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.