好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

第2章DSP芯片的基本结构和特征.doc

27页
  • 卖家[上传人]:工****
  • 文档编号:553711348
  • 上传时间:2023-08-14
  • 文档格式:DOC
  • 文档大小:292.50KB
  • / 27 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 优质文档第2章 DSP芯片的根本构造和特征2.1 引 言可编程DSP芯片是一种具有特殊构造的微处理器,为了到达快速进展数字信号处理的目的,DSP芯片一般都具有程序和数据分开的总线构造、流水线操作功能、单周期完成乘法的硬件乘法器以及一套适合数字信号处理的指令集本章将首先介绍DSP芯片的根本构造,然后介绍TI公司的各种DSP芯片的特征,最终简要介绍其他公司的DSP芯片的特点2.2 DSP芯片的根本构造为了快速地实现数字信号处理运算,DSP芯片一般都采纳特殊的软硬件构造下面以TMS320系列为例介绍DSP芯片的根本构造TMS320系列DSP芯片的根本构造包括:〔1〕哈佛构造;〔2〕流水线操作;〔3〕专用的硬件乘法器;〔4〕特殊的DSP指令;〔5〕快速的指令周期这些特点使得TMS320系列DSP芯片可以实现快速的DSP运算,并使大局部运算〔例如乘法〕能够在一个指令周期内完成由于TMS320系列DSP芯片是软件可编程器件,因此具有通用微处理器具有的便利敏捷的特点下面分别介绍这些特点是如何在TMS320系列DSP芯片中应用并使得芯片的功能得到加强的 哈佛构造哈佛构造是不同于传统的冯·诺曼〔Von Neuman〕构造的并行体系构造,其主要特点是将程序和数据存储在不同的存储空间中,即程序存储器和数据存储器是两个相互独立的存储器,每个存储器独立编址,独立访问。

      与两个存储器相对应的是系统中设置了程序总线和数据总线两条总线,从而使数据的吞吐率提高了一倍而冯·诺曼构造那么是将指令、数据、地址存储在同一存储器中,统一编址,依靠指令计数器供应的地址来区分是指令、数据还是地址取指令和取数据都访问同一存储器,数据吞吐率低在哈佛构造中,由于程序和数据存储器在两个分开的空间中,因此取指和执行能完全重叠运行为了进一步提高运行速度和敏捷性,TMS320系列DSP芯片在根本哈佛构造的根底上作了改良,一是允许数据存放在程序存储器中,并被算术运算指令干脆运用,增加了芯片的敏捷性;二是指令存储在高速缓冲器〔Cache〕中,当执行此指令时,不须要再从存储器中读取指令,节约了一个指令周期的时间如TMS320C30具有64个字的Cache 流水线与哈佛构造相关,DSP芯片广泛采纳流水线以削减指令执行时间,从而增加了处理器的处理实力TMS320系列处理器的流水线深度从2~6级不等第一代TMS320处理器采纳二级流水线,其次代采纳三级流水线,而第三代那么采纳四级流水线也就是说,处理器CLKOUT1执行译码取指NN-1N-2N+1N-1N+2NNN+1可以并行处理2~6条指令,每条指令处于流水线上的不同阶段。

      图2.1所示为一个三级流水线操作的例子图2.1 三级流水线操作在三级流水线操作中,取指、译码和执行操作可以独立地处理,这可使指令执行能完全重叠在每个指令周期内,三个不同的指令处于激活状态,每个指令处于不同的阶段例如,在第N个指令取指时,前一个指令即第N-1个指令正在译码,而第N-2个指令那么正在执行一般来说,流水线对用户是透亮的 专用的硬件乘法器在一般形式的FIR滤波器中,乘法是DSP的重要组成局部对每个滤波器抽头,必需做一次乘法和一次加法乘法速度越快,DSP处理器的性能就越高在通用的微处理器中,乘法指令是由一系列加法来实现的,故需很多个指令周期来完成相比而言,DSP芯片的特征就是有一个专用的硬件乘法器在TMS320系列中,由于具有专用的硬件乘法器,乘法可在一个指令周期内完成从最早的TMS32010实现FIR的每个抽头算法可以看出,滤波器每个抽头须要一条乘法指令MPY:LT ;装乘数到T存放器DMOV ;在存储器中移动数据以实现延迟MPY ;相乘APAC ;将乘法结果加到ACC中其他三条指令用来将乘数装入到乘法器电路〔 LT〕,移动数据〔DMOV〕以及将乘法结果〔存在乘积存放器P中〕加到ACC中〔APAC〕。

      因此,假设采纳256抽头的FIR滤波器,这四条指令必需重复执行256次,且256次乘法必需在一个抽样间隔内完成在典型的通用微处理器中,每个抽头须要30 ~ 40个指令周期,而TMS32010只需4条指令假如采纳特殊的DSP指令或采纳 TMS320C54X等新一代的DSP芯片,可进一步降低FIR抽头的计算时间 特殊的DSP指令DSP芯片的另一个特征是采纳特殊的指令节中介绍的DMOV就是一个特殊的DSP指令,它完成数据移位功能在数字信号处理中,延迟操作特别重要,这个延迟就是由DMOV来实现的TMS32010中的另一个特殊指令是LTD,它在一个指令周期内完成LT、DMOV和APAC三条指令LTD和MPY指令可以将FIR滤波器抽头计算从4条指令降为2条指令在其次代处理器中,如TMS320C25,增加了2条更特殊的指令,即RPT和MACD指令,采纳这2条特殊指令,可以进一步将每个抽头的运算指令数从2条降为1条:RPTK 255 ;重复执行下条指令256次MACD ;LT, DMOV, MPY 及 APAC 快速的指令周期哈佛构造、流水线操作、专用的硬件乘法器、特殊的DSP指令再加上集成电路的优化设计,可使DSP芯片的指令周期在200ns 以下。

      TMS320系列处理器的指令周期已经从第一代的200ns降低至此时此刻的20ns 以下快速的指令周期使得DSP芯片能够实时实现很多DSP应用2.3 TI定点DSP芯片自1982年TI推出第一个定点DSP芯片TMS32010以来,TI的定点DSP芯片已经经验了TMS320C1X、TMS320C2X/C2XX、TMS320C5X 、TMS320C54X、TMS320C62X等几代产品,产品的性能价格比不断提高,应用越来越广泛下面分别介绍这些芯片的主要特征 TMS320C1X.1 根本特点第一代TMS320系列DSP芯片包括:TMS32010、TMS32011、TMS320C10、 TMS320C15/E15和TMS320C17/E17其中,TMS32010和TMS32011采纳2.4mm的 NMOS 工艺,而其他几种那么采纳1.8mm CMOS工艺这些芯片的典型工作频率为20MHzTMS320第一代DSP芯片的主要特点如下: 指令周期:160ns/200ns/280ns 片内RAM:144字/256字〔TMS320C15/E15/C17/E17〕 片内ROM:1.5K字/4K字〔TMS320C15/C17〕 4K字片内程序EPROM〔TMS320E15/E17〕 4K字外部全速存储器扩展 并行乘法器:乘积为32位 桶形移位器:将数据从存储器移到ALU 并行移位器 允许文本交换的4×12位堆栈 两个间接寻址的协助存放器 双通道串行口〔TMS32011,TMS320C17/E17〕 片内压扩硬件〔TMS32011,TMS320C17/E17〕 协处理器接口〔TMS320C17/E17〕 器件封装:40脚双列直插〔DIP〕/44脚塑封〔PLCC〕.2 TMS320C10TMS320 DSP芯片的第一代产品是基于TMS32010和它的CMOS版本TMS320C10的构造。

      TMS32010于1982年推出,是第一个能够到达 5 个MIPS的微处理器TMS32010采纳改良的哈佛构造,即程序和数据空间相互独立程序存储器可在片内〔1.5K字〕或片外〔4K字〕片内数据RAM为144字有四个根本的算术单元:算术逻辑单元〔ALU〕、累加器〔ACC〕、乘法器和移位器1) ALU:32位数据操作的通用算术逻辑单元ALU可进展加、减和逻辑运算;(2) ACC:累加器存储ALU的输出,也是ALU的一个输入它采纳32位字长操作,分高16位和低16位两局部处理器供应高16位和低16位的特地指令:SACH〔高16位〕和SACL〔低16位〕;(3) 乘法器:16×16位并行乘法器由三个单元组成:T存放器、P存放器和乘法器阵列T存放器存储被乘数,P存放器存储32位乘积为了运用乘法器,被乘数首先必需从数据RAM中装入到T存放器,可用LT、LTA和LTD指令然后执行MPY〔乘〕或MPYK〔乘马上数〕指令乘和累加器操作可用LTA、LTD和MPY、MPYK指令在两个指令周期内完成;(4) 移位器:有两个移位器可用于数据移位一个是桶形移位器,另一个是并行移位器桶形移位器又称定标移位器当数据存储器的数据送入累加器或与累加器中的数据进展运算时,先通过这个移位器进展0~16位左移,然后再进展运算。

      并行移位器即输出移位器,其作用是将累加器中的数据左移0、1或4位后再送入数据存储器中,以实现小数运算或小数乘积的调整在TMS32010/C10根底上又派生了多个处理器,它们可供应不同的处理器速度、存储器扩展和各种I/O集成3 TMS320C1X的其他芯片1.TMS320C15/E15TMS320C15/E15与TMS32010的代码和管脚全兼容,供应256字的片内RAM和4K字的片内ROM〔C15〕或EPROM〔E15〕TMS320C15的指令周期有200ns和160ns〔TMS320C15-25〕两种2.TMS320C17/E17TMS320C17/E17是一个专用的微处理器它有4K字的片内程序ROM〔C17〕或EPROM〔E17〕,一个全双工串行通信的双通道串行口,片内硬件压扩器〔m律/A律〕,一个用于串行通信的串行口定时器,及一个协处理器接口协处理器接口可以在处理器和4/8/16位微处理器之间供应干脆接口TMS320C17/E17与TMS32010目标代码兼容,且可用一样的开发工具该处理器是基于TMS320C10的CPU内核,外加片内的外设存储器和I/O模块TMS320C17/E17可认为是半定制的DSP芯片。

      表2.1 是TMS320第一代产品的比拟表表2.1 TMS320第一代处理器DSP芯片指令周期〔ns〕制造工艺片内程序ROM〔字〕片内程序EPROM〔字〕片内数据RAM〔字〕片外程序〔字〕TMS32010200NMOS1.5K1444KTMS32010-25160NMOS1.5K1444KTMS32010-14280NMOS1.5K1444KTMS32011200NMOS1.5K144TMS320C10200CMOS1.5K1444KTMS320C10-25160CMOS1.5K1444KTMS320C15200CMOS4K2564KTMS320C15-25160CMOS4K2564KTMS320E15200CMOS4K2564KTMS320C17200CMOS4K256TMS320C17-25160CMOS4K256TMS320E17200CMOS4K256 TMS320C2X其次代TMS320 DSP芯片包括TMS32020、TMS320C25/E25、TMS320C26及TMS320C28在这些芯片中,TMS32020是一个过渡的产品,其指令周期为200ns,与TMS32010相当,而其硬件构造那么与TMS320C25一样。

      在其次代DSP芯片中,TMS320C25是一个典型的代表,其他芯片都是由TMS320C25派生出来的。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.