您所在位置：网站首页 > 高等教育 > 大学课件 > 实时数字信号处理与DSP芯片31张讲解学习

实时数字信号处理与DSP芯片31张讲解学习.ppt

31页

卖家[上传人]：yuzo****123

文档编号：239583874

上传时间：2022-01-14

文档格式：PPT

文档大小：618KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

15金贝

下载

/ 31 举报版权申诉马上下载

文本预览

下载提示

常见问题

DSP原理及应用1什么是DSP芯片DSP： DigitalSignalProcessingDSPs:DigitalSignalprocessors内部采用程序和数据分开的哈佛结构；具有专门的硬件乘法器；广泛采用流水线操作；提供特殊的DSP指令；适用于快速实现各种数字信号处理算法23IP（voiceoverIP）5电动机方向舵实时性的要求（二）从信号输入到结果输出的延迟必须足够小，即响应时间满足系统的要求6医疗诊断78为什么要用DSP芯片，而不是模拟器件来对信号进行处理？模拟电路的性能要取决于温度等环境因素而数字滤波器则基本上不受环境的影响 DSP易于在非常小的宽容度内进行计算，因为其性能并不取决于性能离散的器件组合一个模拟电路一旦制造出来，其特性（例如通带频率范围）是不容易改变的使用DSP实现数字信号处理，就可以通过对其重新编程来改变系统的特性9信号处理方式的比较比较因素模拟方式数字方式修改设计的灵活性修改硬件设计，或调整硬件参数改变软件设置精度元器件精度A/D的位数和计算机字长，算法可靠性和可重复性受环境温度、湿度、噪声、电磁场等干扰和影响大不受这些因素的影响大规模集成尽管已有一些模拟集成电路，但品种较少、集成度不高、价格较高DSP器件体积小、功能强、功耗小、一致性好、使用方便、性能/价格比高实时性除开电路引入的延时外，处理是实时的由计算机的处理速度决定高频信号的处理可以处理包括微波毫米波乃至光波信号按照奈准则的要求，受S/H、A/D和处理速度的限制10能够进够进行数字信号处处理的CPU通用处理器（GPP）采用冯.诺依曼结构，程序和数据的存储空间合二而一 8-bit Apple（6502），NEC PC-8000（Z80） 8086/286/386/486/Pentium/Pentium II/ Pentium III PowerPc 64-bit CPU（SUN Sparc，DEC Alpha, HP） CISC 复杂指令计算机, RISC 精简指令计算机采取各种方法提高计算速度，提高时钟频率，高速总线，多级Cashe，协处理器等 Single Chip Computer/ Micro Controller Unit（MCU）具有通用CPU所具有的ALU和CU，还有存储器（RAM/ROM）寄存器，时钟，计数器，定时器，串/并口，有的还有A/D，D/A INTEL MCS/48/51/96（98） MOTOROLA HCS05/011 ARM 7，9，DSP采用哈佛结构，程序和数据分开存储采用一系列措施保证数字信号的处理速度，如对FFT的专门优化 11DSP与通用处理器的比较1对密集的乘加法运算的支持2存储器结构3零开销循环4定点，浮点计算6 执行时间的预测5专门的寻址方式8开发工具的要求7多处理器接口9JTAG（JointTestActionGroup）标准测试接口（IEEE1149标准接口）12DSP芯片的第一步 1978AMI公司1979美国Iintel公司第一个单片DSP芯片。

但是这两种芯片内部都没有现代DSP芯片所必须的单周期指令功能 1980年日本NEC公司PD7720第一个具有乘法器的商用DSP芯片 1982日本Hitachi公司浮点DSP芯片（CMOS工艺） 1983日本Fujitsu公司指令周期120ns，双内部总线第一个高性能的浮点DSP芯片应是AT&T公司于1984年推出的DSP3213第一代（1982）TMS320C1x；第二代TMS320C2x；第三代TMS320C3x；第四代TMS320C40/C44；第五代TMS320C50/C51/C52/C53；第六代TMS320C6000；还有多种不同领域的DSP芯片（P13图1.1）目前最成功：美国德克萨斯仪器公司（TexasInstruments，TI）14发展趋势从运算速度来看，MAC（一次乘法和一次加法）时间已经从80年代初的400ns（如TMS32010）降低到40ns（如TMS32C40），处理能力提高了10多倍内部关键的乘法器部件从1980年的占模区的40左右下降到5以下，片内RAM增加一个数量级以上从制造工艺来看，1980年采用4的N沟道MOS工艺，而现在则普遍采用亚微米CMOS工艺。

引脚数量从1980年的最多64个增加到现在的200个以上，引脚数量的增加，意味着结构灵活性的增加DSP芯片的发展，使DSP系统的成本、体积、重量和功耗都有很大程度的下降15DSP厂商的芯片（一）公司/名称芯片/核定点/浮点字长长(bits)指令长长度(bits)钟频钟频(MHz)DSP GroupPineDSPCoreCoreFixed161640OakDSPCoreCoreFixed161680TeakDSPCoreCoreFixed1616130PalmDSPCoreCoreFixed16/20/2416/32150ARMPiccoloCoreFixed1616/3270Hitachi SH-DSPChipFixed1616/326616DSP厂商的芯片（二）公司/名称芯片/核定点/浮点字长长(bits)指令长长度(bits)钟频钟频(MHz)IBMC54XDSPCoreFixed161666Mentor GraphicsM320C50CoreFixed1616Siemens (Infineon)TriCoreBothFixed3216/3280Carmel BothFixed1624/48120ZoranZR386xxChipFixed203240ZSP CorporationZSP164xxChipFixed161620017DSP芯片的四大家族 AnalogDevicesADSP-21xxTigerSharcDSPSHARCDSP LucentDSP-16xxDSP16000 MotorolaDSP-56800DSP563xx Lucent/MotorolaStarCoreSC100 TexasInstrumentTMS320C2000TMS320C5000TMS320C6000TMS320DM640OMAP18AnalogDevicesADSP-21xxTigerSharcDSPSHARCDSP16-bitDSP，支持定点和浮点运算带8-bit保护位的40-bitACC单周期执行指令多数指令可以条件执行VLIW（超长指令字）结构可以在一个机器周期内执行四条指令该系列DSP具有SIMD（单条指令多个数据）的能力内部集成有大容量的SRAM（第一个TigerSharcDSP集成了6Mbit的RAM）ADI公司的软硬件开发工具：VisualDSP集成开发环境19LucentDSP-16xxDSP1600016-bit定点DSP具有16316-bit的乘法器36-bit的ALU/移位器所有片种都有片内ROM工作在2.7-4.75V双MAC单元支持16332-和32332-bit的乘法ALU支持16-、32-、40-bit运算X和Y存储器具有32-bit数据宽度软件工具：ANSIC编译器、汇编器、连接器、调试器和软仿真器。

用TargetView通信系统通过JTAG来作独立的或连网的硬件仿真可以图形化地显示通过DSP的数据流这样，用户可以观察到处理器中没有充分使用的部分，修改代码来提高效率SynopsysCOSSAP,CadenceSPW,以及MathworksMatlab等第三方的工具20MotorolaDSP-56800DSP563xx16，24-bit定点DSP带有控制功能的DSP可以中断的硬件do循环七级流水，具有条件ALU指令以寄存器为基础的结构与核执行单元并发的六通道DMA操作多数器件工作于3.3V，并兼容5V的I/O；有些器件工作于1.8V,兼容3.3V的I/O，工作于2.7V和70MHz与核并行工作的滤波器协处理器使用OnCE口，通过JTAG接口作片上仿真CodeWarrior提供集成的开发环境21Lucent/MotorolaStarCoreSC10016-bit定点DSP核DSP结构可以升级可变长度指令提高代码的效率和并行性更好的C程序编译器22 TMS320C5000结构特点16-bit定点DSPC55x有双MAC单元；C54x有单MAC单元C55的指令长度可变，且没有排队的限制C55x有12组总线；C54x有8组总线工作于0.9V和300MHz综合介绍C55x和C54x源代码兼容，而C5x和C2x源代码兼容。

C54x关注于低功耗，而C55x则将低功耗提到一个新水平：300MHz的C55x和120MHz的C54x相比，性能提高5倍，而功耗则降到六分之一23 TMS320C6000 结构特点第一块C64x可以达到750MHz超长指令字（VLIW）结构具有与RISC类似的特点C编译器与结构结合紧密8个功能块提高了并行性综合介绍TI的TMS320C6000是基于超长指令字（VLIW）结构的通用DSP系列该结构包括定点的C62x、浮点的C67x和新的C64xC64x和C62x代码兼容，但结构有显著的加强，其初期的工作频率可达750MHzC67x在C62x八个功能块中的六个上增加了浮点功能，因此其指令集是不同的24 TMS320DM64xDSPs特点针对视频进行优化的VC1/WMV9FullD1SD解码MPEG-2MPMLSD解码MPEG-4ASPFullD1SD解码专用视频处理子系统后端集成OSD，四个视频DAC，24位数字RGB输出C编译器与结构结合紧密前端图像缩放工具、影像处理引擎、16位数字输入视频编码/解码定点数字信号处理采用达芬奇技术综合介绍TMS320DM64x架构是一款高度集成的片上系统(SoC)，集成了数字视频所需的许多外部组件，使硬件材料清单成本降低了50%。

DM64x器件建立在TI性能卓越的TMS320C64x+DSP内核基础之上，ARM926处理器、视频加速器、网络外设及外部存储器存储设备接口等都专门为视频功能进行了调节TMS320DM6443针对视频编码及解码应用进行了调优，可提供数字视频解码所需要的全部组件，包括带集成式图像缩放工具及画中画(OSD)引擎的模拟及数字视频输出TMS320DM6446则特别适合视频编码与解码，其专门的视频处理前端添加了视频编码功能，能够捕获各种数字视频格式25达芬奇（DaVinciTM）技术介绍达芬奇技术是业界第一款集成了DSP处理器、软件、工具以及技术支持的综合型解决方案适用于开发优化的数字视频终端设备达芬奇技术由组件优化构成，这些组件可以使数字视频终端设备相互支持：达芬奇处理器达芬奇处理器基于业界最高性能的DSP平台TITMS320C6000，其充分利用了TI最新的C64x+DSP内核达芬奇处理器包含基于可扩展、可编程DSP的SoC（可从DSP与ARM内核进行定制），同时还包含优化的加速器与外设，以全方位满足各种数字视频终端设备对价格、性能以及功能等多方面的需求26达芬奇软件运行于达芬奇处理器之上的达芬奇软件将充分利用芯片资源，其内置于可配置的框架内，并通过流行操作系统内部已公布的API提供，以实现快速的软件实施。

视频、影像、音频及语音编解码器H.264,MPEG4,H.263,WMV9,MPEG2,JPEG,AAC+,WMA,MP3,G.711,G.728,G.723.1，G.729ab等视频、影像、音频以及语音编解码器操作系统达芬奇技术最初支持Linux操作系统，未来会陆续实现对诸如WinCE等其它流行操作系统的支持应用编程接口(API)这些API可结合DSP与ARM软件开发人员双方的最大优势在DSP平台针对DSP专家保持开放性的同时，ARM软件开发人员可以根据API进行编程，同时确保新一代数字视频处理所需要的编解码器流行组合能够相互配合并适合特定视频应用框架达芬奇软件框架可确保所有基于DSP的SoC软硬件组件都能够无缝地协同工作达芬奇开发。

点击阅读更多内容