
自适应差分脉冲编码调制语音编码.doc
6页自适应差分脉冲编码调制(ADPCM)语音编码 摘要:在过去的几十年中人类在语音数字化和数字化压缩领域研究摸索中取得了辉煌的成就开辟了崭新的信息数字化时代1972年CCITT制定了G.711 64kb/s PCM语音编码标准,CCITT G.711A规定的A律和μ律PCM采用非线性量化,在64kb/s的速率语音质量能够达到网络等级,当前已广泛应用于各种数字通信系统中由于它是一维统计语音信号,当速率进一步减小时,将达不到网络等级所要求的话音质量对于许多应用,尤其在长途传输系统中,64kb/s的速率所占用的频带太宽以至通信费用昂贵,因此人们一直寻求能够在更低的速率上获得高质量语音编码质量的办法于是在1984年CCITT又提出了32kb/s标准的G.721 ADPCM编码ADPCM充分地使用了语音信号样点间的相关性,利用自适应预测和量化来解决语音信号的非平稳特点,在32kb/s速率上能够给出符合公用网的要求的网络等级语音质量本文对PCM、DPCM、DM、ADM以及ADPCM的编码、译码原理进行讨论,并对它们性能进行比较,然后着重阐述基于ADPCM的语音压缩算法,并介绍了ADPCM编码在蓝牙技术上的使用,最后对ADPCM在现代通信中的应用做个总结与展望。
1 脉冲编码调制及差分脉冲编码调制1.1 脉冲编码调制(PCM)脉冲编码调制PCM(Pulse Code Modulation)是把模拟信号变换成数字信号的一种调制方式其功能是完成模-数转换,实现连续消息数字化在PCM的调制过程中,将输入的模拟信号进行取样,量化和编码经量化后的样值进一步变换为表示量化电平大小的二进制,即用二进制的大小来代表模拟信号的幅度(一个二进制码是一组有限的“0”、“1”脉冲序列)在接收端再将这些编码的二进制数还原为原来的模拟信号由于二进制PCM便于应用现代数字技术,且具有抗噪性能好的优点,因此是一种最常用的PCM形式1.2 差分脉冲编码调制(DPCM)DPCM(Differential PCM)是指采用固定预测器与固定量化器的差值脉冲调制,它是利用样本与样本之间存在的信息冗余度来进行编码的一种数据压缩技术,它记录的不是信号的绝对大小而是相对大小它是分析ADPCM工作原理的基础DPCM采用预测编码技术,将信号抽样值与信号预测值的差值进行量化、编码后传输在DPCM中是用n位二进码表示增量,因此它是介于DM和PCM之间的一种编码方式DPCM相对于PCM信噪比有所改观,与DM相比,由于增加了量化级,因此改善量化噪声方面也优于DM,DPCM的缺点是较易受到传输线路噪声的干扰。
2 增量调制及自适应增量调制2.1 增量调制(DM)增量调制(Delta modulation,简称为DM)是只保留每一信号样值与其预测值之差的符号,并用一位二进制数编码的差分脉冲编码调制DM的工作原理,将信号瞬时值与前一个抽样时刻的量化值之差进行量化,而且只对这个差值的符号进行编码,而不对差值的大小编码因此编码反映的不是原始的信号,而是差分本身在DM中由电平的量化误差产生的噪声称为颗粒噪声而由于输入信号的斜率过大,调制器跟踪不及而产生的噪声称为斜率过载噪声2.2 自适应增量调制(ADM)自适应增量调制(Adaptive DM,简称ADM) 为兼顾过载噪声和量化噪声,而采用了ADM,它的基本方法是检测输入信号的斜率变化,自动改变预测信号和量化台阶,使预测信号总能跟踪上输入信号的变化近年来,在ADM体制上提出了几种实用有效的算法,例如:(1)常因子自适应增量调制(CFDM)算法;(2)高信息自适应增量调制(HIDM)算法;(3)Song算法;(4)混合自适应增量调制(HCDM)算法;(5)CVSD算法3 自适应差分脉冲编码调制(ADPCM)自适应差分脉冲编码调制(Adaptive Differential Pulse Code Modulation,简称ADPCM)最早使用于数字通信系统中。
目前我们所使用的IMA ADPCM算法简单实用,被广泛应用于数字录音笔和音乐盒中,更是应用于卫星通信IDR系统及小型站卫星通信系统传输语音和数据 自适应差分脉冲编码调制用预测编码来压缩数据量它是一种结合了ADM 的差分信号与PCM的二进制码的方法的波形编码由于ADPCM主要用来对现有的PCM信道扩容,即把2个2Mkb/s PCM基群信号转换成一个2Mkb/s 60路ADPCM编码器输出与解码器输出都采用标准A律或μ律PCM码而经过对数压缩后的64 kb/s PCM信号是不能直接进行一般算术运算的,进入编码前,需要将A律或μ律PCM码通过内在关系转换成线性PCM码 (即自然二进制码)在接收端,则需要将ADPCM 码解码得到的自然二进制码重建信号变换成A律或μ律对数 PCM 信号输出它的编码简化框图如图 1 所示:图1. ADPCM编码示意图其编码过程为:①为了便于数字运算,在编码器中先将输入的PCM码转换成14位线性码Sl(k),然后与预测信号Se(k)求差得到信号D(k)②将D(k)进行自适应差分量化,得到4比特ADPCM代码I(k)③先把I(k)送到量化阶调整器,算得新的量化标度因子Y(k)。
④再把I(k)送到解码器,同时将 I(k)进行本地解码得到量化后的差值信号Dq(k)与预测信号Se(k)求和得到本地重建信号Sr(k),将Sr(k)输入自适应预测器,得到二阶极点和六阶零点的混合预测系数,它利用Dq(k)、Sr(k)以及前几次运算的值对下一个输入信号S1+l(k)进行预测,计算出Se+l(k)解码是实现解压缩功能,即编码的逆过程,解码与编码有相同的电路,只是多了一个同步编码调整,其作用是使级联工作时不产生误差累积解码器最后输出的码是8位A律或μ律PCM码,因此在得到重建信号Se(k),还需将它转换成相应的PCM码解码简化框图如图 2 所示:图2. ADPCM解码示意图4 语音压缩编码现代通信的重要标志是实现数字化对模拟信号实现数字化通信首先要将模拟信号转变为数字信号这一过程对语音信号的变换叫语音编码衡量语音压缩编码性能的主要指标是语音编码质量、编码速率、编码算法及复杂程度和编解码延时对这些指标的要求往往是相互矛盾的,必须根据实际情况权衡4.1 语音压缩编码方法语音编码技术可以分为两大类:波形编码和参数编码波形编码是将时间域信号直接变换为数字代码,其特点是再建信号的波形。
这种方案中信号的质量较高,而其编码的比特率在64-16kb/s范围内,PCM、DM等均属于这一类参量编码又叫模型基信源编码它不传送信号的取样值,而是传送语音生成模型的基本参数以及适当的激励信号在接收端则从数字代码恢复特征参量,再从参量重建语音信号这种方法的特点是质量较前者低,但可大大压缩比特速率,多用于窄带信道,如在移动通信、卫星通信、网络通信中的应用日益广泛图3:语音生成模型4.2 语音压缩编码标准H.323(由国际电信联盟ITU推荐)建议定义的多媒体会议系统工作的网络基础是一个基于分组交换的数据网络,如X.25网、帧中继网和IP网等目前IP网发展迅速,公用IP网和专用IP网都在大规模建设,使得IP网在通信信息领域越来越重要H.323建议用于分组交换网络,当然也用在IP网中H.323会议系统的语音编码主要有6种,即G.711、G.722、G.723.1、G.728、G.729和MPEGaudio,其中G7.11是必备的,即系统中的终端与MCU都必须支持G.711编码,其他5种是可选用的除了上述6种编码外,也可以通过能力协商来采用其他编码形式1)G.711,其编码速率为64kb/s,采用PCM编码方式,采样速率为8kHz,每个样值用8bit非线性的A律或μ律进行编码,总速率为64kbit/s。
2)G.728,基于低时延的代数编码激励线性预测(LD-ACELP)压缩原则16kbit/s编码标准的数据压缩算法3)G.729和G.729a,基于共轭结构-代数编码激励线性预测(CS-ACELP)压缩原则8kbit/s编码标准的数据压缩算法由于G.729a是G.729的简化版本,算法复杂度低且执行时间短而受到了广大网关厂商的青睐G.729标准采用的算法,可以仅用8kbit/s带宽传输话音,而话音质量与32kbit/s ADPCM相同4)G.723.1,该标准规定了5.3kbit/s和6.3kbit/s两种不同速率其中5.3kbit/s速率是以ACELP代数码激励线性预测编码算法为基础图4:音编码标准5 突破蓝牙ADPCM语音编码 CSR公司为解决CVSD作为语音流量编码方法所带来的局限,在第六代蓝牙技术中引入了射频扫描等改进技术,同时开发通过eSCO连接采用自适应差分脉冲编码调制(ADPCM)CODEC来实现更高的音频质量的最领先的技术——AuriStream,由于其速率只有32Kbps,却可执行完全相同的功能,使的蓝牙功耗节省一半ADPCM被视为对CVSD(连续可变斜率增量调制)的理想补充的一种已被广泛接受的CODEC技术。
ADPCM不同于CVSD:它能够以相对较慢的取样速度发现样本间的差异ADPCM以相对于CVSD速率一半的较低速率传输固定质量的信号,为蓝牙传输器和接收器节约了大约一半的运行时间该方法为蓝牙系统减少了40%的功耗ADPCM使蓝牙连接的语音通话能够达到固定的通话质量 CSR公司BlueCore6所采用的AuriStream技术的耳机与采用同样技术的相连接,在嘈杂的环境里也能使语音拨号变得更为精确简单这体现了ADPCM编码在质量方面的优越性BlueCore6上所采用的AuriStream技术可支持仅为一半CVSD的数据速率的的ADPCM,这就使它能够有潜力支持多达七个更高质量的eSCO语音信道远远超出传统上仅支持三个同步SCO语音信道6 结论与展望ADPCM算法能够很好地压缩语音信号,在大大缩减数据存储空间的同时能够提高数据的传输速度与其它编码方式相比,ADPCM能提供更高的压缩比,提高了频率利用率,因此在频带紧缺的现代通信中具有广泛的应用前景通过 ADPCM 编码方式对飞行员语音进行编码,可以很好地对语音信号进行压缩,减少数据存储空间并大大提高了数据的传输速率,节约了资源占用量。
ADPCM 作为一种经典语音编码方式算法复杂度低,压缩比小,节约资源的同时也保证了语音的高质量。
