您所在位置：网站首页 > 办公文档 > 解决方案 > 语音编码Speech Codling

语音编码Speech Codling.docx

3页

卖家[上传人]：汽***

文档编号：546333324

上传时间：2023-09-17

文档格式：DOCX

文档大小：16.35KB

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

10金贝

下载

/ 3 举报版权申诉马上下载

文本预览

下载提示

常见问题

语音编码语音编码是一个基本技术，已经存在60多年了，始于20世纪30年代的达德利原始声码器那个时候，语音编码的目标是提供压缩技术使铜线能够处理AT&T网络中语音业务的连续增长幸好出现了带宽传输，对语言编码的最初需求没有实现，而这种带宽传输能力最初有微波无线系统提供，最终由光纤传输系统提供就在最近，由于无线系统（数字语言编码是处理日益增长的业务所必须）和IP语音系统的快速发展，对语音编码需求再次出现，其中语音正是一种（非常重要的）通过IP网络传输的数据类型语言编码的目标是为了把语音信号进行压缩（也就是说，降低所需的比特率表示语音信号）并且不失真的存储或者传输语言编码区别于一般的音频编码，在音频编码中关注的是语音本身其他信号（例如背景噪声或音乐）可能与语音同在，从而将会随着语音而被压缩和编码然而，这些信号在语音编码中一般是微不足道的，可以不考虑本文中，我们简要讨论了语音编码中的基本问题语音编码器通过分析并量化语音波形的特性对语音进行压缩，试图使听见的语音缺陷达到最小化标准电信中最简单和最广泛使用的语音编码器比基本的波形量化器（在表6—1中称作直接量化）要小国际电信联盟（ITU）建议G.711定义了两个（A律和mu律）8比特长脉冲PCM量化器。

对于各种输入电平，这些量化器保持大概35dB的信号量化噪声比这个噪声电平对宽带（200到3400赫兹）语音来说几乎是听不到的语音采样速率是8K赫兹，产生一个总共64K比特每秒的编码语音比特率事实上所有现存的电信应用都始于这个标准进行编码的语音，虽然此编码速率超过了电信的要求，但它限制了语音（我们称之为质量语音）质量，因此不仅影响了语音编码器的性能还影响了语音识别系统的性能带宽语音的另一个选择是宽带语音，即已知的评论品质语音这里，带宽是500到7000赫兹，采样速率是16K赫兹，量化器通常是采用14比特的均匀PCM得到的宽带编码语音不仅听起来比宽带语音好，而且更清晰，适用于现代语音识别系统下一类编码器是波形跟随编码器这些编码器试图重新产生原始语音波形的相似物因为使用了一小部分语音特性，所以可以实现更大程度上的压缩（随着失真度的增加）语音必须是保留（并且随着时间追踪）的两个主要属性是本地基因（或基带频率）和本地共振峰（声道的共振频率）一种波形跟随方法，叫做自适应差分PCM（ADPCM），使用后向自适应无限脉冲响应（IIR）滤波器，随着时间跟随基音对未量化的语音信号和由预测滤波器预测出来的信号之间的差分信号进行量化。

另一种波形跟随方法，称为码激励线性预测（CELP）或者多脉冲激励（MPE），包括共振峰跟随滤波器（称为短时滤波器）和基音跟踪滤波器（称为长时预测滤波器或自适应码书）短时预测滤波器基于由所谓的线性预测分析法得到的本地语音频谱的全极点模型在编码器里，使用两个预测滤波器从语音波形中消除所以预测到的“冗余”剩下的是残留信号如果这个残留信号被用作这两个滤波器的激励信号，那么原始信号可以得到精确的重构为了降低比特率，残留信号近似为一小部分脉冲以构造一个近似激励信号如果这些脉冲是顺序选择的，那么编码器称作多脉冲编码器，然而如果这个脉冲共同选自可能的激励信号的码书，那么编码器称作CELP编码器适合的激励信号的选择有感知加权域进行，而不是仅仅最小化波形的均方误差使得量化噪声几乎听不到。

点击阅读更多内容