语音信号处理第3版——第3讲.ppt
28页3.1矢量量化 3.1.1矢量量化的基本原理 3.1.2失真测度 3.1.3 线性预测失真测度 3.1.4识别失真测度 3.1.5最佳码本设计 矢量量化( VQ,即 Vector Quantization) 是一种极其重要的信号压缩方法 VQ在语音信号处理中占十分重要的地位广泛应用于语音编码、语音识别和语音合成等领域 量化分为两类: * 标量量化 :将取样后的信号值逐个地进行量化 * 矢量量化 :将若干取样信号分成一组,即构成一个矢量,然后对此矢量一次进行量化 凡是要用量化的地方都可以采用矢量量化 矢量量化是实现 数据压缩 的一种有效方法,早在 50和 60年代就被用于语音压缩编码直到 70年代线性预测技术被引入语音编码后,矢量量化技术才活跃起来 80年代初,矢量量化技术的理论和应用研究得到迅速发展 采用矢量量化技术对信号波形或参数进行压缩处理,可以获得很好的效益,使存储要求、传输比特率需求或和计算量需求降低 . 采用矢量量化的效果优于标量量化的原因? 矢量量化能有效的应用矢量中各分量之间的四种相互关联性质来消除数据中的冗余度 这四种相互关联的性质是线性依赖 (相关性 )、非线性依赖 (统计不独立 )、概率密度函数的形状和矢量量化的维数, 而标量量化仅能利用线性依赖和概率密度函数的形状来消除冗余度。
矢量量化研究的目的? 针对特定的信息源和矢量维数,设计出一种最优化的量化器,在 R(量化速率)一定的情况下,给出的量化失真尽可能接近 D(R)(最小量化失真 ) 标量量化 是对信号的单个样本或参数的幅度进行量化;标量是指被量化的变量,为一维变量 矢量量化 的过程是将语音信号波形的 K个样点的每一帧,或有 K个参数的每一参数帧构成 K维空间的一个矢量,然后对这个矢量进行量化 标量量化可以说是 K= 1的矢量量化 矢量量化过程和标量量化过程相似将 K维 无限空间划分为 M个区域边界 ,然后将输入矢量与这些边界进行比较 ,并被 量化为“距离”最小 的区域边界的 中心矢量值 矢量量化的定义 设有 N个 K维特征矢量 ( X在 K维欧几里德空间 中),其中,第 i个矢量记为 可以被看作是语音信号中某帧参数组成的矢量 把 K维欧几里德空间 无遗漏地划分为 J个互不相交的子空间 即满足 子空间 成为胞腔 12X { , , , }NX X XKR12, , , JR R R1,,J Kj i jjR R R R i j 12{ , , } , 1 , 2 , ,iKX x x x i NKRiR在每一个子空间 找一个代表矢量 ,则 J个代表矢量可以组 成矢量集 Y是一个矢量量化器,在矢量量化里 Y叫作 码书 或 码本 , 称为 码矢 或 码字 。
矢量个数 J叫作码本长度,或者码本尺寸 不同的划分或者不同的代表矢量选取方法就可以构成不同的矢量量化器 步骤: 1)判断 —— 具体属于哪个子空间 2)输出 —— , Q为量化器函数 以 K= 2进行说明 : 当 K= 2时,所得到的是二维矢量所有可能的二维矢 量就形成了一个平面 jR jY 12, , , JY Y Y YjYKiXRjR()jiY Q X记为( a1,a2) ,所有可能的( a1,a2)就是一个二维空间如图 3-1( a)所示 矢量量化就是将这个平面划分为 M块 S1, S2, … , Si…S M,然后从每一块中找出代表值 Yi( i= 1, 2….M ),这就构成一个有 M个区间的二维矢量量化器 图 3-1( b)所示的是一个 7区间的二维矢量量化器,即 K= 2, M= 7 图 3-1 矢量量化概念示意图 通常 这些代表值 Yi称为量化矢量 对一个矢量 X进行量化,首先选择一个 合适的失真测度 ,然后用最小失真原理,分别计算用量化矢量 Yi替代 X所带来的失真 其中 最小失真值所对应的那个量化矢量,就是矢量 X的 重构矢量 (或恢复矢量) 注:根据香农信息论,矢量越长越好。
实际中码书是不完备的, 即矢量数是有限的,而对于任何一个实际应用来说,矢量通常 是无限的 在实际运用中,输入矢量和码书中码字不匹配的情况下,这种 失真是允许的 存在的问题 ( 1) 如何划分 M个区域边界 将大量欲处理的信号的矢量进行统计划分,进一步确定这些划 分边界的中心矢量值来得到码书 ( 2) 如何确定两矢量在进行比较时的测度 这个测度就是两矢量间的距离,或以其中某一矢量为基准时的 失真度它描述了当输入矢量用码书所对应的矢量来表征时所 付出的代价 图 3-2 矢量量化系统的组成 编码端 恢复时 特点: 传输存储的不是矢量本身而是其序号,所以据有高保密性能 收发两端没有反馈回路,因此比较稳定 矢量量化器的关键是编码器的设计,译码器只是简单的的查表过程 矢量量化的性能指标除了码书的大小 M以外还有由于量化而产生的平均信噪比 矢量量化的准则 :在给定码本大小 K时使量化所造成的失真最小 矢量量化的设计 :从大量信号样本中训练出好的码书,从实际效果出发寻找最好的失真测度定义公式,设计出最佳的矢量量化系统,以便用最少的搜索和计算失真的计算量,来实现最大可能的平均信噪比。
前面我们讲过设计矢量量化器的关键是编码器的设计而在编码的过程中,就需要引入失真测度的概念 失真测度(距离测度): 是将输入矢量 Xi用码本重构矢量 Yi来表征时所产生的误差或失真的度量方法,它可以描述两个或多个模型矢量间的相似程度 失真测度选择的好坏直接影响到聚类效果和量化精度,从而影响到语音信号矢量量化处理系统的性能 失真度选择必须具备的特性 必须在主观评价上有意义,即小的失真应该对应于好的主观语音质量; 必须是易于处理的,即在数学上易于实现,这样可以用于实际的矢量量化器的设计; 平均失真存在并且可以计算; 易于硬件实现 失真测度主要有均方误差失真测度(即欧氏距离,满足对称性 +正值性)、加权的均方误差失真测度、板仓-斋藤( Itakura- Saito)距离,似然比失真测度等,还有人提出的所谓的“主观的”失真测度 一、欧氏距离-均方误差 设输入信号的某个 K维矢量 X,与码书中某个 K维矢量 Y进行比较, xi,yi分别表示 X和 Y中的各元素 ,则定义均方误差为欧氏距离: KYXYXyxKYXdTKiii)()()(1),(122 )1( Ki 几种其他常用的欧氏距离: 1.r方平均误差 Kiriir yxKYXd11),(2. r平均误差 111( , ) K rrr i iid X Y x yK 3.绝对值平均误差 111( , ) Kiiid X Y x yK4.最大平均误差 11111( , ) l i m [ ( , ) ] l i m m a xK rrrM r i i i irr iKid X Y d X Y x y x yK 优点在于:计算简单、硬件容易实现 5.加权欧式距离测度 211( , ) () )(Kiiiid X Y x yK 3.1.3线性预测失真测度 用全极模型表示的线性预测方法,广泛应用于语音信号处理中。
它在分析时得到的是模型的预测系数 .仅由预测系数的差值,不能完全表征这两个语音信息的差别应该直接由这些系数所描述的信号模型的功率谱来进行比较 222( ) ( )()pjjf X eAe 当预测器的阶数 ,信号与模型完全匹配时,信号功率谱为: p信号的功率谱 预测误差能量 预测逆滤波器的频率响应 222)()()( jpjeAeXf2( , ) l n 1TpISa R ad f f 相应的,设码书中某重构矢量的功率谱为 则定义 I-S距离为 piaaT irirrrRaa1)()(2)0()0( 这种 失真测度 是针对线性预测模型、用最大似然准则推导出来,所以特别适用于 LPC参数,描述语音信号的情况,常用于 LPC编码中我们由此又推导出两种线性预测色失真测度,他们比上述具有更好的性能,即 22( , ) l n l nTpLLR Tpa R ad f fa R a ① 对比似然比失真测度 ② 模型失真测度 22( , ) 1 1Tpm Tpa R ad f fa R a 注:这两种失真测度都仅仅比较两矢量的功率谱,而没有考虑其他能量信息。
3.1.4 识别失真测度 失真测度的定义 )(),(),( EEgffdEfd LLR 加权因子 输入信号矢量的归一化能量 码书重构矢量的归一化能量 )()()(0)(FFddxxxxxxxxxxg当两矢量的能量接近时(即 ),忽略能量差异引起的影响;当两矢量能量相差很大时,即进行线性加权;而当能量差超过门限 时,则为固定值 dxEE Fx3.1.5 矢量量化器最佳码本设计 矢量量化器最佳设计的两个条件? 目的:最佳设计就是使失真最小 最佳设计中,重要的问题是如何划分量化区间和确定量化矢量这两个条件回答了两个问题 ( 1)最佳划分 ( 2)最佳码书 为实现失真最小这一目的,应该遵循以下两条原则 1) 最近邻准则 NNR 2) 质心条件 ( , ) m in ( , )ljjd X Y d X Y1 ,llXSlY X lN : ( )llS X Q X Y是 中包含的矢量个数 lS 基于 最近邻准则 和 质心条件,可以设计出一种码本设计的递推算法 —— LBG算法 1980年提出,它是标量量化器中 Lloyd算法的推广,在矢量量化中是一个基本算法。
LBG算法由于其理论上的严密性、应用上的简便性以及较好的设计效果,得到了广泛的应用,并常被作为各种改进算法的基础 LBG算法步骤 第一步: 初始化 给出训练 VQ码书所需的全部参考矢量 X, X的集合用 S表示;设定量化级数,失真控制门限 ,算法最大迭代次数L以及初始码书 ;设总失真 ;迭代次数的初始化为 m= 1 },,,{ )0()0(2)0(1 NYYY )0(D第二步:迭代 2)计算失真: 1)根据最近邻准则将 S分成 J个子集 , 即当 时,下式成立: ( ) ( ) ( )12, , ,m m mJS S S)(1mSX ( 1 ) ( 1 )( , ( , ) , ,mmlid X Y d X Y i i l ()( ) ( 1 )1,mlJmmll XSD d X Y 4)计算相对失真改进量 : 3)计算新码字 。

卡西欧5800p使用说明书资料.ppt
锂金属电池界面稳定化-全面剖析.docx
SG3525斩控式单相交流调压电路设计要点.doc
话剧《枕头人》剧本.docx
重视家风建设全面从严治党治家应成为领导干部必修课PPT模板.pptx
黄渤海区拖网渔具综合调查分析.docx
2024年一级造价工程师考试《建设工程技术与计量(交通运输工程)-公路篇》真题及答案.docx
【课件】Unit+3+Reading+and+Thinking公开课课件人教版(2019)必修第一册.pptx
嵌入式软件开发流程566841551.doc
生命密码PPT课件.ppt
爱与责任-师德之魂.ppt
制冷空调装置自动控制技术讲义.ppt


