
第3章语音信号的模型电子教案.ppt
41页第第3 3章语音信号的模型章语音信号的模型3.2语音信号的无损声管模型 3.1 声在声管中的传播特性 3.4无损声管模型的传输函数3.3级联无损声管与数字滤波器的关系3.5语音信号的数字模型3.6语音信号的共振峰模型3.7语音信号的非线性模型(略)第3章语音信号的模型语音模型化,便于数字处理对对模型的要求:精确描述语音产生过程、尽可能地简单, 便于处理和实现 已提出许多种不同的语音信号模型线线性模型:广泛使用级联级联 无损损声管模型和共振峰模型理论论基础础:发音过程中声道处于运动状态,这种运动与语音信号相比变变化缓缓慢,故可用时变时变 的线线性系统统来模拟拟更精细分析时,发现语音中也存在较大的非线性现象, 某些应用需考虑这些因素对所研究问题的影响非线线性模型:有多种,调频调频 -调调幅模型受到广泛关注 本章讨论讨论 :级联级联 无损损声管模型、共振峰模型、调频调频 -调调幅模型第2章数字语音处理基础 第3章语音信号的模型3.1 声在声管中的传播特性 物理学的定律是描述声道中声音的产产生和传传播的基础 包括:质质量守恒、动动量守恒、能量守恒的基本定律, 热热力学、流体力学的定律等空气是一种流体,也是声音赖以传播的介质。
应用物理原理,可得描述发音系统中空气运动偏微分方程组组精确的方程表达和求解都是极端困难难的,需简简化假设设条件因周密的声学理论论必须考虑以下各种影响: (1)声道形状的时变时变 性质质;(2)声道壁的热传导热传导 和粘滞摩擦损损耗; (3)声音在嘴唇处的辐辐射;(4)声道壁的柔度; (5)鼻腔的耦合; (6)声道中的激励目前,没有全面考虑各因素影响的声学理论,应用中对这些因素给出适当的说明或者给出定性的讨论 第2章数字语音处理基础 3.1 声在声管中的传播特性 给定声管的边界条件和面积函数后,可求得方程组的闭闭式解 解的表达式非常复杂杂,但可以采用数值值解应用中,某一特定时刻,面积积函数可看成不随时间变时间变 化可借助于各种合理的近似和简简化来使方程的求解成为可能 并由此得到语语音信号的模型(后续讨论该问题)声管中声传传播特性与传输线中电电流传传播特性有很强的类类比关系表3.1:声学量与电电学量之间的类类比关系 第2章数字语音处理基础 3.1 声在声管中的传播特性 表3.1声学量与电电学量之间间物理量的类类比声学量电电学量声学量电电学量压压力 p电压电压 v特性声阻抗 Z0= c/A特性电电阻抗 Z0体积积速度 u电电流 i声激励角频频率电电激励角频频率声感 /A电电感 L单单位长长度声阻抗粹Z=j/A复阻抗 Z声容A/(c2)电电容 C单单位长长度声导纳导纳 Y=jA /(c2)复导纳导纳 Y第3章语音信号的模型3.2语音信号的无损声管模型 无损损声管模型(行波型模型):由多个不同截面积积的无损损耗 管子串联而成的系统。
是最简单的声道模型图图3.2:10级的无损损声管级联级联 模型语音信号的某一“短时时”期间,声道可表示为形状稳稳定的管道该“短时”期间,管截面 A 是常数偏微分方程以写成:若第 m 段管子处,A(x,t)=Am,u(x,t)=um, p(x,t)=pm,上式可以写成 第2章数字语音处理基础 3.2语音信号的无损声管模型 图3.210级无损声管级联声门 嘴唇A1l1A2 l2A3l3A4l4A5l5A6l6A7l7A8l8A9l9A10l10解偏微分方程组,得: 式中, lm第 m 节声管的长长度; 和 第 m 节声管中的正向行波和反向行波在两个不同截面积的声管联接处,行波表达如图图3.3连续连续 条件:第 m 和 m+1 节声管 联接处的声压压和体积积速度连续连续 设第m节声管左端点为坐标0点, 右端点为lm ,则有 第2章数字语音处理基础 3.2语音信号的无损声管模型 图3.3两个无损声管之间的节点lmAmlm+1Am+1结合两式,可进一步求解,见下页重要表达式,后续求解要用到!令声波通过长为 lm 的第 m 节声管需要的时间时间 为 , 由上页两式,得:解得: 式中km第m节节点的反射系数; km是 在节点处 反射回波 的倍数。
图图3.4:两级声管的流图图 第2章数字语音处理基础 3.2语音信号的无损声管模型 图3.4两个无损声管节点信号流图点 1+ km-km km 1kmmm+1mm+13.2.1嘴唇端N 段无损损声管,声门门处为第一段,嘴唇处为第 N 段声学理论论:嘴唇处的声压压和体积积速度间存在正弦稳态稳态 关系,即 式中,ZL嘴唇处的辐辐射阻抗,或辐辐射负载负载 假定ZL()=ZL是实数,令N=LN/c,联立上式和8页偏微分方程 组的解,得: 即: 式中,kL嘴唇处的反射系数, 嘴唇处的体积积速度为:图图3.5:级联无损声管在嘴唇处处的流图图 第2章数字语音处理基础 3.2语音信号的无损声管模型 该式与电学的欧姆定律相对应(声压压对应电压电压 ,体积积速度对应电电流)图3.5级联无损声管在嘴唇处的流图1+ kLkL NN3.2.2声门端声门可以看成是控制送入声道气流的阻碍电电模拟拟:声门处存在一个内阻抗(感性阻抗), 阻抗值值为声门处声压压与气流体积积速度之比, 即:ZG=RG+j LG, RG和LG是常数图图3.6:声门端的电电模拟图拟图 由图得: 式中,U1(0,) 声门处的体积积速度u1(0,t)的Laplace变换; P1(0,) 声门处的声压压p1(0,t)的Laplace变换; UG () 等效体积积速度源uG(t)的Laplace变换。
第2章数字语音处理基础 3.2语音信号的无损声管模型 图3.6声门对应等效电路图 I1 ZG IG U1如果ZG是实数,令m=1, x=0, 则由上页式和 8 页偏微分方程组组的解,有: 解得: 式中 kG声门处的反射系数,图图3.7:声门门端级联无损声管的流图图第2章数字语音处理基础 3.2语音信号的无损声管模型 图3.7级联无损声管在声门处的流图kG11将两级级声管级联级联 、声门门端和嘴唇端与声管级联级联 的结果合成, 可以画出基于声管理论的整个流图图图图3.8:无损损声管模型图图 图3.8是无损损条件下的结果;若考虑空气与管壁间间的摩擦、穿过过管壁的热传导热传导 以及管壁振动动等损耗,也可以解出前述方程式(结果复杂,不再赘述) 管壁振动的影响最大,使低频端谐谐振频频率提高; 其它两种损耗的影响较少;两者的净影响只是使低端的 谐谐振频频率比刚性无损声管壁模型的情况稍有上移图3.8无损声管模型图1122 1+ k1k1 k1 1k1 1+ kN-1kN-1 kN-1 1kN-1 1+ kLkL第2章数字语音处理基础 3.2语音信号的无损声管模型 例:图3.9的两级级无损损声管的流图, 在嘴唇处的体积积速度为 uL(t) = uL(lL,t) , 系统的频频率响应应为 令 s=j ,代入上式得该系统的系统统函数为:第2章数字语音处理基础 3.2语音信号的无损声管模型 图3.9两级无损声管流图 1+ k1k1 k1 1k1 1+ kLkL1212第3章语音信号的模型3.3级联无损声管与数字滤波器的关系 工程上常将声道用 10 级级等长长无损损声管的级联级联 模型来表征。
每节节声管长长度均为x,x =c=l/N l 10 级声管总长总长 度, 一节声管中声传传播时间时间 声门处加单单位冲激序列uG=(t),冲激沿声管传播, 在节点处,一部分被反射,另一部分继续传继续传 播分析传传播过过程: (1) 声波无反射,直接到达嘴唇的幅度叠加为0,时时延为N, 则嘴唇处的单单位冲激为:0(t -N) ; (2) 一次反射的冲激到达嘴唇处多延迟2,幅度叠加为1, 则嘴唇处的单单位冲激为:1(t -N -2) ; (3) 某一节两次反射,或某两节各一次反射,延迟迟为22, 幅度叠加为2,则嘴唇处的单单位冲激为:2(t -N -22) 第2章数字语音处理基础 3.3级联无损声管与数字滤波器的关系依此分析,无损声管级联系统的冲激响应应及Laplace变换变换 为: 式中,e-Ns传播 N 段管子所需的延迟时间迟时间 , 如果设: 其频频率响应应为:于是:由上式看出,若系统输入是频带频带 有限信号,即/T , 且取样周期T=2 ,则上述系统统和下面的离散系统统等效: 式中,n 0,zk 1 即:离散时时域模型的极点必在单单位圆圆内,由稳定性所要求第2章数字语音处理基础 3.5语音信号的数字模型图3.15声道谐振在s和z平面的表示图 j /T 2Fkk 0 2Fk /T s 平面 |zk| k Rez 平面图3.17全极点V(z)的级联式实现G1z-1z-1G2z-1z-1GMz-1z-1利用数字滤滤波器的各种实现方法可以实现声道的时变滤时变滤 波器。
时变时变 数字滤滤波器的系数是随时间缓变时间缓变 ,10 20 ms内不变 例:用直接形式来实现,如图图3.16也可以用二阶阶系统统的级联级联 来实现 V(z),即: ,其中, 式中,M 为 (N+1)/2的整数部分图图3.17:上式的实现级联级联 流图图(特点是硬件可时分复用,对参数变化较 敏感,没有并联形式好)第2章数字语音处理基础 3.5语音信号的数字模型图3.16 全极点V(z)直接式实现Gz-1a1z-1a2aN1z-1aN以上讨论了声道的数字模型, 下面分别讨论在嘴唇和声门处的数字模型嘴唇处处的数字模型:根据式 , 嘴唇处的声压压、体积积速度与辐辐射阻抗的关系式及 z 变换变换 为: 由于的实部随频率增高而增高,故上式是一种高通滤波运算, 可以证明嘴唇辐射的影响可表示为: 第2章数字语音处理基础 3.5语音信号的数字模型声门处门处 激励的数字模型:语音分成清音和浊浊音,清音由随机噪声激励产生 浊音由准周期脉冲串激励产生,其周期称为基音周期图图3.18:浊音情况下,激励信号的产生示意图冲激串发生器输出的单单位冲激序列(冲激间隔为基音周期)线性激励系统统函数为G(z),经幅度控制后输出为浊浊音激励。
G(z) 的反变换变换 g(n) 可以用Rosenberg函数近似表示: 式中,N1 斜三角波上升部分的时间,约占基音周期的50; N2 斜三角波下降部分的时间,约占基音周期的35第2章数字语音处理基础 3.5语音信号的数字模型图3.18浊音信号激励的产生基音周期增益控制Av冲激串发生器G(z)斜三角波的占时时比例关系与声带开启面积的与时间关系对应图图3.19:单斜三角波波形及频谱频谱 是低通滤滤波器 其 z 变换变换 的全极点(二极点)模型: 式中,C 是一个常数斜三角波串可看成加权单权单 位脉冲 激励单单斜三角波模型的结果 Av是单单位脉冲串的幅度因子; 单单位脉冲串的z 变换变换 为: 完整的激励模型为:第2章数字语音处理基础 3.5语音信号的数字模型图3.19单个斜三角波及其频谱1.00.80.60.40.20 5 10 15 20 t/msg(n) 20 lg G(ej) 30 20 10 01020301 2 3 f /kHz清音情况下,发塞音或摩擦音,声道被阻形成湍流 激励可模拟成随机白噪声, 用均值值为0、方差为1,时间时间 或/和幅值值为白色分布的序列 图图3.20:考虑所有的激励因素,语语音产产生的数字模型。
特点:二元激励,浊音、清音激励交替进进行 声道可以用多种滤波器来模拟, 通常,把辐辐射和声道等因素全部结合,表示为全极点函数:第2章数字语音处理基础 3.5语音信号的数字模型图3.20语音产生的数学模型基音周期增益控制Avam, GPL(n)增益控制AN冲激串发生器G(z)白噪声发生器V(z)R(z)结论结论 : 优优点:该模型对大多数语音是一个好模型, 能合成出较满较满 意的语语音,是分析语音最重要的基础 缺点:二元激励模型有局限性 模型建立“短时时”平衡为前提,不完全符合实际实际 ; 理论上鼻音和擦音需有零点, 浊浊擦音不是简单的浊音。












