第3章语音信号的模型.ppt
《第3章语音信号的模型.ppt》由会员分享,可在线阅读,更多相关《第3章语音信号的模型.ppt(41页珍藏版)》请在课桌文档上搜索。
1、第3章语音信号的模型语音模型化,便于数字处理。对模型的要求:精确描述语音产生过程、尽可能地简单,便于处理和实现。已提出许多种不同的语音信号模型。线性模型:广泛使用级联无损声管模型和共振峰模型。理论基础:发音过程中声道处于运动状态,这种运动与语音信号相比变化缓慢,故可用时变的线性系统来模拟。更精细分析时,发现语音中也存在较大的非线性现象,某些应用需考虑这些因素对所研究问题的影响。非线性模型:有多种,调频-调幅模型受到广泛关注。本章讨论:级联无损声管模型、共振峰模型、调频-调幅模型,第3章语音信号的模型3.1 声在声管中的传播特性 物理学的定律是描述声道中声音的产生和传播的基础。包括:质量守恒、动
2、量守恒、能量守恒的基本定律,热力学、流体力学的定律等。空气是一种流体,也是声音赖以传播的介质。应用物理原理,可得描述发音系统中空气运动偏微分方程组。精确的方程表达和求解都是极端困难的,需简化假设条件。因周密的声学理论必须考虑以下各种影响:(1)声道形状的时变性质;(2)声道壁的热传导和粘滞摩擦损耗;(3)声音在嘴唇处的辐射;(4)声道壁的柔度;(5)鼻腔的耦合;(6)声道中的激励。目前,没有全面考虑各因素影响的声学理论,应用中对这些因素给出适当的说明或者给出定性的讨论。,图3.1:语音产生过程的最简单的物理模型。假设:声道被看成是不均匀截面的声管;沿管轴传播的声波是平面波;在流体中或管壁上不存
3、在热传导和粘滞损耗。根据假设及守恒定律,Portnoff证明声波满足偏微分方程组:式中,p,u 为声管内 x 位置处 t 时刻的 声压和体积速度,p=p(x,t),u=u(x,t);A 为声管内 x 位置处 t 时刻的管的横截面面积,A=A(x,t);为声管内空气的密度;c为声的传播速度(空气中声速340m/s)。,给定声管的边界条件和面积函数后,可求得方程组的闭式解。解的表达式非常复杂,但可以采用数值解。应用中,某一特定时刻,面积函数可看成不随时间变化。可借助于各种合理的近似和简化来使方程的求解成为可能。并由此得到语音信号的模型(后续讨论该问题)。声管中声传播特性与传输线中电流传播特性有很强
4、的类比关系。表3.1:声学量与电学量之间的类比关系。,第3章语音信号的模型3.2语音信号的无损声管模型 无损声管模型(行波型模型):由多个不同截面积的无损耗 管子串联而成的系统。是最简单的声道模型。图3.2:10级的无损声管级联模型。语音信号的某一“短时”期间,声道可表示为形状稳定的管道。该“短时”期间,管截面 A 是常数。偏微分方程以写成:若第 m 段管子处,A(x,t)=Am,u(x,t)=um,p(x,t)=pm,上式可以写成,解偏微分方程组,得:式中,lm第 m 节声管的长度;和 第 m 节声管中的正向行波和反向行波。在两个不同截面积的声管联接处,行波表达如图3.3。连续条件:第 m
5、和 m+1 节声管 联接处的声压和体积速度连续。设第m节声管左端点为坐标0点,右端点为lm,则有,重要表达式,后续求解要用到!,令声波通过长为 lm 的第 m 节声管需要的时间为,由上页两式,得:解得:式中km第m节节点的反射系数;km是 在节点处 反射回波 的倍数。图3.4:两级声管的流图。,3.2.1嘴唇端N 段无损声管,声门处为第一段,嘴唇处为第 N 段。声学理论:嘴唇处的声压和体积速度间存在正弦稳态关系,即 式中,ZL嘴唇处的辐射阻抗,或辐射负载。假定ZL()=ZL是实数,令N=LN/c,联立上式和8页偏微分方程 组的解,得:即:式中,kL嘴唇处的反射系数,嘴唇处的体积速度为:图3.5
6、:级联无损声管在嘴唇处的流图。,该式与电学的欧姆定律相对应(声压对应电压,体积速度对应电流),3.2.2声门端声门可以看成是控制送入声道气流的阻碍。电模拟:声门处存在一个内阻抗(感性阻抗),阻抗值为声门处声压与气流体积速度之比,即:ZG=RG+j LG,RG和LG是常数。图3.6:声门端的电模拟图。由图得:式中,U1(0,)声门处的体积速度u1(0,t)的Laplace变换;P1(0,)声门处的声压p1(0,t)的Laplace变换;UG()等效体积速度源uG(t)的Laplace变换。,如果ZG是实数,令m=1,x=0,则由上页式和 8 页偏微分方程组的解,有:解得:式中 kG声门处的反射系
7、数,图3.7:声门端级联无损声管的流图。,将两级声管级联、声门端和嘴唇端与声管级联的结果合成,可以画出基于声管理论的整个流图。图3.8:无损声管模型图。图3.8是无损条件下的结果;若考虑空气与管壁间的摩擦、穿过管壁的热传导以及管壁振动等损耗,也可以解出前述方程式(结果复杂,不再赘述)。管壁振动的影响最大,使低频端谐振频率提高;其它两种损耗的影响较少;两者的净影响只是使低端的 谐振频率比刚性无损声管壁模型的情况稍有上移。,例:图3.9的两级无损声管的流图,在嘴唇处的体积速度为 uL(t)=uL(lL,t),系统的频率响应为 令 s=j,代入上式得该系统的系统函数为:,第3章语音信号的模型3.3级
8、联无损声管与数字滤波器的关系 工程上常将声道用 10 级等长无损声管的级联模型来表征。每节声管长度均为x,x=c=l/N l 10 级声管总长度,一节声管中声传播时间。声门处加单位冲激序列uG=(t),冲激沿声管传播,在节点处,一部分被反射,另一部分继续传播。分析传播过程:(1)声波无反射,直接到达嘴唇的幅度叠加为0,时延为N,则嘴唇处的单位冲激为:0(t-N);(2)一次反射的冲激到达嘴唇处多延迟2,幅度叠加为1,则嘴唇处的单位冲激为:1(t-N-2);(3)某一节两次反射,或某两节各一次反射,延迟为22,幅度叠加为2,则嘴唇处的单位冲激为:2(t-N-22)。,依此分析,无损声管级联系统的
9、冲激响应及Laplace变换为:式中,e-Ns传播 N 段管子所需的延迟时间,如果设:其频率响应为:于是:由上式看出,若系统输入是频带有限信号,即/T,且取样周期T=2,则上述系统和下面的离散系统等效:式中,n1,n 0,n 取正整数。,对式 作 z 变换:令 z=esT,s=j,T=2,则 与 等价,即:此时,n=m,即等长无损声管级联系统完全可以用一个取样间隔为2,系数为m的FIR滤波器非递归的方法实现(应取有限项),理论上证明声道可以用数字滤波器模拟。,延迟N 相当于N/T=N/2=N/2的取样,延迟 相当于位移/T=/2=1/2 个样本。图3.9两级无损声管节点信号流 图画成两级等长无
10、损声管流图(图3.10);每个延迟 用z-1/2代替,可得到 等效的离散系统流图(图3.11)。将图3.11中的4个z-1/2用z-1代替,输出端再乘以z就构成等效的 数字滤波器流图(图3.12)。,分析:每个节点处都需要计算图3.13(a)的流图。计算式为 计算量:4次乘法,3次加法。将上式改写为(流图为图3.13(b)):计算量:2次乘法,4次加法。将上式改写为(流图为图3.13(c)):计算量:1次乘法,3次加法。结论:改变算法结构,计算量不同。,第3章语音信号的模型3.4无损声管模型的传输函数推导无损声管模型的传输函数V(z):式中,UL(z)和UG(z)嘴唇处uL(n)和声门处uG(



- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语音 信号 模型

链接地址:https://www.desk33.com/p-740325.html