当前位置:文库下载 > 所有分类 > 工程科技 > 信息与通信 > MELP_CELP混合语音编码方法研究
免费下载此文档

MELP_CELP混合语音编码方法研究

语音编码

2008年第 1 期 声学与电子工程 总第 89 期

MELP/CELP混合语音编码方法研究

李建磊1 马 震2 陈延萍3

(1 山东师范大学管理学院,济南,250014;2 滨州学院计算机科学系,滨州,256600)

(3 山东移动滨州分公司,滨州,256600)

摘要 介绍了混合激励线性预测(MELP)的算法特点和采用的几种关键技术。在MELP基础上,针对MELP对周期性不强的语音帧(过渡帧、清音帧等)不能准确描述其激励形状,提出了采用MELP/CELP互补的混合编码方案,并在MELP中采用了相位对齐的方法。MATLAB仿真发现8 kb/s的这种混合编码器可以获得与32 kb/s编码速率的ADPCM相近的语音质量。

关键词 混合激励;码激励;对齐相位

越来越多的信息需要通过有限频带的信道进行传输,这就要求语音压缩编码技术除了具有较高的合成语音质量外,还要尽可能地降低编码速率。

MELP是Alan V McCree等人在原来LPC基础上,吸收了多带激励的思想提出的[1]。本文介绍了MELP中的关键技术,并且根据MELP的特点,提出了MELP和CELP相结合的编码方法,在这种方法中把语音分成强浊音、弱浊音和清音三种类型,对于强浊音使用MELP编码,对于清音和弱浊音使用CELP编码,并且提出了对齐相位的概念,可以有效的消除两种编码方式时间不同步而产生的转换噪音,最后对这种编码方法产生的语音进行了简单的评估。

1 MELP算法模型和关键技术

语音编码可分为参数编码和波形编码两个大类。波形编码在速率较高时可得到很好的合成语音质量, 但当码率降到16 kbit/s以下时, 其合成语音质量会急剧下降。而以线性预测模型为基础的参数编码方法则能很好的压缩语音的编码速率,下面介绍参数编码中比较常用的MELP模型。

鉴于LPC模型中存在的一些缺陷,MELP模型中有针对性的进行了改进。LPC中对语音的分类和激励过于简单的问题,MELP模型采用了周期脉冲和白噪声的混合激励;对于帧内基音周期的时变特性,把语音分为浊音、清音和抖动浊音,对于抖动浊音采用了非周期的脉冲激励;针对二元激励LPC忽略了激励信号的形状信息,在MELP中增加了激励信号的傅立叶谱的幅度。此外,MELP还加入了脉冲散布滤波器和自适应谱增强滤波器来提高语音质量,下面简介一下MELP中的几个关键的技术。 1.1混合脉冲和噪声激励

算法采用多带混合激励模型。语音被分为5个固定的频带0~500 Hz,500~1000 Hz,1000~2000 Hz,2000~3000 Hz,3000~4000 Hz,在每个子带上分别对语音进行浊音强度(Voice strength)的计算,依据其浊音强度和基音搜索的结果来判断该子带语音帧是清音、浊音还是抖动浊音。合成时,根据各子带的属性和浊音强度对通过该子带滤波器的噪声、周期脉冲和非周期脉冲进行加权求和作为激励。采用混合激励,可以减少合成语音中的蜂鸣声。 1.2非周期脉冲

混合脉冲和噪声激励可以消除 LPC 声码器的嗡嗡声,但是无法消除一些孤立的,短暂的音调,会产生一些类似电流声的单音噪声。这是由于在清/浊的过渡段声门脉冲不是很稳定,从而导致激励没有严格的周期性。在过去的LPC方法中,这些都是当作浊音来处理,从而会引进一些很奇怪又很刺耳的音调。在MELP中,针对这个问题,对基音周期进行抖动,抖动的幅度服从以基音幅度的±25%为上下限的均匀分布。这样就打破了激励信号的严格的周期性,很好的描述了在声门激励不稳定的时候产生的脉冲的特性。

但是这种抖动如果加在强浊音帧的激励中的话,就会破坏语音的周期性,也就是破坏了该帧激励的唯一的参数-基音周期,会使得语音质量急剧变坏。所以要准确的判断,是否可以加抖动,这可以通过计算语音帧的自相关和下面的多峰度来决定。

1N 12

∑e(n)Nn=0 N 11

∑e(n)Nn=0

peakness=

多峰度的大小描述了峰值是否明显。 1.3余量信号的傅立叶谱幅度

19

第1页

免费下载Word文档免费下载:MELP_CELP混合语音编码方法研究

(下载1-4页,共4页)

我要评论

返回顶部