为了提高语音识别系统的鲁棒性,本文提出了一种特征参数规整的优化算法。整个算法由环境选择、MFCC差分扩展、均值方差规整(Mean and Variance Normal ization,MVN) 和RRMA滤波器平滑四个模块组成。首先我们对扩展和平滑这两个模块进行...
详细信息
为了提高语音识别系统的鲁棒性,本文提出了一种特征参数规整的优化算法。整个算法由环境选择、MFCC差分扩展、均值方差规整(Mean and Variance Normal ization,MVN) 和RRMA滤波器平滑四个模块组成。首先我们对扩展和平滑这两个模块进行了一系列的优化,然后再加入环境选择的思想进一步提高了性能。在Aurora2数据库上总识别率的相对提升达到了53.23%,要明显优于传统的各种参数规整方法, 并且和ETSI AFE标准前端的性能基本持平。
在噪声鲁棒语音识别研究中,并行模型结合(parallel model combination,PMC)方法因其能够满足非平稳噪声环境且理论上使模型接近背景环境匹配模型而成为语音识别噪声鲁棒性研究的重要方法之一。在PMC方法中,若使用标准MFCC特征在处理...
详细信息
在噪声鲁棒语音识别研究中,并行模型结合(parallel model combination,PMC)方法因其能够满足非平稳噪声环境且理论上使模型接近背景环境匹配模型而成为语音识别噪声鲁棒性研究的重要方法之一。在PMC方法中,若使用标准MFCC特征在处理高阶动态特征参数时会带来额外维数扩展和计算复杂的问题,使得方法的实现极其困难。本文提出了利用前后向差分动态特征取代传统的一阶、二阶差分动态参数的特征构造方法MFCCwDwD大大降低了运算复杂度。实验表明,该特征构造方法在PMC的噪声语音识别中取得了较好的结果。
暂无评论