针对在生猪音频识别中单一特征参数无法充分地表征猪声信息的问题,提出了基于梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与伽马通倒谱系数(Gammatone Frequency Cepstral Coefficient,GF-CC)的生猪音频融合特征生成方法。...
详细信息
针对在生猪音频识别中单一特征参数无法充分地表征猪声信息的问题,提出了基于梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)与伽马通倒谱系数(Gammatone Frequency Cepstral Coefficient,GF-CC)的生猪音频融合特征生成方法。首先,以5种猪声为研究对象,利用功率谱减法和双门限端点检测法对猪声样本进行预处理。其次,提取MFCC、GFCC和它们的一阶差分参数,将MFCC+∆MFCC、GFCC+∆GFCC直接叠加得到高维的融合特征,为了降低高维特征的冗余度,利用增减分量法对其进行降维,最后将降维后的融合特征输入至Bi-LSTM网络模型进行分类识别。实验结果表明,相对于传统的单一特征MFCC、GFCC在识别率上分别提升了14.33%和18.63%,且在不同噪声环境下,融合特征具有比其他特征更好的鲁棒性和识别性能。
以5种猪声为研究对象,首先,用维纳滤波和端点检测对猪声进行预处理,获得有效语料;然后,提取梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)制作样本集,再构建基于BiLSTM的声学模型学习样本集;最后用训练好的模型对猪声MFCC序...
详细信息
以5种猪声为研究对象,首先,用维纳滤波和端点检测对猪声进行预处理,获得有效语料;然后,提取梅尔倒谱系数(Mel Frequency Cepstral Coefficient,MFCC)制作样本集,再构建基于BiLSTM的声学模型学习样本集;最后用训练好的模型对猪声MFCC序列进行分类,实现生猪音频识别。结果表明:(1)通过5折交叉试验验证,5组模型总体识别率均达到90%,最高组为92.52%;(2)用样本集外语料对最优组模型进行算法应用测试,模型对进食、咳嗽、发情、嚎叫和哼叫的样本识别率分别为88.35%、93.65%、90.38%、88.46%、92.63%,总体识别率为90.70%。
暂无评论