咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向语音情感识别的改进可辨别完全局部二值模式 收藏

面向语音情感识别的改进可辨别完全局部二值模式

Improved discriminative completed local binary pattern for speech emotion recognition

作     者:陶华伟 张昕然 梁瑞宇 查诚 赵力 王青云 TAO Huawei ZHANG Xinran LIANG Ruiyu ZHA Cheng ZHAO Li WANG Qingyun

作者机构:东南大学信息科学与工程学院东南大学水声信号处理教育部重点实验室南京210096 南京工程学院通信工程学院南京211167 

出 版 物:《声学学报》 (Acta Acustica)

年 卷 期:2016年第41卷第6期

页      面:905-912页

核心收录:

学科分类:0711[理学-系统科学] 07[理学] 

基  金:国家自然科学基金项目(61375028 61673108) 江苏省"六大人才高峰"项目(2016-DZXX-023) 江苏省博士后科研资助计划项目(1601011B) 江苏省"青蓝工程"项目资助 

主  题:语音情感识别 统计直方图 灰度图像 纹理图像 召回率 旋转不变性 模式集 人机交互 分类器 描述子 

摘      要:为了研究语音情感与语谱图特征间的关系,本文研究并提出一种面向语音情感识别的改进可辨别完全局部二值模式特征。首先,基于语谱图灰度图像,计算图像的完全局部二值符号模式(CLBP_S)、幅度模式(CLBP_M)的统计直方图。然后,将CLBP_S,CLBP_M统计直方图输入可区别特征学习模型中,训练得到全局显著性模式集合。最后,采用全局显著性模式集合对CLBP_S,CLBP_M直方图进行处理,将处理后的特征级联,得到面向语音情感识别的改进可辨别完全局部二值模式特征(IDisCLBP_SER)。基于柏林库、中文情感语音库的语音情感识别实验显示,IDisCLBP_SER特征召回率比纹理图像信息(TII)等特征提高了8%以上,比声学频谱特征平均提高了4%以上。而且,本文提出的特征可以和现有声学特征进行较好融合,融合后的特征召回率比现有声学特征召回率提高1%~4%。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分