咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于视觉显著度的说话检测 收藏

基于视觉显著度的说话检测

Visual Voice Activity Detection Based on Saliency Detection

作     者:王瑾 梁超 王晓晨 王中元 胡瑞敏 WANG Jin;LIANG Chao;WANG Xiaochen;WANG Zhongyuan;HU Ruimin

作者机构:武汉大学计算机学院国家多媒体软件工程技术研究中心湖北武汉430072 武汉大学深圳研究院广东深圳518057 

出 版 物:《武汉大学学报(理学版)》 (Journal of Wuhan University:Natural Science Edition)

年 卷 期:2015年第61卷第4期

页      面:363-367页

核心收录:

学科分类:0711[理学-系统科学] 07[理学] 

基  金:国家自然科学基金重点项目(61231015 61303114) 国家高技术研究发展(863)计划(2013AA014602)资助项目 教育部高校博士点基金新教师类项目(20130141120024) 湖北省自然科学基金面上项目(2014CFB712) 

主  题:显著度检测 视觉说话检测 图像能量 隐马尔科夫模型 支持向量机 

摘      要:现有基于视觉信息的说话检测方法中往往依赖预定参数或者阈值作为分类平面,鲁棒性差且泛化能力不强.针对这一问题,本文提出了一种基于显著度的视觉说话检测方法,利用像素的色彩信息和嘴唇的空间位置特性检测嘴唇,通过分析嘴唇运动和说话假设的关系,将图像能量作为特征,并结合经典的隐马尔科夫模型(hidden Markov models,HMM)和支持向量机(support vector machine,SVM)作为判决方法来进行检测.实验结果表明,本文提出的嘴唇检测方法正确率可达到92%.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分