文献详情 >基于视觉显著度的说话检测收藏

基于视觉显著度的说话检测

Visual Voice Activity Detection Based on Saliency Detection

作者：王瑾梁超王晓晨王中元胡瑞敏 WANG Jin;LIANG Chao;WANG Xiaochen;WANG Zhongyuan;HU Ruimin

作者机构：武汉大学计算机学院国家多媒体软件工程技术研究中心湖北武汉430072 武汉大学深圳研究院广东深圳518057

出版物：《武汉大学学报（理学版）》 (Journal of Wuhan University:Natural Science Edition)

年卷期：2015年第61卷第4期

页面：363-367页

核心收录：

学科分类：0711[理学-系统科学] 07[理学]

基　　金：国家自然科学基金重点项目(61231015 61303114) 国家高技术研究发展(863)计划(2013AA014602)资助项目教育部高校博士点基金新教师类项目(20130141120024) 湖北省自然科学基金面上项目(2014CFB712)

主　　题：显著度检测视觉说话检测图像能量隐马尔科夫模型支持向量机

摘要：现有基于视觉信息的说话检测方法中往往依赖预定参数或者阈值作为分类平面,鲁棒性差且泛化能力不强.针对这一问题,本文提出了一种基于显著度的视觉说话检测方法,利用像素的色彩信息和嘴唇的空间位置特性检测嘴唇,通过分析嘴唇运动和说话假设的关系,将图像能量作为特征,并结合经典的隐马尔科夫模型(hidden Markov models,HMM)和支持向量机(support vector machine,SVM)作为判决方法来进行检测.实验结果表明,本文提出的嘴唇检测方法正确率可达到92%.

本地馆藏 | 借阅须知 | 我要预约

已订购，未入库

sda

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

基于视觉显著度的说话检测

读者评论与其他读者分享你的观点

请选择收藏分类：

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

基于视觉显著度的说话检测

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：