版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:武汉大学计算机学院国家多媒体软件工程技术研究中心湖北武汉430072 武汉大学深圳研究院广东深圳518057
出 版 物:《武汉大学学报(理学版)》 (Journal of Wuhan University:Natural Science Edition)
年 卷 期:2015年第61卷第4期
页 面:363-367页
核心收录:
基 金:国家自然科学基金重点项目(61231015 61303114) 国家高技术研究发展(863)计划(2013AA014602)资助项目 教育部高校博士点基金新教师类项目(20130141120024) 湖北省自然科学基金面上项目(2014CFB712)
主 题:显著度检测 视觉说话检测 图像能量 隐马尔科夫模型 支持向量机
摘 要:现有基于视觉信息的说话检测方法中往往依赖预定参数或者阈值作为分类平面,鲁棒性差且泛化能力不强.针对这一问题,本文提出了一种基于显著度的视觉说话检测方法,利用像素的色彩信息和嘴唇的空间位置特性检测嘴唇,通过分析嘴唇运动和说话假设的关系,将图像能量作为特征,并结合经典的隐马尔科夫模型(hidden Markov models,HMM)和支持向量机(support vector machine,SVM)作为判决方法来进行检测.实验结果表明,本文提出的嘴唇检测方法正确率可达到92%.