咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >视频字幕检测与识别技术研究及系统实现 收藏
视频字幕检测与识别技术研究及系统实现

视频字幕检测与识别技术研究及系统实现

作     者:王秉坤 

作者单位:北京大学 

学位级别:硕士

导师姓名:吴玺宏;迟惠生

授予年度:2007年

学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 13[艺术学] 081104[工学-模式识别与智能系统] 08[工学] 0804[工学-仪器科学与技术] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程] 

主      题:字幕检测 字幕识别 Gabor滤波器 隐马尔可夫模型 统计语言模型 字幕图像处理 

摘      要:视频节目的字幕检测与识别是一个应用性很强的课题,构造高检测率、高识别率的检测识别系统是研究追求的目标。本文结合视频中字幕图像的特点探讨了相关问题。\n 在视频节目的字幕检测方面,提出了利用字幕时序信息粗定位,再利用字幕内外边缘模型精定位的字幕检测方法,充分利用了字幕图像多帧的特点。\n 在字幕图像的预处理方面,针对视频节目中字幕图像的背景变化丰富的特点,从实际应用出发,提出了一套快速有效的字幕图像预处理方法,消除了噪声和字幕背景复杂带来的影响。\n 在识别特征提取方面,借鉴前人对视觉原理及Gabor滤波器组的研究,探讨选取了符合字幕特点的Gabor滤波器组参数,通过适当的特征降维方法,提取出了区分能力较强的识别特征。\n 在字幕识别方面,借鉴目前较为成熟的印刷体字符识别技术,同时结合字幕识别问题的自身特点,对于隐马尔可夫模型应用于字幕识别进行了深入的探讨,同时结合统计语言模型进行字幕识别,极大地提高了识别率。通过实验充分证明了应用隐马尔可夫模型和统计语言模型进行字幕识别的优势和潜力。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分