视频字幕检测与识别技术研究及系统实现-内蒙古大学图书馆

文献详情 >视频字幕检测与识别技术研究及系统实现收藏

视频字幕检测与识别技术研究及系统实现

作者单位：北京大学

学位级别：硕士

授予年度：2007年

学科分类：1305[艺术学-设计学（可授艺术学、工学学位）] 13[艺术学] 081104[工学-模式识别与智能系统] 08[工学] 0804[工学-仪器科学与技术] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程]

主题：字幕检测字幕识别 Gabor滤波器隐马尔可夫模型统计语言模型字幕图像处理

摘要：视频节目的字幕检测与识别是一个应用性很强的课题，构造高检测率、高识别率的检测识别系统是研究追求的目标。本文结合视频中字幕图像的特点探讨了相关问题。\n 在视频节目的字幕检测方面，提出了利用字幕时序信息粗定位，再利用字幕内外边缘模型精定位的字幕检测方法，充分利用了字幕图像多帧的特点。\n 在字幕图像的预处理方面，针对视频节目中字幕图像的背景变化丰富的特点，从实际应用出发，提出了一套快速有效的字幕图像预处理方法，消除了噪声和字幕背景复杂带来的影响。\n 在识别特征提取方面，借鉴前人对视觉原理及Gabor滤波器组的研究，探讨选取了符合字幕特点的Gabor滤波器组参数，通过适当的特征降维方法，提取出了区分能力较强的识别特征。\n 在字幕识别方面，借鉴目前较为成熟的印刷体字符识别技术，同时结合字幕识别问题的自身特点，对于隐马尔可夫模型应用于字幕识别进行了深入的探讨，同时结合统计语言模型进行字幕识别，极大地提高了识别率。通过实验充分证明了应用隐马尔可夫模型和统计语言模型进行字幕识别的优势和潜力。

本地馆藏 | 借阅须知 | 我要预约

已订购，未入库

sda

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

视频字幕检测与识别技术研究及系统实现

读者评论与其他读者分享你的观点

请选择收藏分类：

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

视频字幕检测与识别技术研究及系统实现

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：