版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201310419348.X
公 开 号:CN103488983B
代 理 人:陆飞;盛志范
代理机构:31200 上海正旦专利代理有限公司
专利类型:发明专利
申 请 日:20161026
公 开 日:20130913
专利主分类号:G06K9/20(20060101)
关 键 词:知识库 数据修正 结果输出模块 图像输入模块 数字形态学 信息结构化 预处理模块 单位机构 海量信息 名片识别 名片图像 倾斜校正 输出结果 图像处理 信息修正 剪切 纯数字 连通区 子图像 字符串 准确率 两级 加权 送入 名片 文本 图像 修正 改进 分析
摘 要:本发明属于名片识别技术领域,具体涉及一种基于知识库的名片OCR数据修正方法和系统。本发明的系统包括图像输入模块、预处理模块、OCR模块、数据修正模块、结果输出模块。本发明首先对输入名片图像进行包括倾斜校正、剪切、缩放在内的一系列图像处理,然后使用数字形态学处理技术、连通区分析技术从中提取出独立的字符串块作为子图像送入后续的OCR模块;接着,在对OCR的输出结果进行了信息结构化处理后,利用知识库的海量信息,以及文本+图像的两级修正方法、基于知识库IDF值加权的改进DTW方法等,实现对包括地址、单位机构名称以及纯数字在内的信息修正,从而在OCR的基础上,进一步提升识别准确率。