版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201110096820.1
公 开 号:CN102184383A
代 理 人:韩末洙
代理机构:23109 哈尔滨市松花江专利商标事务所
专利类型:发明申请
申 请 日:20110914
公 开 日:20110418
专利主分类号:G06K9/00(20060101)
关 键 词:理想图像 图像 印刷体字符 自动生成方法 格式文档 文档模板 样本字符 字符图像 字符位置信息 采集方法 分割精度 射影变换 图像配准 图像样本 样本采集 映射关系 纸质文档 校验 定位区 映射 语种 照相 抽取 打印 样本 变换 扫描 转换
摘 要:一种印刷体字符图像样本的自动生成方法,它涉及字符图像样本的自动生成方法。本发明解决了现有的字符采集方法分割精度低,需人工校验,从而造成样本采集速度慢的技术问题。本发明:将印刷体字符处理成样本字符,设计带有定位区的文档模板,将样本字符输到文档模板的字符区,转换为PDF格式后打印纸质文档,再扫描或照相后,得到实际图像;将PDF格式文档变换为图像,得到理想图像;再从PDF格式文档中抽取字符的位置信息,得到理想图像的字符基准;将理想图像与实际图像配准,建立两幅图像的映射关系,根据射影变换模型将理想图像的字符位置信息映射到实际图像中,将字符图像提取出来,编码保存。本发明适于任何语种的印刷体字符图像。