版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202211519223.X
公 开 号:CN115759011A
专利类型:发明专利
申 请 日:20230307
公 开 日:20221201
专利主分类号:G06F40/166
关 键 词:表格单元格 表格文字 数据存储 单元格 二维表 检测 单元格位置信息 数据存入数据库 表格结构识别 结构化数据 输出 表格处理 表格结构 表格信息 定位文件 工作效率 检测图像 检测系统 快速提取 数据输出 文字信息 学习算法 结构化 通用型 智能化 行列 办公 帮助
摘 要:本发明涉及一种端到端的通用型表格检测系统,用于帮助工作人员快速提取文件中的表格信息,提高工作效率。所述系统包括:表格定位、表格单元格检测、表格结构化识别、表格文字识别、结构化数据输出、数据存储。所述表格定位主要通过深度学习算法定位文件中表格的位置;所述表格单元格检测旨在检测图像中的表格单元格和单元格位置信息;所述表格结构识别旨在检测单元格间的行列关系;所述表格文字识别旨在使用OCR技术识别单元格内的文字信息;所述结构化输出旨在将上述几个步骤中识别到的数据输出成一个key‑value形式的可编辑二维表;所述数据存储旨在将二维表中的数据存入数据库;本发明适用于智能化办公或需要大量表格处理的领域。