版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201010206608.1
公 开 号:CN101866335A
代 理 人:刘文求
代理机构:44268 深圳市君胜知识产权代理事务所
专利类型:发明专利
申 请 日:20101020
公 开 日:20100614
专利主分类号:G06F17/24(20060101)
关 键 词:线段 文档 表格区域 逻辑关系 原文 预处理 编辑效果 表格处理 表格对象 表格识别 结构描述 文档转换 表象 排版 填充 转换
摘 要:本发明属于文档应用领域,公开了一种文档转换中的表格处理方法及装置,所述方法包括:从原文档中获取所有的线段,其中,所述线段包括有组成多边形的线段;对获取的线段进行表格识别预处理,确定各个表格区域;在划分出的各个表格区域内确定各个表格;在确定出的表格内填充原文档中对应的内容。本发明将PDF文档中由很多无逻辑关系的线段或多边形组成的表象为表格的对象,识别为能用逻辑关系的结构描述的表格对象,提高了转换出的文档的排版及编辑效果。