咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献
  • 1 篇 学位论文

馆藏范围

  • 2 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 2 篇 工学
    • 2 篇 计算机科学与技术...
    • 2 篇 软件工程

主题

  • 2 篇 文档分析与理解
  • 1 篇 符号识别
  • 1 篇 pdf文档
  • 1 篇 文档分析
  • 1 篇 页面分割
  • 1 篇 脚注
  • 1 篇 倾斜检测
  • 1 篇 表格识别
  • 1 篇 逻辑结构

机构

  • 1 篇 南京大学
  • 1 篇 北京大学

作者

  • 1 篇 li sida
  • 1 篇 黎斯达
  • 1 篇 王姝华
  • 1 篇 gao liangcai
  • 1 篇 汤帜
  • 1 篇 俞银燕
  • 1 篇 tang zhi
  • 1 篇 高良才
  • 1 篇 yu yinyan

语言

  • 2 篇 中文
检索条件"主题词=文档分析与理解"
2 条 记 录,以下是1-10 订阅
排序:
文档分析与理解中若干技术的研究
文档分析与理解中若干技术的研究
收藏 引用
作者: 王姝华 南京大学
学位级别:博士
该文对文档分析与理解这一具有重要理论意义和广阔应用前景的课题中的若干技术进行研究和探索.由于所处理的目标文档的复杂性,文档分析与理解技术所涉及的内容十分广泛.广义上的文档主要包括文本文档和图形文档两类,而表格是文本文档与... 详细信息
来源: 评论
PDF文档中的脚注识别研究
收藏 引用
北京大学学报(自然科学版) 2015年 第6期51卷 1017-1021页
作者: 黎斯达 高良才 汤帜 俞银燕 北京大学计算机科学技术研究所 北京100080
针对PDF文档的脚注识别问题,提出一种自动识别脚注及其引用,并建立它们之间匹配关系的方法。首先针对PDF文档提取脚注的一系列特征,包括页面布局、字体信息、语义信息等,然后基于文档部件风格一致性,利用聚类技术,处理在不同文档中相异... 详细信息
来源: 评论