版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:计算机信息系统安全评估河南省工程实验室郑州市计算机网络安全评估重点实验室郑州450007 安阳师范学院物理与电气工程学院河南安阳455002 中原工学院图书馆郑州450007
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2018年第44卷第12期
页 面:281-287页
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 08[工学] 081201[工学-计算机系统结构] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:XML细粒度表达 磁盘信息提取 文档文本信息提取 内存管理算法 并行搜索算法
摘 要:目前文本信息提取与检索无法适应复杂环境、受用户权限限制以及面临存储器容量大的问题。为此,通过对各种文档文本信息的特征分析,建立基于并行的深度文本信息分析系统。基于XML细粒度表达的不同类型文档提取文本信息,采用基于多核的并行技术根据关键词检索分析提取的文本信息,最后输出信息分析结果。实验结果表明,该系统能够细粒度地深入分析不同类型文本信息,在检索词数量较多时,可以快速提取完整信息。