版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201910682879.5
公 开 号:CN110598972B
发 明 人:麻吕斌 窦建 张海龙 卢继哲 郑国权 王伟峰 韩蕾
代 理 人:浙江翔隆专利事务所(普通合伙)王晓燕
代理机构:浙江翔隆专利事务所(普通合伙)
专利类型:发明专利
申 请 日:20230120
公 开 日:20190726
专利主分类号:G06Q10/06
关 键 词:自然语言处理 计量 研究方向 采集 技术发展趋势 统计语言模型 文献数据库 词性标注 分词处理 核心期刊 爬虫程序 趋势分析 人力查询 同一对象 文本内容 合并 传统的 动态图 停用词 词库 滤除 词汇 提炼 分析 绘制 阅读 智能 研究
摘 要:本发明公开了一种基于自然语言处理的计量采集研究方向趋势分析方法,涉及自然语言处理领域。目前,传统的人力查询、阅读和分析等,难以准确分析新技术发展趋势。本发明包括以下几个步骤:(1)设计爬虫程序,获取计量采集领域核心期刊论文;(2)采用统计语言模型,对所获取论文文本内容进行分词处理;(3)通过词性标注,滤除停用词;(4)结合TF‑IDF和TextRank方法,从候选词库中提取关键词;(5)判断关键词之间的相关性,对表达同一对象的不同词汇进行合并;(6)基于提取和合并结果,绘制相应研究热点的演变动态图。本技术方案能更好地适应现今日益庞大的文献数据库资源,并从中快速、智能地提炼出计量采集相关研究方向的研究热点。