版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202010084144.5
公 开 号:CN111209412B
发 明 人:吕强 段飞虎 蔡陨 谢一鸣 胡磊 冯自强 张宏伟
代 理 人:王泽云
代理机构:北京天奇智新知识产权代理有限公司
专利类型:发明专利
申 请 日:20230512
公 开 日:20200210
专利主分类号:G06F16/36
关 键 词:语料 词表 图谱 抽取 关系抽取 实体关系 属性抽取 文献知识 迭代 消歧 期刊 概念模型设计 定时更新 概念设计 关系属性 技术结合 实体识别 数据属性 图谱构建 循环迭代 循环更新 训练模型 主题词表 主题词典 文本库 语句库 语料库 校准 更新 构建 标注 审核 学习 引入 管理
摘 要:本发明公开了一种循环更新迭代的期刊文献知识图谱构建方法,包括概念模型设计,定义期刊文献知识图谱的本体结构,包括定义本体、本体的关系属性和本体内部的数据属性;管理词表和语料,词表分为主题词表和关系词表,语料库分为文本库和语句库并涉及多个来源的语料;基于深度学习的标注、训练、识别、校准实体关系抽取模型,采用深度学习实体关系抽取技术结合词典和语料,进行实体抽取和关系抽取,并更新迭代;通过概念设计定义的本体结构并引入模板进行语料属性抽取;对实体识别和关系抽取的结果进行审核和消歧,对于属性抽取的结果进行实体消歧;识别结果存入知识图谱,并不定时更新主题词典、关系词典和训练模型,以新的词典和模型再对语料进行识别达到循环迭代更新构建知识图谱。