版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN201610186810.X
公 开 号:CN105808525B
发 明 人:刘春阳 赵志云 庞琳 张旭 李雄 王萌 陈新蕾 贾岩涛
代 理 人:席小东
代理机构:11337 北京市盛峰律师事务所
专利类型:授权发明
申 请 日:20180629
公 开 日:20160329
专利主分类号:G06F17/27(20060101)
关 键 词:领域概念 上下位关系 候选概念 抽取 领域概念集合 知识库 表征关系 概念聚类 关系抽取 特征抽取 训练数据 准确率 语料
摘 要:本发明提供一种基于相似概念对的领域概念上下位关系抽取方法,包括以下步骤:步骤1,领域概念集合由若干个领域概念组成;基于概念聚类的方法从领域概念集合中抽取相似的领域概念;步骤2,获得可能存在上下位关系的候选概念对,然后根据步骤1获取的相似概念产生相似候选概念对;步骤3,利用知识库获取部分训练数据,并通过相似候选概念对共同表征关系特征,实现基于多句特征的关系抽取,从而抽取到领域概念上下位关系。优点为:本发明可以突破语料规模的限制,利用多句特征抽取领域概念的上下位关系,可提升领域概念上下位关系抽取的准确率。