咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >一种基于多源数据的知识融合方法 收藏
一种基于多源数据的知识融合方法

一种基于多源数据的知识融合方法

专利申请号:CN201810443980.0

公 开 号:CN108647318A

发 明 人:张日崇 马宏远 王玥 杜翠兰 李建欣 柳毅 胡春明 

代 理 人:尹振启

代理机构:11003 北京中创阳光知识产权代理有限责任公司

专利类型:发明申请

申 请 日:20181012

公 开 日:20180510

专利主分类号:G06F17/30(20060101)

关 键 词:数据源 分块 实体属性 知识库 计算复杂度 多源数据 候选匹配 候选实体 客观世界 实体数据 属性映射 数值单位 算法计算 同一实体 统一转换 知识融合 直接添加 规范化 对齐 相似度 等价 链接 聚合 匹配 合并 融合 

摘      要:本发明提出一种基于多源数据的知识融合方法,在融合多个来源的实体数据时,首先分别对每个数据源的属性进行规范化表示,其中包括了同义属性映射和对属性值的数值单位的统一转换,这样对属性的规范化处理可以减少对后续实体比较造成的影响;然后基于实体名和实体属性对实体进行分块聚合,这样仅将同一分块内不同来源的实体作为候选匹配实体对,避免了将两个数据源中所有的实体两两间比较,减少计算复杂度;最后将同一分块内不同来源的实体作为候选实体对,采用实体对齐算法计算实体间的相似度,将匹配得到不同来源中描述同一客观世界的实体对,建立不同数据源之间同一实体的等价链接,并进行实体属性的合并,而对于一个数据源中独有的实体,可以直接添加到知识库中。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分