版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者单位:云南大学
学位级别:硕士
导师姓名:李劲
授予年度:2019年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 070104[理学-应用数学] 0701[理学-数学]
摘 要:近年来,在网络信息技术的支撑下,以维基百科、Yago、Freebase等为代表的包含大量非结构化、异构数据的知识图谱得到了快速发展。然而,知识图谱数据具有体量大、内容丰富、类型多样、缺乏统一模式描述特点。因此,提取知识图谱模式信息,并形成摘要模式,对于提升知识检索、挖掘质量具有重要研究意义。现有的摘要模式挖掘方法得到的图谱模式存在以下问题:1)挖掘的效率低;2)用户很难控制算法的频繁度值,往往产生大量的频繁子图模式;3)不同模式之间往往相互交叠冗余。同时,已有的研究成果仍然存在部分上述问题。针对这些不足之处,本论文提出了新的摘要模式挖掘方法,将知识图谱的摘要模式挖掘建模为优化问题,并证明目标函数满足次模性,利用次模函数边际效益最大化的数学性质对Top-k摘要模式进行贪心近似求解。实验结果表明,本文提出的摘要模式挖掘方法在挖掘质量和挖掘效率上均优于已有的双目标函数模型方法。本文的研究工作和创新点归纳如下:层次化的摘要模式的定义。首先,本文使用图模拟匹配方法给出摘要模式的判定准则。其次,实际应用中,知识图谱的标签往往带有层次信息关系,本文基于摘要模式判定准则提出考虑节点标签层次化结构的摘要模式定义。最后,由于不同的模式对知识图谱的概括能力不同,给出摘要模式的质量度量方法。这些理论研究成果,为摘要模式挖掘问题的建模和求解奠定了坚实的理论基础。摘要模式挖掘建模及求解方法的研究。本文提出新的摘要模式挖掘方法,将摘要模式挖掘建模为次模函数优化问题,该目标函数不仅能够提升挖掘的摘要模式质量,而且在形式上更为简洁且无需定义参数。同时,基于摘要模式挖掘问题给出对应的贪心近似求解算法及加速算法。最终,在真实数据集中验证了该挖掘方法的有效性。