版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:中国科学院计算技术研究所智能信息处理重点实验室 中国科学院大学 南阳师范学院人工智能与软件工程学院
出 版 物:《软件学报》 (Journal of Software)
年 卷 期:2025年
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081203[工学-计算机应用技术] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划(2022YFC3302300) 国家科技重大专项(7090201050307) 国家242信息安全计划(2023A105)
主 题:事件常识知识图谱 大语言模型 微调技术 事件三元组 事件共享机制
摘 要:常识知识通常不在自然语言中明确表述,而是隐含在人类的认知中,为机器提供常识知识一直是人工智能领域的长期目标之一.前期,课题组成员手工构建了一个高精度的以事件为中心的中文种子常识知识图谱(ECKG),包含了26 606个常识事件三元组,覆盖了因果、时序、条件等多种常见的事件关系.尽管种子ECKG具有一定的价值,但规模较小,在实际应用中发挥的作用有限,且大规模的事件常识知识图谱在现有研究中较为稀缺.为了应对这些挑战,采用GPT系列的大语言模型来扩展种子ECKG中的因果、时序、条件和子事件这4种事件关系.扩展方法包括3个主要的步骤:首先,将种子ECKG中的事件结合4种关系定义设计了特定的事件知识提示(ek-prompt),并使用GPT-4-Turbo模型生成相应的事件三元组.其次,将种子ECKG的三元组与通过ek-prompt获取的正确三元组组合,以构建特定的数据集,并将GPT-3.5-Turbo模型在数据集上进行微调,以生成更多具体的事件三元组和验证新三元组准确性.最后,通过分析种子ECKG事件的相似性,并引入事件共享机制,将相同关系下的相似事件关联的事件互相共享,以保持相似事件的三元组一致性.经过实验评估,新获取的三元组具有高质量,尤其是时序关系的三元组准确率最高,达到了98.2%.所提扩展方法最终为种子ECKG增补了2 433 012个常识事件三元组,显著扩大了ECKG的规模,可以为人工智能领域的许多应用提供了更为丰富的常识知识资源.