版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:安徽大学计算智能与信号处理教育部重点实验室安徽合肥230601 安徽大学计算机科学与技术学院安徽合肥230601 合肥工业大学计算机与信息学院安徽合肥230601 School of Computing and InformaticsUniversity of Louisiana at Lafayette
出 版 物:《电子学报》 (Acta Electronica Sinica)
年 卷 期:2019年第47卷第5期
页 面:1121-1128页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划(No.2016YFB1000901) 国家自然科学基金(No.61202227) 安徽高校自然科学研究项目(No.KJ2018A0013)
摘 要:本文提出了有监督的关键词抽取算法——KEING(Keyphrase Extraction using sequentIal patterns with oNe-off and General gaps condition)算法.首先,将每篇文档作为一个序列库,利用SPING(Sequential Patterns mIning with oNe-off and General gaps condition)算法获取词语之间的关系及其多种变化形式,并利用统计模式特征的方式描述候选关键词;然后,通过朴素贝叶斯分类算法对大量带标记的训练数据进行训练,构造分类器;最后利用分类器从测试文档中识别出关键词.通过实验验证了SPING算法的完备性以及KEING算法的有效性.