版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:山西大学计算机与信息技术学院太原030006 山西大学计算机与信息技术学院计算智能与中文信息处理教育部重点实验室太原030006
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2013年第49卷第2期
页 面:188-193页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(No.61175067 No.60970014 No.61272095) 山西省自然科学基金(No.2010011021-1) 山西省科技攻关项目(No.20110321027-02)
主 题:文本主题聚类 名词特征 短语特征 语义角色特征 相容关系
摘 要:特征是一切观点挖掘和情感分析任务的关键所在。对于无监督的文本聚类任务,文本特征的优劣直接影响聚类效果。考察三种语义特征(名词、名词短语、语义角色)对主题聚类的作用以及不同特征之间的相容关系,提出一种消除冗余特征的方法。该方法能有效地去除冗余特征,提高聚类精度。同时还提出一种基于语义角色标注的直接定位有效词特征的聚类方法,实验表明该方法是直接的和有效的,并为特征选择方法提供了新思路。