版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:南京理工大学经济管理学院信息管理系南京210094 中国科学技术信息研究所北京100038
出 版 物:《情报学报》 (Journal of the China Society for Scientific and Technical Information)
年 卷 期:2009年第28卷第2期
页 面:225-232页
核心收录:
学科分类:0501[文学-中国语言文学] 05[文学] 08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 050101[文学-文艺学]
基 金:“十一五”国家科技支撑计划重点项目(2006BAH03B02) 南京理工大学青年科研扶持基金项目(JGQN0701) 南京理工大学科研启动基金项目(AB41123) 2006年江苏省研究生培养创新工程项目资助
摘 要:传统的聚类算法直接用于文本聚类这一应用上,存在的突出问题就是传统的聚类算法只负责将对象进行聚类,不负责对聚类后生成的类簇进行概念描述和解释。标注文本集合聚类后生成的类簇被称为聚类描述问题。聚类描述可以帮助用户迅速确认生成的文档类别与其需求是否相关,它是文本聚类应用中一项重要并富有挑战性的任务。针对文本聚类结果可读性较弱问题,本文提出了一种增强聚类结果的可理解性与可读性的算法,即基于支持向量机的文本聚类结果描述算法。实验结果表明基于支持向量机的聚类描述算法所取得的效果要优于常规的聚类结果描述方法。