咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于机器学习的文本聚类描述算法研究 收藏

基于机器学习的文本聚类描述算法研究

Document Clustering Description Algorithm Based on Machine Learning

作     者:章成志 Zhang Chengzhi

作者机构:南京理工大学经济管理学院信息管理系南京210094 中国科学技术信息研究所北京100038 

出 版 物:《情报学报》 (Journal of the China Society for Scientific and Technical Information)

年 卷 期:2009年第28卷第2期

页      面:225-232页

核心收录:

学科分类:0501[文学-中国语言文学] 05[文学] 08[工学] 080203[工学-机械设计及理论] 0802[工学-机械工程] 050101[文学-文艺学] 

基  金:“十一五”国家科技支撑计划重点项目(2006BAH03B02) 南京理工大学青年科研扶持基金项目(JGQN0701) 南京理工大学科研启动基金项目(AB41123) 2006年江苏省研究生培养创新工程项目资助 

主  题:聚类描述 文本聚类 支持向量机 机器学习 

摘      要:传统的聚类算法直接用于文本聚类这一应用上,存在的突出问题就是传统的聚类算法只负责将对象进行聚类,不负责对聚类后生成的类簇进行概念描述和解释。标注文本集合聚类后生成的类簇被称为聚类描述问题。聚类描述可以帮助用户迅速确认生成的文档类别与其需求是否相关,它是文本聚类应用中一项重要并富有挑战性的任务。针对文本聚类结果可读性较弱问题,本文提出了一种增强聚类结果的可理解性与可读性的算法,即基于支持向量机的文本聚类结果描述算法。实验结果表明基于支持向量机的聚类描述算法所取得的效果要优于常规的聚类结果描述方法。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分