版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:杭州电子科技大学计算机应用技术研究所浙江杭州310018
出 版 物:《情报科学》 (Information Science)
年 卷 期:2011年第29卷第11期
页 面:1621-1624页
核心收录:
学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 120502[管理学-情报学]
主 题:共词分析 TF-IDF 共词矩阵 Bisecting K-means 主题
摘 要:文本主题检测可以很好的挖掘海量信息中的关键因子,本文主要通过基于共词分析方法对文本主题词进行聚类从而发现当前的主题,首先通过停用词过滤和TF-IDF关键词提取技术提取出主题词串,然后构建共词矩阵,最后通过Bisecting K-means算法对主题词串进行聚类分析,从而发现主题。实验结果表明,该方法对热点主题提取有一定的效果。