咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >标注内容与用户属性结合的标签聚类研究 收藏

标注内容与用户属性结合的标签聚类研究

Combined with Annotated Content and User Attributes for Tag Clustering

作     者:顾晓雪 章成志 Gu Xiaoxue;Zhang Chengzhi

作者机构:南京理工大学经济管理学院南京210094 江苏省数据工程与知识服务重点实验室(南京大学)南京210093 

出 版 物:《现代图书情报技术》 (New Technology of Library and Information Service)

年 卷 期:2015年第10期

页      面:30-39页

学科分类:1205[管理学-图书情报与档案管理] 12[管理学] 120501[管理学-图书馆学] 120502[管理学-情报学] 

基  金:国家社会科学基金重大项目"面向突发事件应急决策的快速响应情报体系研究"(项目编号:13&ZD174) 国家社会科学基金项目"在线社交网络中基于用户的知识组织模式研究"(项目编号:14BTQ033) 教育部人文社会科学基金规划项目"多语言高质量社会化标签生成及聚类研究"(项目编号:13YJA870020)的研究成果之一 

主  题:社会化特征 标注内容 标签聚类 

摘      要:【目的】研究标签聚类中标注内容与用户属性及其结合对聚类效果的影响。【方法】采用科学网博客数据,对其进行特征抽取、模型构建和相似度计算,利用线性函数和Sigmod函数进行相似度加权,并使用AP聚类算法进行标签聚类。【结果】在学科分类体系下,用户属性与标注内容的结合均对标签聚类的结果有所提升,Sigmod加权表现最优;在系统分类体系下,两者结合均不如标注内容结果表现优秀。【局限】选择的数据量较小,评估标签聚类的分类体系不够完善,AP聚类算法不适用于大数据的处理。【结论】两种特征的结合在部分情况下能够提高聚类效果,标签聚类中应更加关注标签的内容特征。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分