咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于区间半监督LDA的协同过滤推荐算法 收藏
基于区间半监督LDA的协同过滤推荐算法

基于区间半监督LDA的协同过滤推荐算法

作     者:钟杰 

作者单位:湘潭大学 

学位级别:硕士

导师姓名:程戈

授予年度:2019年

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

主      题:半监督学习 LDA主题模型 协同过滤推荐算法 

摘      要:协同过滤推荐算法是最常用的推荐算法之一,其利用大量相关数据对用户行为相似性进行分析并为用户提供个性化推荐。在大数据时代,大量的数据呈现在人们面前,而个性化推荐的实现需要挖掘数据中的隐含信息。LDA主题模型通常用于获取文档的主题分布信息,因此,许多学者尝试将LDA主题模型应用于协同过滤推荐算法之中,并且不断地进行探索优化。传统的LDA主题模型是无监督主题模型,在实际的文本挖掘应用中,整个数据集经常需要处理大量的主题,而用户实际上只对其中小部分主题感兴趣。在这种情况下,直接应用LDA模型存在明显的缺点。即LDA模型在处理大量主题的过程中,往往会生成很多的局部极大值;这使得模型可能会给出许多“垃圾主题,最终生成不稳定的结果。但是,在多数情况下数据集中相关主题存在的数量太少,所以需要使用大量的主题以无监督的方式来捕获它们。本文在LDA主题模型的基础上,固定相关主题关键词对应的主题区间,提出了区间半监督LDA主题模型。区间半监督LDA主题模型能有效规避在传统LDA主题模型构建过程中生成“垃圾主题的风险,提高了模型主题分布计算的准确率。已知协同过滤推荐算法可以利用LDA主题模型计算文档的主题分布,并在此基础上计算不同文档之间的相似度,从而得到个性化推荐的结果。因此,本文将区间半监督LDA主题模型应用于协同过滤推荐算法之中,有效地提高了算法推荐的准确率。本文使用今日头条的新闻数据对基于区间半监督LDA的协同过滤推荐算法进行验证。通过判断推荐文档与当前文档是否属于同一类别以及内容是否相关来计算模型推荐的准确率。实验结果表明,当用户对预定义主题领域感兴趣时,此模型能有效地提高用户推荐的准确率。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分