随着互联网的发展,人们获取信息变得越来越容易,信息科技给人们的生活带来了极大的便利,但随着信息数据的增加,信息过载问题也越来越严重。面对海量的信息资源,用户该如何快速选择自己需要的信息,商家又该如何获取用户的需求为其推荐满意的商品成为当前研究的热点。个性化推荐就是针对该问题产生的,它通过对用户的历史行为信息进行分析,可以快速得出用户的需求与爱好,然后为用户推荐合适的商品与信息。其中,协同过滤算法在个性化推荐中使用的较为普遍。 协同过滤算法是通过用户相似度找到与目标用户兴趣最相似的用户,称为邻居,然后参考邻居的喜好来为目标用户进行推荐的。但是,随着数据规模的不断增大,该算法的不足之处也日益明显,如数据稀疏性、实时性、冷启动、扩展性等问题。本文针对数据稀疏性与冷启动这两个不足,提出了两种改进算法:结合用户聚类和项目类型的协同过滤算法(Collaborative Filtering Algorithm Combined with the User Clustering and Item Types,UCIT-CF)、融入专家信任的协同过滤改进算法(Collaborative Filtering Algorithm of Integration Expert Trust,IET-CF)。UCIT-CF算法以避免和填充的方式缓解数据稀疏性,即利用一种新的项目类型相似度计算法来寻找项目邻居,而不再依赖于用户评分;然后参考用户对相似项目的评分来预测该用户对未评分项目的评分,并填入原评分矩阵,以此达到缓解数据稀疏性的目的。同时,该算法在最后对填充后的矩阵进行操作时引入聚类技术,降低近邻查找空间和计算复杂度。 IET-CF 算法是在基于用户的协同过滤算法中引入专家信任,将专家意见和用户邻居意见相结合,共同为用户做出推荐。该算法首先对项目进行领域划分,考虑到项目之间可能存在关联性,本文采用k-means聚类法进行划分,而不是单纯地根据项目类型来划分领域;然后找出各个领域下的专家和相似用户;最后对两者意见进行综合考虑,再进行预测推荐,从而在一定程度上减小数据稀疏对推荐系统的影响,并改善新用户冷启动问题。 最后,本文对改进的算法分别进行实验仿真,并和传统的算法相比较。结果表明,本文提出的这两个算法均能降低数据稀疏带来的影响,进而提高预测评分的准确度与推荐质量。另外,IET-CF 还能对新用户做出推荐,缓解用户冷启动的问题。
暂无评论