互联网的快速发展和普及,极大丰富和便利了人们的生活,也带来了很多新的问题和挑战:一方面,随着互联网产品多样性和系统结构复杂性增加,以及用户行为的多变性和数据类型的多样性等现象,传统的协同过滤推荐算法无论是在推荐速度还是推荐质量方面都很难满足用户的个性化推荐的需求;另一方面,互联网技术高速发展,出现了一大批以微博、微信为代表的社交平台和以淘宝、京东商城为代表的电子商务平台,产生了以用户为中心的海量数据。本文针对协同过滤算法中的数据稀疏性和时效性问题,从以下几个方面展开研究:(1)通过时间遗忘函数和用户偏置度对数据进行分析,解决协同过滤推荐中的用户兴趣漂移和数据稀疏性问题,提出一种基于时间函数和用户偏置度的协同过滤算法T-UBSM(Similarity calculation Method based on Time function and User Bias)。首先通过MCM指数函数将时间因素融入用户项目评分矩阵中,追踪用户兴趣随时间变化,以解决用户兴趣衰减和漂移的问题,并在此基础上,定义用户偏置度来改进相似度计算方法,最终建立一种新的相似性度量模型,解决由于数据稀疏性导致的相似度计算准确率低的问题。实验结果表明在推荐准确度、召回率和MAE(Mean Absolute Error)方面都得到优化,分别提高了3.4%、5.7%和7.8%,可见该算法可以缓解数据稀疏性和时间动态问题,提高推荐质量。(2)为了解决过度稀疏的评级矩阵导致矩阵分解中的过拟合问题,提出一种融合标签和时间信息的矩阵分解推荐模型TTMF(Matrix Factorization recommendation algorithm fusing Tags and Time information),以丰富单一数据源,缓解矩阵分解中的过拟合问题。首先通过评级数据和标签信息定义用户标签偏好值和项目标签关联度,分别表征用户对标签的兴趣、标签信息和项目之间的联系,并增加时间信息表示用户兴趣随时间的变化;然后,建立用户-项目、用户-标签和项目-标签矩阵模型,通过梯度下降法进行矩阵分解,完成推荐。实验结果表明,TTMF算法的RMSE(Root Mean Square Error)比传统方法LFM(Latent Factor Model)降低了7%,可见TTMF模型具有更高的推荐性能和推荐准确度。
暂无评论