互联网和信息技术的迅速发展,使Web上信息量以指数级别迅速增长,巨大的信息源使人们面临着严峻的信息过载问题,因而出现了能够有效应对信息过载问题的推荐系统,并已应用于各个领域。推荐系统中最常使用的基于评分数据的协同过滤算法被广泛研究与应用,但数据稀疏性问题严重制约了该模型的推荐效果,另一方面其只考虑了用户对商品的评分信息,忽视了大量可以利用的包含了更加丰富且有价值的信息资源的用户评论信息,可以构造模型挖掘评论文本中的用户和商品特征,用于推荐系统。因此为了缓解评分矩阵的稀疏性,提高推荐质量,相继提出了基于多源异构数据(评论文本、社交网络等)的推荐模型,但往往不能充分挖掘用户和商品的高阶抽象特征,而深度学习技术在挖掘高阶特征方面表现良好。因此,针对上述问题,使用深度学习技术来处理评论文本信息并结合传统推荐算法,设计并实现一个混合推荐算法具有重要的意义。本文从用户-商品评论文本入手,结合卷积神经网络,通过分析同一用户对不同商品的评论内容以判断其用户偏好并加以量化,及不同用户对同一商品的评论内容以判断其商品属性并加以量化,得到用户和商品的深层非线性特征向量,并将这部分信息与传统的基于评分矩阵的隐语义模型得到的用户和商品的潜在隐向量融合,提出了基于评分矩阵和评论文本的混合推荐算法(Hybrid recommendation algorithm based on Rating matrix and Review text,HRA-MR),避免传统推荐方法存在的问题,改进推荐效果。本文首先介绍了推荐系统的研究背景及意义,以及推荐算法和深度学习算法在个性化推荐中应用的研究现状,然后介绍了本文所需要的基础理论与相关技术,其次介绍了本文提出的HRA-MR模型,在本模型中首先将评论数据分组,分别得到用户评论集和商品评论集,使用文本向量化技术,充分挖掘评论中上下文语义信息得到量化结果,输入一组并行的卷积神经网络,挖掘用户和商品特征;然后将得到的用户和商品特征与基于隐语义模型的用户和商品隐因子特征融合;最后设计一层耦合结构,将两组特征作为输入使用因子分解机和深度神经网络的组合模块预测出用户对商品的评分,得到推荐结果,最后总结结论,并提出对未来研究的展望。本文在5组公开数据集上进行实验,与多种经典的和当前先进的推荐算法进行性能对比,采用均方根误差(RMSE)和平均绝对误差(MAE)作为评估指标。实验结果表明,本文提出的算法在一定程度上提高了推荐的性能,且预测效果优于各独立算法,评分预测精度有不同程度的显著改进。
暂无评论