近年来随着互联网的迅猛发展,所带来的问题也越来越明显了,其中最突出的问题便是“信息过载”问题。虽然分类目录、搜索引擎等技术能在一定程度上缓解该问题,但是大多数用户都不能明确知道自己所需要的是什么,也就难以利用这些技术进行搜索了。但是,个性化推荐不仅能根据用户的历史信息发现用户的兴趣偏好,还能在海量的数据之中分析出用户的潜在兴趣,因而备受瞩目。个性化推荐推荐系统在发展过程中,也遇到了越来越多的问题,如:数据稀疏性、冷启动、可扩展性等等。本文就数据稀疏性问题,首先采用了图网络算法在稀疏数据集上计算得出物品关联矩阵;接着就所得物品关联矩阵存在关联程度弱的问题引入了一个k维的物品类别向量矩阵,每个物品都是该类别向量上的一个概率分布,并且该类别向量矩阵通过在物品关联图上随机游走来更新自身,更新后的类别向量矩阵体现出更强的物品关联程度,从而计算物品间的相似度,进而对评分矩阵进行首次填充;最后引入用户集合分类、评分置信度等概念,对传统的基于物品的协同过滤算法进行相关的改进并对评分矩阵进行第二次填充。本文实验中以基于物品的协同过滤算法作为基准算法,在Movielens数据集上进行对比实验,结果表明,本文所提出的基于物品类别的协同过滤(Collaborative Filtering of Item Category,CFIC)算法和基于物品类别和置信度的协同过滤(Collaborative Filtering of Item Category and Confidence,CFICC)算法有着更好的推荐效果。
暂无评论