随着互联网和信息技术的快速发展,逐渐增多的信息在日常信息查找过程中,给用户查找信息带来了很大的不便,这样现代信息的超载问题变的日益突出起来。因此,从复杂的信息数据中寻找对用户有用的信息并推荐给用户成为内容服务业内非常关注的课题,其中电影推荐是目前研究热点和难点。电影是大众喜爱的娱乐方式,电影观众和电影内容服务平台往往面临如何选择电影内容、如何向观众推荐电影的问题。本文据此,从电影服务内容平台角度,研究如何在海量电影资源中找到匹配用户兴趣的电影推荐问题。本文在对推荐问题相关研究进行综述的基础上,分析了现有协同过滤推荐算法的优势和局限性,提出了若干改进协同过滤算法的方法,主要研究内容包括:(1)针对协同过滤算法使用情景有限,在仅有浏览记录情况下无法推荐的问题,提出了一种基于CBR(Case Based Reasoning)的协同过滤算法,即通过在案例库中寻找与目标案例相似的案例,将相似案例的分值赋值给目标案例,实现目标案例的填分,最终实现推荐。最后使用电影推荐研究中广泛采用的Movielens数据集进行了仿真实验。实验结果表明改进的CBR协同过滤算法在有浏览记录无评分情况下仍可进行推荐,并且较使用其它算法推荐精度更高。(2)针对推荐精度问题,提出了融合用户信任度的推荐方法。通过将用户信任度融合到传统的协同过滤算法以提高推荐精度。与其它文献确定用户信任度的方法不同,该算法不再通过寻找出用户间全部路径以确定信任度,而是仅以用户间的最优信任路径作为确定信任度的依据,以提高推荐效率。基于数据集的实验结果表明:该方法可以有效提高协同过滤算法的推荐精度5%。(3)针对算法推荐效率不高的问题,采用一种改进的k-means算法对数据进行预处理,即在推荐前先将用户进行分组,从而减小了寻找相似用户的范围,提高推荐效率。对k-means算法改进之处在于可以自动选取k个初始点,避免聚类结果陷入局部最优解。实验结果表明该算法的推荐效率要高于传统的协同过滤算法,推荐速度提高八倍左右,而精度仅降低1.5%。
暂无评论