随着公安信息化建设的发展,警务工作中收集了大量公共安全数据,而其中的新闻信息作为国家和公安机关了解社会动态和社会信息的重要窗口被高度重视。如何通过推荐算法从这些海量的新闻数据中准确地获取到需要的信息,为引导舆论方向和监控预警舆情时间提供支持,成为了比较热门的研究方向。推荐算法作为解决信息过载的有效方法也受到了众多的关注。当前,基于内容的推荐算法因其优秀的性能成为应用最广泛的推荐算法之一,而深度学习的引入更进一步提高了推荐的精度。但是,现有推荐算法的推荐结果容易受到数据稀疏性的影响,且融合深度学习网络的方法大多又只关注了文本内容的学习,对用户行为的分析关注较少。此外,实际场景中不断新加入的新闻信息还会造成推荐系统的项目冷启动问题,这对推荐精度也造成了一定的影响。对此,本文展开了如下研究。首先,针对现有推荐算法存在数据稀疏性的问题,通过引入Skip-gram网络,提出了一种基于行为嵌入的新闻推荐模型(News Recommendation Model based on Behavior Embedding,NRMBE)。在该模型中,对用户的浏览数据先进行序列化处理,然后通过加入全局变量的形式来优化Skip-gram网络中心序列的编码方式,以此提高网络模型的学习能力,并使用改进后的Skip-gram网络来学习用户的浏览行为习惯,最后使用相似度公式计算得到目标用户的推荐序列。实验结果表明,改进的Skip-gram网络对稀疏的浏览数据的处理方式,使得推荐精度得到了一定的提升。其次,为了改善推荐中的项目冷启动问题,改进了一种基于段落嵌入的冷启动推荐模型(Cold-start Recommendation Model based on Paragraph Embedding,CRMPE)。在该改进模型中,首先利用Doc2vec网络计算出数据中原有的新闻文本与新加入的新闻文本最相似的N篇文本,然后利用为克服数据稀疏性问题而优化的Skip-gram网络计算得到这N篇文本的基于用户浏览行为的编码,并在此基础上结合数值法计算得到新文本的基于浏览行为的编码,最后通过相似度公式完成新项目的推荐。实验结果表明,融合了Doc2vec网络和改进的Skip-gram网络的冷启动推荐模型,使得推荐的准确度和覆盖率都得到了提高。最后,在上述模型基础上,设计并实现了新闻推荐原型系统。
暂无评论