随着互联网的普及,越来越多的人愿意在网上进行商品的购买、浏览新闻等,因此推荐系统成为各个互联网服务、社交媒体等平台的重要工具。近年来,许多基于特征交互的模型已经成功应用到点击率预测领域,以此来挖掘用户和商品之间的关系并形成推荐。但是上述方法忽略了不同行为之间可能产生的关联关系,会丢失一部分信息。
后续用户的历史行为足迹也可以被完整的记录下来,因此基于行为序列的推荐开始被广泛应用于点击率预测领域。第一个方向是用户的行为序列,将用户的历史行为当成一个序列来进行分析和挖掘,以此来推测出用户随时间变化的进化兴趣,然而当遇到用户行为量过少时,预测结果不够优秀。第二个方向是商品的行为序列,通过寻找点击过目标商品的相似用户群,挖掘目标用户和相似用户群之间的关系,以此来推测出目标用户的兴趣偏好。上述的方式可以从序列的角度来挖掘信息,并针对不同的用户推测出个性化兴趣偏好。基于上述的观察和分析,本文主要从行为序列的角度来挖掘用户的兴趣偏好,主要的工作总结如下。
(1)大多数以往的模型,在挖掘用户行为序列的时候只关注单个用户行为与目标商品之间的特征级交互,或者在挖掘用户兴趣时只将用户的历史行为作为一个序列来挖掘其背后隐藏的兴趣。这可能导致随着时间推移而动态发展的用户兴趣被忽略,或者单个用户行为所显示的兴趣没有被利用。因此本文提出了全新的基于用户进化兴趣和特征协同网络(Evolving Interest with Feature Co-action Network,EIFCN),使用一种全新的特征交互的方式来挖掘用户单个行为所展示出来的显式兴趣,并结合长短时间序列,将用户的行为当成序列来对待,挖掘用户随时间变化的隐式兴趣。本文在真实世界数据集上进行了广泛的实验,实验结果表明,该网络相比目前主流模型得到了更好的效果。
(2)挖掘用户行为序列时,在用户行为少的情况下,可能会存在冷启动的问题,预测效果并不理想。除此之外,挖掘用户行为序列的时候,以往大多数工作,使用RNN(Recurrent Neural Network)序列挖掘用户行为序列的背后隐藏兴趣时,没有考虑到位置因素带来的影响。而在少量考虑到商品行为侧的工作中,大多数工作通过目标用户与相似用户之间的关系挖掘用户兴趣时,用户的表示不够丰富和准确,导致商品推荐的准确性较低。为了解决上述问题,本文设计了基于用户和物品深度匹配网络(Deep User and Item Inter-matching Network,DUIIN)。首先使用全新的PAGRU(GRU with position attention)来挖掘用户行为序列背后的隐藏兴趣,同时使用全新的特征交互方式来挖掘用户的显式兴趣。然后将用户的兴趣等多种信息结合,形成一种全新的用户表示,以此为基础来挖掘目标用户和相似用户群之间的关系。对该模型使用真实数据集进行实验,与目前主流模型进行了对比,实验结果表明该模型有着更好的性能。
光学乐谱识别(Optical Music Recognition,OMR)是一个研究如何通过计算方式自动读取文档中的音乐符号的研究领域。随着科技的不断发展,人们的工作与生活的数字化已成为当今社会的发展趋势,而OMR正是实现音乐智能化与数字化进程中的一项...
详细信息
光学乐谱识别(Optical Music Recognition,OMR)是一个研究如何通过计算方式自动读取文档中的音乐符号的研究领域。随着科技的不断发展,人们的工作与生活的数字化已成为当今社会的发展趋势,而OMR正是实现音乐智能化与数字化进程中的一项关键技术,其在建设数字音乐图书馆,推广智能音乐教育等领域存在广泛应用前景。传统乐谱识别方法受制于其繁琐的流程,其识别效果不尽如人意。近年来,研究人员提出了基于深度学习的端到端OMR方法,将单行乐谱图像看作序列数据进行识别研究工作。本文在此基础上,从改进单声部乐谱识别效果着手,进而将方法推广到复调乐谱的识别上,本文具体研究工作与成果如下:(1)针对单声部乐谱的识别,提出了一种基于残差门控循环卷积和注意力机制解码的乐谱识别方法。首先,对残差网络及门控循环卷积原理进行分析,在此基础之上对原有单声部乐谱识别方法进行改进,采用残差门控循环卷积网络提取乐谱图像特征,使模型对音符结构更为敏感,同时丰富其上下文信息提取能力。其次,设计一个基于注意力机制的解码器,将音符特征表示与解码步骤对齐,并防止对音符的过度自信预测。实验结果表明,本文提出的端到端模型相比原方法在识别性能得到显著提升,并且对变形的乐谱的识别有一定鲁棒性。(2)基于对单声部乐谱识别的认识开展复调乐谱的识别研究。针对目前复调乐谱识别数据集缺失的问题,通过Muse Score社区及其工具生成复调乐谱数据集。采用迁移学习的方法解决数据量较小的情况,引入单声部乐谱的预训练模型,并采用BiGRU构建RNN,为特征序列建模提供更好的性能并降低计算量,在解码阶段提出了一维解码和循环解码两种方案分别对图像切片序列特征实施预测解码。实验结果表明,本文提出的端到端模型能够对复调乐谱有效地识别,且在循环解码器上的表现更为出色。
暂无评论