版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者单位:中国科学院大学
学位级别:博士
导师姓名:胡玥
授予年度:2018年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
主 题:用户兴趣挖掘 时序动态 模型构建 物品内容演化 社交组 信息级联
摘 要:伴随着信息技术的快速发展和普及,各种互联网应用应运而生,为人们生活的多个方面带来便利。用户会根据自身在不同时刻处的兴趣与偏好,选择与不同的互联网应用产生不同形式的交互数据。事实上,用户的兴趣表现出时序动态性特点,可能会随着时间的推移而发生变化。在本文中,我们主要针对抽象后的用户历史交互数据,分析和挖掘时序动态的用户兴趣分布,进而理解和预测用户的未来行为。在商业领域,时序动态的用户兴趣挖掘可用来增强用户体验和用户黏性,具有巨大的商业价值。在信息安全领域,用户兴趣的动态建模可以识别恶意信息和欺诈行为,以此维护互联网秩序和安全监管。 本文研究用户兴趣的时序动态建模问题,解决个体信息协同以及群组信息协同的影响对动态用户兴趣挖掘带来的挑战。传统的个体信息协同方法往往假定与用户交互的对象的属性是一成不变的,忽略了对象的属性随着时间动态变化的事实,降低了用户兴趣动态建模的性能。群组将具有相似兴趣的用户或者相似属性的对象等信息组合在一起,提供了更加准确的用户兴趣动态建模中的协同作用。进一步地,用户之间的群组关系可以分为真实群组关系以及虚拟群组关系。基于上述讨论,本文展开了三个研究内容:1)基于物品内容演化的时序动态用户兴趣挖掘模型;2)基于社交组影响的时序动态用户兴趣挖掘模型;3)基于信息级联驱动影响的时序动态用户兴趣挖掘模型。具体地,三个工作的研究内容与贡献归纳如下。 1)基于物品内容演化的时序动态用户兴趣挖掘模型。该研究工作解决物品的内容(例如物品的描述内容、物品的属性)随着时间的推移而发生动态变化情形下带来的挑战。为捕捉用户当前时刻的兴趣分布与历史的用户兴趣分布之间的关系,我们采用向量自回归模型建模用户兴趣的动态演化过程。考虑到物品话题分布的稀疏性以及物品内容表示的鲁棒性,我们采用动态的稀疏话题编码框架建模物品内容的动态演化。基于此,我们提出了基于物品内容演化的时序动态用户兴趣挖掘模型。该模型联合学习时序动态的用户兴趣分布和动态的物品内容变化。与现有的基准方法对比,我们提出的模型在精度以及MRR评价指标上显著地获得了较好的实验结果。 2)基于社交组影响的时序动态用户兴趣挖掘模型。动态的用户兴趣建模除了要考虑交互对象的协同作用外,还需要考虑群组信息协同带来的影响。首先我们对基于事件的社交网络上的真实数据集进行统计性分析,验证社交组对用户兴趣挖掘的影响。基于此,我们提出了贝叶斯潜在因子模型建模用户兴趣。在该模型中,我们引入了联合社交组影响打分以及个体偏好打分的混合打分框架,并采用贝叶斯个性化排序学习框架解决用户交互中的不详细反馈问题。考虑到真实场景下用户兴趣的时序动态变化,我们将在线学习框架融入到提出的贝叶斯潜在因子模型中,以便于处理流式数据下协同群组信息对用户兴趣的影响。实验验证表明,我们的模型在AUC、精度以及NDCG指标上获得了较好的实验结果。 3)基于信息级联驱动影响的时序动态用户兴趣挖掘模型。事实上,在一些特定场景下,社交组可能是虚拟的。用户兴趣会受到虚拟群组中消息传播的影响而发生动态变化。在该研究内容中,我们采用信息级联刻画信息传播,设定信息级联体现时序动态的用户兴趣。通过联合考虑网络结构数据和信息级联数据,我们提出了基于信息级联驱动影响的时序动态用户兴趣挖掘模型,发现兴趣相似的社交组用户。在该模型中,目标函数以用户兴趣分布为优化参数,并被证明相对于用户兴趣分布为凸函数。实验结果表明,相比于其它对比方法,我们的模型获得了最小的平均影响扩散错误率。