【目的】考虑到标记分布学习中标记之间具有层次结构关系,将层次标签结构引入标记分布学习,提升标记分布学习的效果。【方法】提出一种基于层次标签结构的标记分布学习算法(Hierarchy Label Distribution Learning Algorithm,H-LDL),根...
详细信息
【目的】考虑到标记分布学习中标记之间具有层次结构关系,将层次标签结构引入标记分布学习,提升标记分布学习的效果。【方法】提出一种基于层次标签结构的标记分布学习算法(Hierarchy Label Distribution Learning Algorithm,H-LDL),根据样本在各层次的标签,利用条件概率描述粗、细两个层次的结构关系,并通过层次加权损失函数及其优化策略调节层次间标记的准确分布。【结果】在两个公开数据集上进行实验,用了5个指标进行效果检测,其中,BU_3DFE数据集在Euclidean、Squared、K-L指标中较基线算法最低值分别降低了3.99%、1.07%、3.10%,Intersec和Fidelity指标较基线算法最高值分别提升了4.24%、0.67%,COMP数据集在Euclidean指标上降低了0.48%,在Squared、K-L指标未见明显降低,在Intersec和Fidelity指标上提升了0.45%、0.02%。【局限】仅考虑了标签之间粗层次和细层次两层结构关系,当标签具有其他更复杂的层次结构关系时需进一步研究。【结论】加入层次标签结构后标记分布误差有明显减小,有效提升了标记分布学习的效果。
近年来,推荐系统逐渐成为电子商务、在线流媒体、新闻资讯等各大互联网平台不可缺少的关键技术。以协同过滤技术为代表的推荐系统主要研究用户-项目评分数据,但此类方法常常面临新加入用户与用户交互次数少而导致的冷启动问题和数据稀疏问题。为解决上述问题,研究人员将用户和项目的上下文信息引入到协同过滤推荐系统中,丰富用户与项目表示。随着文本挖掘技术的发展,有研究发现用户对项目的评论文本不仅能够体现项目在不同方面的语义特征,也可以弥补用户-项目评分矩阵不能全面地反映用户语义偏好的局限,故可以将其应用到推荐系统中缓解数据稀疏性和冷启动问题。由于文本数据和用户-项目评分数据在用户偏好表示上存在差异,目前大多数模型在用户表示学习方面没有进行深层次的多次融合,为此,该文提出一种基于双头自编码器的评论感知推荐模型(Review Topic-aware Recommendation Model with Two-headed Autoencoder,TAAE)。该模型通过隐狄利克雷主题模型与BERT模型提取出用户评论的主题信息与语义信息,采用注意力机制与门控机制相结合的方式进行多模态特征对齐与融合,再利用多项式降噪自编码器进行用户评分预测。此外,为了缓解自编码器推荐模型中常见的流行度偏差问题,TAAE构建了一个负采样解码器,对推荐结果进一步优化。最后,在6组公开Amazon数据集上测试了TAAE模型的推荐性能,并对模型可能存在的变体及各解码器结构进行消融实验,实验结果表明,TAAE模型优于其他7个对比模型。
暂无评论