基于矩阵分解的推荐方法易受到数据稀疏性问题的影响,常见的解决办法是向矩阵分解模型中融入评论文本信息,但是这类方法通常假设用户是独立存在的,忽略了用户之间的社交关系.现实世界中用户的行为与喜好往往会受到其信任好友的影响,因此本文提出一种融合评论文本和社交网络的矩阵分解推荐方法(Review and social probabilistic matrix factorization,RSPMF).首先设计了深度神经网络模型用于学习评论文本的上下文特征;其次,设计了信任传播模型用于根据社交好友的特征修正用户的潜在隐特征;最后将上述两种模型以正则化方式融入概率矩阵分解模型,通过训练模型获取用户与物品之间的内在关系并实现物品推荐.在公开的真实数据集Yelp上进行了实验,并与多种前沿的算法进行了性能对比,结果表明本文提出的RSPMF方法具有良好的推荐性能.
近些年很多基于深度学习的推荐模型被提出,这些模型通过对特征的处理和改变深度网络结构来解决推荐系统数据稀疏和冷启动的问题.然而现有的方法忽略了特征与特征之间的交互对深度网络的影响,限制了模型的学习能力.为了给用户推荐更感兴趣的项目和信息,本文提出了分解机深度网络(Factorization Machine Deep Network,FMN)模型.该模型将因式分解机和深度神经网络结合,首先利用因式分解机在特征之间进行交互以充分学习交叉项特征,然后利用深度网络学习高阶非线性特征.进而,分解机深度网络将特征的隐藏信息充分发掘出来并拥有高阶的非线性特征学习能力.两个真实数据集的实验表明,本文提出的模型在推荐性能上有着明显的提升.
针对传统的k-means算法的聚类数目k无法确定、初始聚类中心随机给定、容易受到离群点影响等问题,该算法使用LOF (Local Outlier Factor)离群点检测算法计算数据集中每个数据对象的离群因子,并去除离群因子大于指定阈值的数据对象,使用手肘法来确定符合数据集的最佳k值,根据最大密度和最大距离的思想结合每个点的离群因子来选取初始聚类中心并进行后续聚类中心的迭代,聚类完成后结合三支决策的思想对聚类结果的每个簇内的数据对象进行进一步优化。实验结果表明ODT-kmeans算法能合理选取k值、减少离群点的影响并且可以消除随机选择初始聚类中心的问题,提高了k-means聚类算法的准确率。In view of the problems of the traditional k-means algorithm, such as the number of clusters k cannot be determined, the initial cluster center is randomly given, and it is easily affected by outliers, this algorithm uses the LOF (Local Outlier Factor) outlier detection algorithm to calculate the outlier factor of each data object in the data set and remove the data objects whose outlier factor is greater than the specified threshold. The elbow method is used to determine the best k value that meets the data set. The initial cluster center is selected based on the idea of maximum density and maximum distance combined with the outlier factor of each point and the subsequent cluster center iterations are performed. After clustering is completed, the idea of three-way decision is combined to further optimize the data objects in each cluster of the clustering results. Experimental results show that the ODT-kmeans algorithm can reasonably select the k value, reduce the influence of outliers, and eliminate the problem of randomly selecting the initial cluster center, thereby improving the accuracy of the k-means clustering algorithm.
暂无评论