DBSCAN(density-based spatial clustering of applications with noise)是应用最广的密度聚类算法之一.然而,它时间复杂度过高(O(n^(2))),无法处理大规模数据.因而,对它进行加速成为一个研究热点,众多富有成效的工作不断涌现.从加速目...
详细信息
DBSCAN(density-based spatial clustering of applications with noise)是应用最广的密度聚类算法之一.然而,它时间复杂度过高(O(n^(2))),无法处理大规模数据.因而,对它进行加速成为一个研究热点,众多富有成效的工作不断涌现.从加速目标上看,这些工作大体上可分为减少冗余计算和并行化两大类;就具体加速手段而言,可分为6个主要类别:基于分布式、基于采样化、基于近似模糊、基于快速近邻、基于空间划分以及基于GPU加速技术.根据该分类,对现有工作进行了深入梳理与交叉比较,发现采用多重技术的融合加速算法优于单一加速技术;近似模糊化、并行化与分布式是当前最有效的手段;高维数据仍然难以应对.此外,对快速化DBSCAN算法在多个领域中的应用进行了跟踪报告.最后,对本领域未来的方向进行了展望.
链接预测问题是复杂网络分析领域的重要问题.现有链接预测方法大多针对静态网络,忽视了动态信息在网络中的传播.为此,针对动态网络中的链接预测问题,本文提出了一种基于动态网络表示的链接预测(dynamic network representation based li...
详细信息
链接预测问题是复杂网络分析领域的重要问题.现有链接预测方法大多针对静态网络,忽视了动态信息在网络中的传播.为此,针对动态网络中的链接预测问题,本文提出了一种基于动态网络表示的链接预测(dynamic network representation based link prediction,DNRLP)模型.该模型对网络中不均匀的动态信息进行了学习,提出了基于连接强度的随机游走算法来模拟动态信息在网络中的扩散,从而得到新时刻下的节点表示,然后通过度量节点表示之间的相似度进行链接预测.实验使用平均交互排序(mean reciprocal rank,MRR)和召回率(Recall@k)指标在四个公开动态网络数据集上进行实验,结果显示DNRLP模型的MRR指标较对比模型平均提高了30.8%.实验结果表明DNRLP模型不仅学习了网络中的动态信息,还考虑了其对邻居节点的影响以及时间间隔对信息更新的影响,得到了更为丰富的节点表示,对于链接预测任务具有明显优势.
暂无评论