针对复杂网络的特殊性质导致社区挖掘质量较低的问题,提出一种相似度度量方法代替传统的欧氏距离,从而将密度聚类cfsfdp(Clustering by fast search and find of density peaks)算法应用到复杂网络聚类中去。首先,利用Pade逼近方法计算...
详细信息
针对复杂网络的特殊性质导致社区挖掘质量较低的问题,提出一种相似度度量方法代替传统的欧氏距离,从而将密度聚类cfsfdp(Clustering by fast search and find of density peaks)算法应用到复杂网络聚类中去。首先,利用Pade逼近方法计算复杂网络的拉普拉斯算子矩阵指数;接着,归一化核心矩阵得到相似度矩阵,并求倒数得出复杂网络各节点间距离;最后,借鉴cfsfdp算法思想,将节点自身邻域密度、与其他邻域密度较高节点的距离结合作为判断依据,得出聚类中心并剔除噪声点,再将其余节点与距离最近的聚类中心划分为一类。在人工模拟数据和真实数据集上的实验结果表明:所提算法聚类准确率较高,以超几何定律为最佳匹配标准的已知组与实验组的随机重叠概率较高,算法可用于挖掘高质量的复杂网络社区。
时空聚类算法是地理时空大数据挖掘的基础研究命题。针对传统cfsfdp聚类算法无法应用于时空数据挖掘的问题,本文提出一种时空约束的ST-cfsfdp(spatial-temporal clustering by fast search and find of density peaks)算法。在cfsfdp算...
详细信息
时空聚类算法是地理时空大数据挖掘的基础研究命题。针对传统cfsfdp聚类算法无法应用于时空数据挖掘的问题,本文提出一种时空约束的ST-cfsfdp(spatial-temporal clustering by fast search and find of density peaks)算法。在cfsfdp算法基础上加入时间约束,修改了样本属性值的计算策略,不仅解决了原算法单簇集多密度峰值问题,且可以区分并识别相同位置不同时间的簇集。本文利用模拟时空数据与真实的室内定位轨迹数据进行对比试验。结果表明,该算法在时间阈值90 s、距离阈值5 m的识别正确率高达82.4%,较经典ST-DBCSAN、ST-OPTICS及ST-AGNES聚类算法准确率分别提高了5.2%、4.2%和7.6%。
暂无评论