版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:贵州大学大数据与信息工程学院贵州贵阳550025
出 版 物:《电子科技》 (Electronic Science and Technology)
年 卷 期:2019年第32卷第5期
页 面:38-43,54页
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家国际科技合作专项项目(2014DFA00670) 贵州省研究生教育教学改革重点课题(黔教研合JG字15) 贵州省科技厅工业攻关项目(黔科合GY字3056)
主 题:Spark CFSFDP算法 决策图 密度峰值 聚类 并行化
摘 要:CFSFDP算法是一种基于密度的新型聚类算法。文中针对算法需使用决策图人工选取聚类中心点的问题,利用斜率思想找出聚类中心点与非聚类中心点间的分界点,在消除主观误差的同时实现了中心点的自动求取,并最终将算法使用Spark框架进行了并行化实现。实验结果表明,文中算法在消除人为误差的同时提升了算法效率,且并行后的算法具有良好的加速比与扩展性,适用于海量数据的聚类分析。