现有算法中没有哪一种聚类算法可以普适于所有数据集,它们各有优缺点。本文将粒度计算与聚类算法相结合,提出基于聚合网络的变粒度二次聚类方法(twice clustering method based on the variable granularity and clustering network,VGT...
现有算法中没有哪一种聚类算法可以普适于所有数据集,它们各有优缺点。本文将粒度计算与聚类算法相结合,提出基于聚合网络的变粒度二次聚类方法(twice clustering method based on the variable granularity and clustering network,VGTC),通过粒度计算将两种聚类算法融合在一起,首次聚类的目的并不是完成对整个数据集的聚类操作,而是找到合适的聚合粒层,是在较细的粒度上进行,用以寻找数据局部结构,并依据粒度的粗细形成聚合网络中的某一聚合粒层,二次聚类在此基础之上完成对论域的聚类操作。以基于K均值与层次聚类的变粒度自适应二次聚类方法(Twice clustering of variable granulation based on K-means and hierarchical clustering, KVGTC)为例,VGTC可以同时解决K均值算法易受初始聚类中心的影响而聚类错误、不能识别任意形状数据集和层次聚类速度较慢等问题。
暂无评论