版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:中国银联股份有限公司上海201201
出 版 物:《软件产业与工程》 (Software Industry and Engineering)
年 卷 期:2016年第6期
页 面:50-53页
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
主 题:模糊C均值算法 离散系数 信息熵 属性权重 相关系数 密度函数
摘 要:针对传统模糊C-均值聚类算法同等对待每个属性的局限性和初始聚类中心选择的随机性,提出了一种基于相关系数优化的模糊C-均值聚类算法。首先,该算法通过计算离散系数和信息熵来确定每个属性的权重,从而强化了重要属性对聚类过程的影响,削弱了冗余属性的作用,改善了聚类效果;其次,采用相关系数和密度函数来确定样本点的密度,从而突出了样本点在同一类别中的作用;再次,将归一化后的样本点密度作为每个样本的权值;最后,由相关系数及样本点密度确定初始聚类中心。实验结果表明,该算法比传统的FCM算法具有更好的聚类效果。