咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于距离与熵的混合属性数据流聚类算法 收藏

基于距离与熵的混合属性数据流聚类算法

Clustering of Data Streams with Mixed Numeric and Categorical Values Based on Entropy and Distance

作     者:王述云 胡运发 范颖捷 徐和祥 WANG Shu-yun;HU Yun-fa;FAN Ying-jie;XU He-xiang

作者机构:福州大学八方物流学院福建福州350002 复旦大学计算机与信息技术系上海200433 解放军南京政治学院上海分院训练部上海200433 上海远程教育集团上海200092 

出 版 物:《小型微型计算机系统》 (Journal of Chinese Computer Systems)

年 卷 期:2010年第31卷第12期

页      面:2365-2371页

核心收录:

学科分类:08[工学] 0835[工学-软件工程] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家自然科学基金项目(60736016)资助 福州大学博士基金项目(826786)资助 上海市教育委员会科研创新项目(09YZ462)资助 

主  题:数据流 混合属性 聚类  

摘      要:针对越来越多的应用领域要求数据流聚类算法能处理同时包含数值属性特征与分类属性特征的数据,同时由于在已有的流数据聚类算法中,大多只针对单一数据类型的聚类,为此,提出混合属性数据流聚类算法.该算法在聚类分析过程中,同时利用数值属性与分类属性来定义聚类对象间的相异性,保存了对象的完整信息,使得聚类结果更能真实反映数据流中数据的分布情况.实验结果表明,该算法具有良好的聚类质量及较快的数据处理能力,同时具有良好的可扩展性.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分