为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数...
详细信息
为了提高传统CURE(clustering using representatives)聚类算法的质量,引入信息熵对其进行改进。该算法使用K-means算法对样本数据集进行预聚类;采用基于信息熵的相似性度量,利用簇中元素提供的信息度量不同簇之间的相互关系,并描述数据的分布;在高、低层聚类阶段,采取不同的选取策略,分别选取相应的代表点。在UCI和人造数据集上的实验结果表明,提出的算法在一定程度上提高了聚类的准确率,且在大型数据集上比传统CURE算法有着更高的聚类效率。
如何将大量的虚拟机有效分布到多个物理节点上是云计算面临的主要难题之一。基于应用负载的动态变化预测信息,将虚拟机在物理节点上的分布问题转化为一个多目标优化问题,利用遗传算法来寻求该多目标问题的近似最优解,在遗传算法的交叉与变异阶段结合类型匹配的规则,在选择阶段利用基于参考点的快速非支配排序遗传算法(Non-dominated Sorting Genetic AlgorithmⅢ,NSGA-Ⅲ)选择出较优子代种群。仿真结果表明,基于NSGA-Ⅲ的遗传算法(Multi-Objective Genetic Algorithm based on NSGA-Ⅲ,MOGAⅢ)在解决虚拟机调度问题时,在云平台的稳定时间、物理节点的激活数量和虚拟机的迁移次数等优化目标之间做了较好的平衡。和基于NSGA-Ⅱ的遗传算法(Multi-Objective Genetic Algorithm based on NSGA-Ⅱ,MOGAⅡ)相比,算法MOGAⅢ的平均功耗降低了4.46%。
暂无评论