演化算法是一种模仿生物演化过程的启发式搜索算法,包括遗传算法、遗传规划、进化策略、进化规划、差分演化算法等,具有通用性强、结构简单、并行处理等优点,较好地解决多维度、高度非线性难以处理的复杂优化问题,被应用于生物医学、工程设计、数据挖掘、经济管理、农业管理等不同的领域。虽然演化算法在仿真实验和实际应用中获得较好的成果,但是该算法含有复杂的随机行为,加之缺乏严格的理论基础,很难对其进行全面地理论分析。本论文的研究内容包括对基因表达式编程算法和差分演化算法的改进展开研究,并应用在聚类应用中,另外,本论文提出采用动态适应度景观的有效分析策略对改进后的差分演化算法进行理论研究。主要工作总结如下:首先,针对K-均值聚类算法随机选取初始聚类中心点容易陷入局部最优的问题,本论文提出一种改进后的基因表达式编程算法,由一个主基因(Homeotic Gene)和一个自定义函数(Automatically Defined Function,ADF)构成一种新的染色体表达式,以及提出一种新型的插串规则NCR-ADF,保证种群具有多样性,主要目的为了训练待聚类的测试数据,通过实验证明,被训练过的数据中选取初始聚类中心点,使得算法不容易陷入局部最优,可以提高算法的稳定性。其次,差分演化算法的三个重要参数包括:种群大小NP,缩放因子F和交叉概率CR。本论文提出一种自适应的缩放因子F和结合一种新的交叉概率CR的差分演化算法,由于缩放因子可以控制算法的搜索步长,影响算法最优解的搜索和种群多样性,而交叉概率主要影响算法的收敛速度和平衡算法全局与局部搜索能力。在本论文中,主要采用改进后的差分演化算法为K-均值聚类算法选取更合适的聚类中心点,从而提高聚类的准确性。最后,本论文提出基于动态适应度景观来分析改进后的差分演化算法的性能,主要采用适应距离相关性、粗糙性、动态程度和梯度测量等四种分析策略收集和处理适应值与解之间的各个关系值,判断算法求解问题的搜索难易程度,反映算法求解最优值的变化情况和轨迹,。本论文选取具有代表性的十二个测试函数,通过差分演化算法计算每个测试函数的最优解,使用二维图来显示实验数据的变化趋势,根据每个分析策略能够反映算法的不同特征,合理地分析差分演化算法在求解不同函数最优值的各方面性能,丰富差分演化算法的理论基础。
暂无评论