云计算作为二十一世纪初期的新兴事物,目前已步入较为成熟的发展阶段,其依托于虚拟化技术,将各类资源进行有效整合和管理,向用户提供了高效的计算服务和应用软件。近年来,图像处理、地震预测、基因组测序等应用程序生成的工作流日渐复杂,使得越来越多的工作流被提交到云中处理。为了满足各类场景下不同用户的计算要求,国内外云服务提供商纷纷升级扩展云数据中心,但是目前数据中心的资源利用率较低,使得高能耗问题成为云服务提供商当前亟需解决的关键问题。高效合理的工作流节能调度机制是解决此类问题行之有效的方法,对云资源调度研究具有重要的现实意义。本文对数据中心节能技术、描述工作流的表示模型以及工作流调度算法进行了系统地研究,分析了现有工作中存在的问题与难点。考虑到云计算的发展现状,针对工作流的节能调度问题,展开基于超图的工作流建模与划分研究,以及面向多目标的工作流调度研究,在满足用户服务质量的同时,降低云数据中心的能源消耗,具体贡献如下:(1)基于超图的工作流建模与划分研究。准确的工作流描述模型是得出优秀调度算法的关键前提,本文基于有向超图建立了全新的工作流表示模型,重点聚焦执行工作流时的数据传输过程以及工作流处理过程中复杂的数据依赖关系,将依赖同一数据文件的任务采用一条有向超边连接,克服了有向无环图只能反映一对一关系的弊端;在此基础上,提出了基于有向超图的工作流节能划分机制(Directed Hypergraph based Energy-Saving Workflow Partitioning Strategy,HPWS),通过超图粗化、超图划分、分区调度三个阶段把工作流划分为最少分区并分配到主机上。实验结果表明,HPWS机制可以开启最少的主机执行工作流,从而减少云数据中心的能耗。(2)面向多目标的工作流调度研究。利用HPWS将工作流分配到合适的服务器后,为进一步减少任务完成时间,同时降低数据中心能耗,本文研究省时节能的多目标工作流调度策略。考虑到任务间依赖关系对调度结果的影响,采用最早完成时间和影响因子共同确定任务的优先级,并比较具有相同优先级任务调度至虚拟机的时间损失,提出时间损失最少的依赖任务调度算法(Least Time Loss based Dependent Task Scheduling Algorithm,LLTS),完成任务与其分配主机上虚拟机之间的调度。实验结果表明,LLTS可进一步缩短工作流完成时间,降低能耗,特别是针对并行任务数较多的工作流,LLTS的优化最为明显。
暂无评论