关键词:
敏捷卫星
时间依赖性
任务调度
多目标调度
协同进化算法
分布式强化学习
摘要:
随着地球观测领域相关技术的高速发展,近年来具有先进姿态调整能力的敏捷地球观测卫星已经引起了广泛的关注.敏捷卫星任务调度具有时间依赖性切换时间,在多星、多轨道、多需求的卫星观测场景下,产生了复杂的时间依赖性多敏捷卫星多目标调度问题.针对该问题,首先,基于问题特征和优化目标建立了问题的数学规划模型.其次,提出一种分布式元Q学习协同进化框架,包括预训练和进化搜索两个阶段,预训练阶段通过分布式Q学习提高训练效率,进化搜索阶段通过训练好的分布式Q学习模型实现多种群进化算子的自适应选择.然后,基于所提出的进化框架和问题特征,设计了多样化的进化算子和动态种群划分选择策略,建立了一种分布式元Q学习协同进化算法(Distributed Meta-Q-Learning Co-Evolutionary Algorithm, DMCEA).最后,实验验证了DMCEA求解问题的有效性.