关键词:
无人机集群
深度强化学习
引导式学习
智能编队控制
摘要:
针对无人机集群系统,提出一种性能函数引导的深度强化学习控制方法,同时评估性能函数的示范经验与学习策略的探索动作,保证高效可靠的策略更新,实现无人机集群系统的高性能控制.首先,利用领航–跟随集群框架,将无人机集群的控制问题转化为领航-跟随框架下的跟踪问题,进而提出基于模型的跟踪控制方法,利用性能函数将集群编队误差约束在给定范围内,实现无人机集群的模型驱动控制.接下来,为解决复杂工况下性能函数极易失效难题,将深度强化学习方法和性能函数驱动方法结合,提出性能函数引导的深度强化学习控制方法,利用性能函数的示范经验辅助训练强化学习网络,通过同时评估探索与示范动作,保证学习策略显著优于性能函数驱动控制方法,有效提高无人机编队控制精度与鲁棒性.实验结果表明,该方法能够显著提升无人机集群的控制性能,实现兼顾鲁棒性与飞行精度的高性能集群控制.