在复杂动态环境下,针对无人机执行协同数据采集任务时,出现的航迹规划问题求解不确定性高、多机协同难度大、机间碰撞严重等挑战,提出了一种面向多无人机辅助数据采集的强化学习协同航迹规划(reinforcement learning-based cooperative trajectory planning for UAV aided data collection,RL-DC)算法.该算法通过集中式训练分布式执行框架,实现多无人机安全高效协同数据采集和航迹优化.通过设计竞争候选节点队列机制,避免多架无人机同时服务一个节点导致的信号干扰和飞行安全问题,并通过奖励重塑优化规划轨迹,提高数据采集效率;同时采用网络结构优化和混合优先经验回放,提高无人机在复杂环境下的学习效率,提升决策能力.实验结果表明,所提出的RL-DC算法在各种任务环境中的成功率均能达到90%以上,节点服务率均大于98%,性能优于其他同类算法.
暂无评论