版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:河北工业大学电子信息工程学院
出 版 物:《计算机工程与应用》 (Computer Engineering and Applications)
年 卷 期:2025年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 082503[工学-航空宇航制造工程] 0835[工学-软件工程] 0825[工学-航空宇航科学与技术] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:河北工业大学创新研究院(石家庄)石家庄市科技合作专项基金(SJZZXA23005)
主 题:多无人机 强化学习 目标覆盖 多智能体近端策略优化 联合引力机制
摘 要:多智能体近端策略优化(Multi-Agent Proximal Policy Optimization,MAPPO)在处理动态复杂环境时面临稳定性和效率的挑战。针对以上挑战,设计了一种联合引力机制,提升了任务执行的速度和效率。在联合引力机制的基础上,提出了一种改进的MAPPO算法(DEA-MAPPO)。该算法首先通过自适应探索机制,动态调整探索幅度以适应无人机的实时表现和环境变化,增强了算法的适应性和稳定性。然后引入了高斯自适应注意力机制,提高了无人机决策质量、协作效率,增强了系统的可解释性和鲁棒性。最后通过加入延迟策略更新机制,有效避免了局部最优陷阱,进一步提升了算法性能和稳定性。通过在仿真环境中的实验验证,联合引力机制显著提升了覆盖效率,DEA-MAPPO算法在目标覆盖任务中的表现优于传统的MAPPO算法,在同样的训练回合数下,总奖励值和覆盖率都有了较大的提升。本研究为多无人机在复杂环境中的高效协同执行目标覆盖任务提供了新的解决方案和理论支持。