版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:南京信息工程大学计算机学院江苏南京210044 南京信息工程大学电子与信息工程学院江苏南京210044 南京信息工程大学人工智能学院江苏南京210044
出 版 物:《计算机仿真》 (Computer Simulation)
年 卷 期:2023年第40卷第8期
页 面:445-450页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划(2021YFE0104400) 国家自然科学基金(U1736105)
主 题:通信 多智能体强化学习 注意力深度强化学习 大规模交流
摘 要:在多智能体系统中,由于智能体数量规模庞大,博弈关系复杂,给策略学习带来了很大的困难,所以学会在智能体之间进行良好的通信十分重要,提出了一个策略网络模型(Attentional Interactions Communication Comment Integration Network,AICNet)提高通信效率。具体来说,AICNet采用了两个模块。第一个注意力模块可以学习智能体之间随时间变化的注意力并更新智能体之间的交互影响;另一个聚合的通信模块可以同步智能体的通信信息。通过将AICNet应用于两组不同的协作与混合性质的模拟实验,以训练的平均奖励和收敛速度为指标,结果表明AICNet的表现优于对比算法,且在模拟环境中观察到智能体确实可以根据彼此关注度自动分组进行任务。