咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >具有实时注意力的多智能体强化学习通信模型 收藏

具有实时注意力的多智能体强化学习通信模型

A Communication Model for Multi-Agent Reinforcement Learning with Time-Variant Attention

作     者:马廷淮 彭可兴 周宏豪 荣欢 MA Ting-huai;PENG Ke-xing;ZHOU Hong-hao;RONG Huan

作者机构:南京信息工程大学计算机学院江苏南京210044 南京信息工程大学电子与信息工程学院江苏南京210044 南京信息工程大学人工智能学院江苏南京210044 

出 版 物:《计算机仿真》 (Computer Simulation)

年 卷 期:2023年第40卷第8期

页      面:445-450页

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家重点研发计划(2021YFE0104400) 国家自然科学基金(U1736105) 

主  题:通信 多智能体强化学习 注意力深度强化学习 大规模交流 

摘      要:在多智能体系统中,由于智能体数量规模庞大,博弈关系复杂,给策略学习带来了很大的困难,所以学会在智能体之间进行良好的通信十分重要,提出了一个策略网络模型(Attentional Interactions Communication Comment Integration Network,AICNet)提高通信效率。具体来说,AICNet采用了两个模块。第一个注意力模块可以学习智能体之间随时间变化的注意力并更新智能体之间的交互影响;另一个聚合的通信模块可以同步智能体的通信信息。通过将AICNet应用于两组不同的协作与混合性质的模拟实验,以训练的平均奖励和收敛速度为指标,结果表明AICNet的表现优于对比算法,且在模拟环境中观察到智能体确实可以根据彼此关注度自动分组进行任务。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分