文献详情 >具有实时注意力的多智能体强化学习通信模型收藏

具有实时注意力的多智能体强化学习通信模型

A Communication Model for Multi-Agent Reinforcement Learning with Time-Variant Attention

作者：马廷淮彭可兴周宏豪荣欢 MA Ting-huai;PENG Ke-xing;ZHOU Hong-hao;RONG Huan

作者机构：南京信息工程大学计算机学院江苏南京210044 南京信息工程大学电子与信息工程学院江苏南京210044 南京信息工程大学人工智能学院江苏南京210044

出版物：《计算机仿真》 (Computer Simulation)

年卷期：2023年第40卷第8期

页面：445-450页

学科分类：081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术（可授工学、理学学位）]

基　　金：国家重点研发计划(2021YFE0104400) 国家自然科学基金(U1736105)

主　　题：通信多智能体强化学习注意力深度强化学习大规模交流

摘要：在多智能体系统中,由于智能体数量规模庞大,博弈关系复杂,给策略学习带来了很大的困难,所以学会在智能体之间进行良好的通信十分重要,提出了一个策略网络模型(Attentional Interactions Communication Comment Integration Network,AICNet)提高通信效率。具体来说,AICNet采用了两个模块。第一个注意力模块可以学习智能体之间随时间变化的注意力并更新智能体之间的交互影响;另一个聚合的通信模块可以同步智能体的通信信息。通过将AICNet应用于两组不同的协作与混合性质的模拟实验,以训练的平均奖励和收敛速度为指标,结果表明AICNet的表现优于对比算法,且在模拟环境中观察到智能体确实可以根据彼此关注度自动分组进行任务。

本地馆藏 | 借阅须知 | 我要预约

已订购，未入库

sda

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

具有实时注意力的多智能体强化学习通信模型

读者评论与其他读者分享你的观点

请选择收藏分类：

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

具有实时注意力的多智能体强化学习通信模型

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：