一种社交场景中人类注意力机制模仿学习方法-内蒙古大学图书馆

文献详情 >一种社交场景中人类注意力机制模仿学习方法收藏

一种社交场景中人类注意力机制模仿学习方法

专利申请号：CN202310033512.7

公开号：CN115994576A

发明人：何斌缪奇航陆萍周艳敏蒋烁朱忠攀李鑫

代理人：上海邦德专利代理事务所(普通合伙)梁剑

代理机构：上海邦德专利代理事务所(普通合伙)

专利类型：发明专利

申请日：20230421

公开日：20230110

专利主分类号：G06N3/092

关键词：环境状态信息服务型注意力机制动作序列教师数据目标策略强化学习模仿判别器机器人样本学习任务执行成功机器人领域对抗训练目标模型特征生成网络模块对抗高效性鲁棒性浅层场景输出引入奖励网络

摘要：本发明公开了一种社交场景中人类注意力机制模仿学习方法，属于服务型机器人领域，具体包括：1)获取环境状态信息，再对服务型机器人进行预训练得到目标策略，将深度强化学习任务执行成功的示例作为原始教师数据；2)将环境状态信息输入到行动者网络模块中，生成动作序列，再将教师数据、动作序列和环境状态信息输入至判别器；3)将判别器的输出值作为奖励值指导模仿策略的学习；4)修改服务型机器人的目标策略函数；5)引入人类注意力机制模块，提取模仿学习网络中的浅层特征生成对抗样本；6)利用对抗样本对目标模型进行对抗训练，本发明相较于原始的深度强化学习，模拟学习的方法具有更高的鲁棒性、准确性及高效性。

本地馆藏 | 借阅须知 | 我要预约

已订购，未入库

sda

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

一种社交场景中人类注意力机制模仿学习方法

读者评论与其他读者分享你的观点

请选择收藏分类：

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

一种社交场景中人类注意力机制模仿学习方法

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：