咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 控制科学与工程
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 探索策略
  • 1 篇 参数空间
  • 1 篇 内在激励
  • 1 篇 安全探索
  • 1 篇 任务策略
  • 1 篇 在线深度强化学习

机构

  • 1 篇 海军工程大学

作者

  • 1 篇 叶清
  • 1 篇 袁志民
  • 1 篇 fu yu
  • 1 篇 付钰
  • 1 篇 ye qing
  • 1 篇 陈云
  • 1 篇 he tao
  • 1 篇 chen yun
  • 1 篇 李石磊
  • 1 篇 li shilei
  • 1 篇 何涛
  • 1 篇 yuan zhimin

语言

  • 1 篇 中文
检索条件"主题词=在线深度强化学习"
1 条 记 录,以下是1-10 订阅
排序:
在线深度强化学习探索策略生成方法综述
收藏 引用
机器人 2024年 第6期46卷 753-768页
作者: 李石磊 叶清 袁志民 陈云 何涛 付钰 海军工程大学信息安全系 湖北武汉430033
针对在线深度强化学习算法训练过程中的探索-利用难题,在对其概要介绍基础上,从探索策略与任务策略的关系角度入手,对单智能体在线深度强化学习算法中的探索策略生成方法进行分类综述。首先重点介绍了基于任务策略奖励空间与参数空间的... 详细信息
来源: 评论