咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 理学
    • 1 篇 数学
    • 1 篇 系统科学
  • 1 篇 工学
    • 1 篇 电气工程
    • 1 篇 控制科学与工程

主题

  • 1 篇 approximate dyna...
  • 1 篇 policy-gradient ...
  • 1 篇 function approxi...
  • 1 篇 natural gradient
  • 1 篇 actor-critic rei...
  • 1 篇 temporal differe...
  • 1 篇 two-timescale st...

机构

  • 1 篇 univ alberta dep...
  • 1 篇 indian inst sci ...
  • 1 篇 inria lille nord...

作者

  • 1 篇 bhatnagar shalab...
  • 1 篇 lee mark
  • 1 篇 ghavamzadeh moha...
  • 1 篇 sutton richard s...

语言

  • 1 篇 英文
检索条件"主题词=Actor-critic reinforcement learning algorithms"
1 条 记 录,以下是1-10 订阅
排序:
Natural actor-critic algorithms
收藏 引用
AUTOMATICA 2009年 第11期45卷 2471-2482页
作者: Bhatnagar, Shalabh Sutton, Richard S. Ghavamzadeh, Mohammad Lee, Mark Indian Inst Sci Dept Comp Sci & Automat Bangalore 560012 Karnataka India Univ Alberta Dept Comp Sci RLAI Lab Edmonton AB T6G 2E8 Canada INRIA Lille Nord Europe Team SequeL Lille France
We present four new reinforcement learning algorithms based on actor-critic, natural-gradient and function-approximation ideas, and we provide their convergence proofs. actor-critic reinforcement learning methods are ... 详细信息
来源: 评论