咨询与建议

限定检索结果

文献类型

  • 1 篇 会议

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 控制科学与工程
    • 1 篇 计算机科学与技术...

主题

  • 1 篇 full gradient dq...
  • 1 篇 restless bandits
  • 1 篇 whittle index
  • 1 篇 average reward m...

机构

  • 1 篇 indian inst tech...
  • 1 篇 inria sophia ant...

作者

  • 1 篇 avrachenkov kons...
  • 1 篇 borkar vivek
  • 1 篇 pagare tejas

语言

  • 1 篇 英文
检索条件"主题词=Full Gradient DQN algorithm"
1 条 记 录,以下是1-10 订阅
排序:
full gradient Deep Reinforcement Learning for Average-Reward Criterion  5
Full Gradient Deep Reinforcement Learning for Average-Reward...
收藏 引用
5th Annual Conference on Learning for Dynamics and Control
作者: Pagare, Tejas Borkar, Vivek Avrachenkov, Konstantin Indian Inst Technol Dept Elect Engn Mumbai 400076 Maharashtra India INRIA Sophia Antipolis 2004 Route LuciolesBP93 F-06902 Valbonne France
We extend the provably convergent full gradient dqn algorithm for discounted reward Markov decision processes from Avrachenkov et al. (2021) to average reward problems. We experimentally compare widely used RVI Q-lear... 详细信息
来源: 评论