咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 理学
    • 1 篇 数学
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 approximate dyna...
  • 1 篇 value function g...
  • 1 篇 reinforcement le...
  • 1 篇 efficient explor...

机构

  • 1 篇 adobe res san jo...
  • 1 篇 stanford univ st...

作者

  • 1 篇 wen zheng
  • 1 篇 van roy benjamin

语言

  • 1 篇 英文
检索条件"主题词=value function generalization"
1 条 记 录,以下是1-10 订阅
排序:
Efficient Reinforcement Learning in Deterministic Systems with value function generalization
收藏 引用
MATHEMATICS OF OPERATIONS RESEARCH 2017年 第3期42卷 762-782页
作者: Wen, Zheng Van Roy, Benjamin Adobe Res San Jose CA 95110 USA Stanford Univ Stanford CA 94305 USA
We consider the problem of reinforcement learning over episodes of a finite-horizon deterministic system and as a solution propose optimistic constraint propagation (OCP), an algorithm designed to synthesize efficient... 详细信息
来源: 评论