咨询与建议

限定检索结果

文献类型

  • 31 篇 期刊文献
  • 9 篇 会议
  • 1 篇 学位论文

馆藏范围

  • 41 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 30 篇 工学
    • 16 篇 控制科学与工程
    • 16 篇 计算机科学与技术...
    • 7 篇 电气工程
    • 3 篇 信息与通信工程
    • 1 篇 机械工程
    • 1 篇 动力工程及工程热...
    • 1 篇 化学工程与技术
    • 1 篇 石油与天然气工程
    • 1 篇 软件工程
  • 9 篇 理学
    • 8 篇 数学
    • 1 篇 系统科学
    • 1 篇 统计学(可授理学、...
  • 5 篇 管理学
    • 5 篇 管理科学与工程(可...
  • 2 篇 经济学
    • 1 篇 理论经济学
    • 1 篇 应用经济学
  • 1 篇 军事学

主题

  • 41 篇 actor-critic alg...
  • 21 篇 reinforcement le...
  • 9 篇 markov decision ...
  • 5 篇 stochastic appro...
  • 4 篇 martingale
  • 4 篇 two timescale st...
  • 4 篇 policy gradient
  • 3 篇 risk-sensitive r...
  • 3 篇 normalized hadam...
  • 3 篇 markov decision ...
  • 3 篇 policy gradient ...
  • 3 篇 deep reinforceme...
  • 2 篇 continuous time ...
  • 2 篇 simultaneous per...
  • 2 篇 function approxi...
  • 2 篇 policy evaluatio...
  • 2 篇 nonholonomic mob...
  • 2 篇 mixed multi-agen...
  • 2 篇 conditional valu...
  • 2 篇 chance-constrain...

机构

  • 5 篇 indian inst sci ...
  • 3 篇 tata inst fundam...
  • 2 篇 mit informat & d...
  • 2 篇 boston univ div ...
  • 2 篇 syracuse univ de...
  • 2 篇 ibm research ban...
  • 2 篇 inria lille
  • 2 篇 boston univ ctr ...
  • 1 篇 inria
  • 1 篇 amazon-iisc post...
  • 1 篇 aeronautics and ...
  • 1 篇 fime
  • 1 篇 george washingto...
  • 1 篇 norwegian univ s...
  • 1 篇 boston univ dept...
  • 1 篇 univ paris cite
  • 1 篇 indian inst tech...
  • 1 篇 sun microsyst la...
  • 1 篇 univ ottawa dept...
  • 1 篇 edf r&d fime

作者

  • 4 篇 bhatnagar shalab...
  • 3 篇 abdulla mohammed...
  • 3 篇 ghavamzadeh moha...
  • 3 篇 borkar vs
  • 2 篇 wang jing
  • 2 篇 d. sai koti redd...
  • 2 篇 konda vr
  • 2 篇 velipasalar sene...
  • 2 篇 gursoy m. cenk
  • 2 篇 shalabh bhatnaga...
  • 2 篇 zhong chen
  • 2 篇 paschalidis ioan...
  • 2 篇 pham huyen
  • 2 篇 warin xavier
  • 2 篇 mohammad ghavamz...
  • 2 篇 paschalidis ioan...
  • 1 篇 srikanth g. tami...
  • 1 篇 saha amrita
  • 1 篇 kumar s
  • 1 篇 bernhard schölko...

语言

  • 37 篇 英文
  • 4 篇 其他
检索条件"主题词=Actor-critic algorithms"
41 条 记 录,以下是41-50 订阅
排序:
Risk-constrained reinforcement learning with percentile risk criteria
The Journal of Machine Learning Research
收藏 引用
The Journal of Machine Learning Research 2017年 第1期18卷
作者: Yinlam Chow Mohammad Ghavamzadeh Lucas Janson Marco Pavone DeepMind Mountain View CA Department of Statistics Stanford University Stanford CA Aeronautics and Astronautics Stanford University Stanford CA
In many sequential decision-making problems one is interested in minimizing an expected cumulative cost while taking into account risk, i.e., increased awareness of events of small probability and high consequences. A... 详细信息
来源: 评论