咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 learning systems
  • 1 篇 reinforcement le...
  • 1 篇 useful features
  • 1 篇 function approxi...
  • 1 篇 hand-tuning
  • 1 篇 approximate line...
  • 1 篇 determinist poli...
  • 1 篇 mountain car pro...
  • 1 篇 learning control...
  • 1 篇 deterministic po...
  • 1 篇 approximate-line...
  • 1 篇 sparse features
  • 1 篇 continuous actio...
  • 1 篇 dpg algorithm
  • 1 篇 learning (artifi...
  • 1 篇 feature selectio...
  • 1 篇 feature selectio...
  • 1 篇 rl task
  • 1 篇 deterministic al...

机构

  • 1 篇 beijing univ che...

作者

  • 1 篇 song tianheng
  • 1 篇 li dazi
  • 1 篇 li luntong

语言

  • 1 篇 英文
检索条件"主题词=determinist policy gradient algorithm"
1 条 记 录,以下是1-10 订阅
排序:
Feature selection in deterministic policy gradient
收藏 引用
JOURNAL OF ENGINEERING-JOE 2020年 第13期2020卷 403-406页
作者: Li, Luntong Li, Dazi Song, Tianheng Beijing Univ Chem Technol Inst Automat Beijing 100029 Peoples R China
The authors consider the task of learning control problem in reinforcement learning (RL) with continuous action space. policy gradient, and in particular the determinist policy gradient (DPG) algorithm, provides a met... 详细信息
来源: 评论