咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 控制科学与工程
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 强化学习
  • 1 篇 状态自动划分
  • 1 篇 值函数
  • 1 篇 模糊小脑关节模型...

机构

  • 1 篇 华南理工大学

作者

  • 1 篇 zhu jin-hui
  • 1 篇 luo rong-hua
  • 1 篇 闵华清
  • 1 篇 罗荣华
  • 1 篇 zeng jia-an
  • 1 篇 曾嘉安
  • 1 篇 min hua-qing
  • 1 篇 朱金辉

语言

  • 1 篇 中文
检索条件"主题词=状态自动划分"
1 条 记 录,以下是1-10 订阅
排序:
一种状态自动划分的模糊小脑模型关节控制器值函数拟合方法
收藏 引用
控制理论与应用 2011年 第2期28卷 256-260页
作者: 闵华清 曾嘉安 罗荣华 朱金辉 华南理工大学软件学院 广东广州510006 华南理工大学计算机科学与技术学院 广东广州510006
在庞大离散状态空间或连续状态空间中,强化学习(RL)需要进行值函数拟合以寻找最优策略.但函数拟合器的结构往往由设计者预先设定,在学习过程中不能动态调整缺乏自适应性.为了自动构建函数拟合器的结构,提出一种可以进行状态自动划分的... 详细信息
来源: 评论