咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程

主题

  • 1 篇 不动点
  • 1 篇 强化学习
  • 1 篇 俄罗斯方块
  • 1 篇 值函数近似估计
  • 1 篇 贝叶斯优化

机构

  • 1 篇 南京大学
  • 1 篇 淮阴工学院
  • 1 篇 南京邮电大学

作者

  • 1 篇 chen yaoxiong
  • 1 篇 吕咏洲
  • 1 篇 陈兴国
  • 1 篇 巩宇
  • 1 篇 gong yu
  • 1 篇 chen xingguo
  • 1 篇 lü yongzhou
  • 1 篇 陈耀雄

语言

  • 1 篇 中文
检索条件"主题词=值函数近似估计"
1 条 记 录,以下是1-10 订阅
排序:
基于贝叶斯优化的强化学习广义不动点解逼近
收藏 引用
山东大学学报(工学版) 2024年 第4期54卷 21-34页
作者: 陈兴国 吕咏洲 巩宇 陈耀雄 南京邮电大学大数据安全与智能处理重点实验室 江苏南京210023 南京大学计算机软件新技术国家重点试验室 江苏南京210046 淮阴工学院电子信息工程学院 江苏淮安223003
针对强化学习不动点的解更优这一问题,提出广义不动点解模型设计,该设计使用n步自举法的不动点解扩展和基于线性插法的不动点解构造方法。将该设计应用于成熟的CBMPI算法框架上,提出基于广义不动点的CBMPI(n,β)算法。针对如何表达并... 详细信息
来源: 评论