咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程

主题

  • 1 篇 深度强化学习
  • 1 篇 深度q学习算法(dq...
  • 1 篇 深度确定性策略梯...
  • 1 篇 随机方差缩减梯度...

机构

  • 1 篇 苏州科技大学
  • 1 篇 珠海米枣智能科技...

作者

  • 1 篇 fu qiming
  • 1 篇 chen jianping
  • 1 篇 yang xueyu
  • 1 篇 傅启明
  • 1 篇 wu hongjie
  • 1 篇 吴宏杰
  • 1 篇 陈建平
  • 1 篇 lu you
  • 1 篇 陆悠
  • 1 篇 杨薛钰

语言

  • 1 篇 中文
检索条件"主题词=随机方差缩减梯度技术"
1 条 记 录,以下是1-10 订阅
排序:
基于随机方差减小方法的DDPG算法
收藏 引用
计算机工程与应用 2021年 第19期57卷 104-111页
作者: 杨薛钰 陈建平 傅启明 陆悠 吴宏杰 苏州科技大学电子与信息工程学院 江苏苏州215009 苏州科技大学江苏省建筑智慧节能重点实验室 江苏苏州215009 苏州科技大学苏州市移动网络技术与应用重点实验室 江苏苏州215009 珠海米枣智能科技有限公司 广东珠海519000 苏州科技大学苏州市虚拟现实智能交互与应用技术重点实验室 江苏苏州215009
针对深度确定性策略梯度算法(DDPG)收敛速度比较慢,训练不稳定,方差过大,样本应用效率低的问题,提出了一种基于随机方差减小梯度方法的深度确定性策略梯度算法(SVR-DDPG)。该算法通过利用随机方差减小梯度技术(SVRG)提出一种新的创新优... 详细信息
来源: 评论