咨询与建议

限定检索结果

文献类型

  • 59 篇 学位论文
  • 51 篇 期刊文献
  • 1 篇 会议

馆藏范围

  • 111 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 110 篇 工学
    • 56 篇 软件工程
    • 48 篇 控制科学与工程
    • 48 篇 计算机科学与技术...
    • 36 篇 机械工程
    • 21 篇 仪器科学与技术
    • 15 篇 航空宇航科学与技...
    • 12 篇 电气工程
    • 12 篇 交通运输工程
    • 8 篇 信息与通信工程
    • 8 篇 船舶与海洋工程
    • 7 篇 电子科学与技术(可...
    • 4 篇 动力工程及工程热...
    • 2 篇 建筑学
    • 2 篇 土木工程
    • 2 篇 矿业工程
    • 2 篇 农业工程
    • 2 篇 环境科学与工程(可...
    • 2 篇 公安技术
    • 1 篇 力学(可授工学、理...
    • 1 篇 光学工程
  • 42 篇 管理学
    • 42 篇 管理科学与工程(可...
  • 6 篇 经济学
    • 6 篇 应用经济学
  • 3 篇 理学
    • 3 篇 系统科学
  • 1 篇 农学
    • 1 篇 水产
  • 1 篇 医学
    • 1 篇 公共卫生与预防医...
  • 1 篇 艺术学

主题

  • 111 篇 ddpg算法
  • 42 篇 深度强化学习
  • 17 篇 强化学习
  • 8 篇 路径规划
  • 5 篇 dqn算法
  • 5 篇 自动驾驶
  • 4 篇 马尔可夫决策过程
  • 3 篇 移动机器人
  • 3 篇 深度学习
  • 3 篇 电力市场
  • 2 篇 机械臂
  • 2 篇 rbf神经网络
  • 2 篇 运行优化
  • 2 篇 参数辨识
  • 2 篇 移动边缘计算
  • 2 篇 sac算法
  • 2 篇 td3算法
  • 2 篇 ou噪声
  • 2 篇 多智能体
  • 2 篇 自适应控制

机构

  • 6 篇 哈尔滨工业大学
  • 3 篇 苏州科技大学
  • 3 篇 大连理工大学
  • 3 篇 兰州交通大学
  • 3 篇 上海电力大学
  • 3 篇 哈尔滨工程大学
  • 2 篇 上海工程技术大学
  • 2 篇 华中科技大学
  • 2 篇 湖南工业大学
  • 2 篇 东南大学
  • 2 篇 江苏大学
  • 2 篇 安徽理工大学
  • 2 篇 四川大学
  • 2 篇 江苏方天电力技术...
  • 2 篇 西安工业大学
  • 2 篇 南京航空航天大学
  • 2 篇 华南理工大学
  • 2 篇 南京理工大学
  • 1 篇 广西工业职业技术...
  • 1 篇 贵港市人民医院

作者

  • 2 篇 li cheng
  • 2 篇 马丽莹
  • 2 篇 李澄
  • 2 篇 焦龙飞
  • 2 篇 殷雨竹
  • 2 篇 葛永高
  • 1 篇 xu liyou
  • 1 篇 wang yuechen
  • 1 篇 xu wenxiang
  • 1 篇 dai yuxuan
  • 1 篇 崔岂铨
  • 1 篇 yan gangui
  • 1 篇 huang guan
  • 1 篇 宋雨桐
  • 1 篇 fu hua
  • 1 篇 茆寒
  • 1 篇 xu jialin
  • 1 篇 问虎龙
  • 1 篇 刘斌
  • 1 篇 墨斌

语言

  • 111 篇 中文
检索条件"主题词=DDPG算法"
111 条 记 录,以下是41-50 订阅
排序:
基于深度强化学习的湿法脱硫系统运行优化
收藏 引用
系统科学与数学 2022年 第5期42卷 1067-1087页
作者: 吴磊 康英伟 上海电力大学自动化工程学院 上海200090
针对传统石灰石/石膏湿法烟气脱硫(WFGD)系统运行优化方式适应性不强,效率低,资源消耗大等问题,提出了一种基于数据驱动建模和深度强化学习的脱硫系统运行优化方法.首先为解决传统PCA只能衡量特征变量间线性关系的局限性,将互信息(MI)引... 详细信息
来源: 评论
基于ddpg深度强化学习的电站脱硝过程优化控制
收藏 引用
计算机测量与控制 2022年 第10期30卷 132-139页
作者: 林康威 肖红 姜文超 杨建仁 熊广思 黄冠儒 广东工业大学计算机学院 广州510006 广州云硕科技发展有限公司 广州511458
针对选择性催化还原(SCR,selective catalytic reduction)脱硝系统脱硝过程存在非线性、多工况等复杂特点,提出一种基于MiniBatchKMeans聚类与Stacking模型融合的SCR脱硝过程NO_(X)预测方法;该方法通过应用MiniBatchKMeans聚类算法对训... 详细信息
来源: 评论
基于深度学习的湿法冶金全流程分层优化及仿真算法分析研究
收藏 引用
湿法冶金 2024年
作者: 何丹 褚新建 马晓晓 贾钰峰 新疆科技学院信息科学与工程学院
研究提出了一种基于深度学习的湿法冶金全流程分层优化模型。模型采用分层设计,包括工序层优化和过程层优化。在工序层创新引入Transformer模型建立物耗与质量指标的非线性映射模型,以最小物耗为目标优化各工序参数。在过程层创新引入... 详细信息
来源: 评论
基于深度学习的智能驾驶车辆路径仿真研究
收藏 引用
中南民族大学学报(自然科学版) 2022年 第5期41卷 586-591页
作者: 何倩 仝武宁 陕西中医药大学计算机实验中心 咸阳712000
基于深度强化学习技术研究了智能驾驶中的路径规划问题,且在虚拟环境下进行了模拟分析,对提出的路径规划算法性能做了验证研究.提出了一种改进的经验回放机制ERddpg(Experience Replay Deep Deterministic Policy Gradient)算法,对经验... 详细信息
来源: 评论
基于增量式发育深度强化学习的无人机路径规划
收藏 引用
飞行力学 2023年 第3期41卷 40-46页
作者: 杨秀霞 王晨蕾 张毅 于浩 姜子劼 海军航空大学 山东烟台264000
为了克服深度强化学习训练时间长、收敛速度慢的问题,针对密集动态障碍环境下的无人机(UAV)路径规划,引入了增量式发育知识库,对深度确定性策略梯度(Deep Deterministic Policy Gradient,ddpg)算法进行改进。首先,根据模糊匹配的思想建... 详细信息
来源: 评论
具有优先级的深度确定性策略梯度算法在自动驾驶中的应用
收藏 引用
上海大学学报(自然科学版) 2023年 第1期29卷 105-117页
作者: 金彦亮 刘千红 季泽宇 上海大学通信与信息工程学院 上海200444 不详
深度确定性策略梯度(deep deterministic policy gradient,ddpg)算法在自动驾驶领域中应用广泛,但ddpg算法因采用均匀采样而导致低效率策略比例较高、训练效率低、收敛速度慢等.提出了基于优先级的深度确定性策略梯度(priority-based DD... 详细信息
来源: 评论
基于强化学习的煤矸石分拣机械臂智能控制算法研究
收藏 引用
工矿自动化 2021年 第1期47卷 36-42页
作者: 张永超 于智伟 丁丽林 山东科技大学机械电子工程学院 山东青岛266590
针对传统煤矸石分拣机械臂控制算法如抓取函数法、基于费拉里法的动态目标抓取算法等依赖于精确的环境模型、且控制过程缺乏自适应性,传统深度确定性策略梯度(ddpg)等智能控制算法存在输出动作过大及稀疏奖励容易被淹没等问题,对传统DDP... 详细信息
来源: 评论
适用于强化学习惯性环境的分数阶改进OU噪声
收藏 引用
四川大学学报(自然科学版) 2023年 第2期60卷 57-63页
作者: 王涛 张卫华 蒲亦非 四川大学计算机学院 成都610065
本文将ddpg算法中使用的Ornstein-Uhlenbeck(OU)噪声整数阶微分模型推广为分数阶OU噪声模型,使得噪声的产生不仅和前一步的噪声有关而且和前K步产生的噪声都有关联.通过在gym惯性环境下对比基于分数阶OU噪声的ddpg和TD3算法和原始的ddpg... 详细信息
来源: 评论
基于深度强化学习的自动驾驶车控制算法研究
收藏 引用
郑州大学学报(工学版) 2020年 第4期41卷 41-45,80页
作者: 王丙琛 司怀伟 谭国真 大连理工大学计算机科学与技术学院 辽宁大连116000
为了提高基于强化学习的自动驾驶车控制算法的学习效率,提出了一种结合专家经验的自动驾驶策略学习算法(deep deterministic policy gridient with expert,ddpgwE)。ddpgwE采用基于ddpg的强化学习框架进行模型在线训练,使用真实的人类... 详细信息
来源: 评论
基于深度强化学习的金融交易算法实证研究
基于深度强化学习的金融交易算法实证研究
收藏 引用
作者: 李尚宜 东南大学
学位级别:硕士
深度强化学习是机器学习领域的一门新兴学科,它结合了深度学习的感知能力以及强化学习的控制决策能力。基于深度强化学习的金融交易算法可以从市场数据中学习到从金融市场的状态表示到交易决策的映射。相比传统交易算法的建立,它不依赖... 详细信息
来源: 评论