咨询与建议

限定检索结果

文献类型

  • 12 篇 期刊文献
  • 4 篇 学位论文

馆藏范围

  • 16 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 16 篇 工学
    • 10 篇 控制科学与工程
    • 9 篇 计算机科学与技术...
    • 9 篇 软件工程
    • 6 篇 航空宇航科学与技...
    • 3 篇 机械工程
    • 2 篇 仪器科学与技术
    • 2 篇 动力工程及工程热...
    • 2 篇 电气工程
    • 2 篇 电子科学与技术(可...
    • 2 篇 信息与通信工程
    • 1 篇 交通运输工程
  • 8 篇 管理学
    • 8 篇 管理科学与工程(可...

主题

  • 16 篇 双延迟深度确定性...
  • 6 篇 无人机
  • 4 篇 深度强化学习
  • 3 篇 路径规划
  • 2 篇 双策略网络
  • 2 篇 航迹规划
  • 2 篇 深度强化学习算法
  • 1 篇 优先经验回放
  • 1 篇 边缘缓存
  • 1 篇 改进深度强化学习
  • 1 篇 低碳经济调度
  • 1 篇 机器人控制
  • 1 篇 强化学习
  • 1 篇 倒立摆系统
  • 1 篇 无人机通信
  • 1 篇 可重构智能表面
  • 1 篇 光伏并网系统
  • 1 篇 综合能源系统
  • 1 篇 长短期记忆神经网...
  • 1 篇 配电网电压控制

机构

  • 2 篇 昆明理工大学
  • 2 篇 陆军工程大学
  • 2 篇 哈尔滨工程大学
  • 1 篇 湖南工业大学
  • 1 篇 南京信息职业技术...
  • 1 篇 华东交通大学
  • 1 篇 华北电力大学
  • 1 篇 国网江苏省电力有...
  • 1 篇 昆明云内动力股份...
  • 1 篇 安徽大学
  • 1 篇 四川大学
  • 1 篇 东北石油大学
  • 1 篇 河海大学
  • 1 篇 江南大学
  • 1 篇 济南大学

作者

  • 2 篇 高喜俊
  • 2 篇 gao xijun
  • 2 篇 蒋方庆
  • 2 篇 陈自力
  • 2 篇 chen zili
  • 2 篇 jiang fangqing
  • 1 篇 何若俊
  • 1 篇 李映君
  • 1 篇 何虹辉
  • 1 篇 duan longjin
  • 1 篇 王春峰
  • 1 篇 张来伟
  • 1 篇 陶莹
  • 1 篇 he ruojun
  • 1 篇 张云
  • 1 篇 dong chunchao
  • 1 篇 贺道坤
  • 1 篇 赵思
  • 1 篇 li yahui
  • 1 篇 he daokun

语言

  • 16 篇 中文
检索条件"主题词=双延迟深度确定性策略梯度算法"
16 条 记 录,以下是1-10 订阅
排序:
基于自主探索的移动机器人路径规划研究
收藏 引用
计算机工程 2025年 第1期51卷 60-70页
作者: 陈浩 陈珺 刘飞 江南大学轻工过程先进控制教育部重点实验室 江苏无锡214122
移动机器人在路径规划过程中,当面对未知且动态变化的环境时,会存在与障碍物碰撞率高、易陷入局部最优等问题。针对这些问题,提出一种基于延迟深度确定性策略梯度(TD3)算法的改进算法TD3pro,以提高移动机器人在未知动态环境下的路径... 详细信息
来源: 评论
基于改进TD3的RIS-无人机通信系统能效优化
收藏 引用
西安电子科技大学学报 2025年
作者: 王翊 邓毓 许耀华 蒋芳 江福林 胡艳军 安徽大学信息材料与智能感知安徽省实验室
考虑到可重构智能表面(RIS)辅助的无人机 (UAV) 通信系统中存在多个移动用户的情况,研究了UAV的飞行能耗对系统能效的影响,通过联合优化UAV轨迹与主动波束赋形以及RIS相移设计以提升系统能效。由于目标函数是非凸的且优化变量耦合,... 详细信息
来源: 评论
面向物联网数据收集的无人机自主路径规划
收藏 引用
航空学报 2024年 第8期45卷 229-243页
作者: 张薇 何若俊 哈尔滨工程大学信息与通信工程学院 哈尔滨150001
路径规划旨在为无人机(UAV)提供安全可靠的行进路径,而实际环境的动态性极大地增加了路径规划的难度。本文针对物联网(IoT)节点处的数据收集问题,构建了一个复杂的3D动态环境,在多评论家深度确定性梯度算法(MCDDPG)的基础上提出一种基... 详细信息
来源: 评论
基于深度强化学习的增程式电动轻卡能量管理策略
收藏 引用
内燃机工程 2023年 第6期44卷 90-99页
作者: 段龙锦 王贵勇 王伟超 何述超 昆明理工大学云南省内燃机重点实验室 昆明650500 昆明云内动力股份有限公司 昆明650500
为了解决增程式电动轻卡辅助动力单元(auxiliary power units,APU)和动力电池之间能量的合理分配问题,在Simulink中建立面向控制的仿真模型,并提出一种基于延迟深度确定性策略梯度(twin delayed deep deterministic policy gradient,T... 详细信息
来源: 评论
基于改进TD3算法的无人机区域侦察研究
收藏 引用
飞行力学 2024年 第6期42卷 36-42页
作者: 蒋方庆 陈自力 高喜俊 张云 陆军工程大学 河北石家庄050003
在执行区域侦察任务时,无人机需要更高性能的算法,以便对未知辐射源目标进行快速准确定位。利用改进的延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient,TD3)算法实现无人机快速侦察目标。针对TD3算法的单策... 详细信息
来源: 评论
基于深度强化学习的单臂机器人末端姿态控制
收藏 引用
济南大学学报(自然科学版) 2022年 第5期36卷 616-625,634页
作者: 范振 陈乃建 董春超 张来伟 包佳伟 李亚辉 李映君 济南大学机械工程学院 山东济南250022
基于双延迟深度确定性策略梯度算法对单臂机器人倒立摆在Simulink软件环境中进行仿真,并与深度确定性策略梯度算法进行比较,验证该算法的控制精度以及在机器人控制中的应用可行性;建立单臂机器人倒立摆仿真模型,添加摩擦模型,并以单臂... 详细信息
来源: 评论
基于TD3算法的光伏电站参与电力系统频率控制策略
收藏 引用
郑州大学学报(工学版) 2024年
作者: 张建华 陶莹 赵思 华北电力大学控制与计算机工程学院
针对光伏电力输出具有间歇性和随机性对维持电力系统频率稳定构成的挑战,提出了一种基于双延迟深度确定性策略梯度算法的快速频率调节方法,该方法无须依赖特定的机理模型,适用于解决与光伏发电相关的强不确定性问题。首先,构建了一个简... 详细信息
来源: 评论
基于扰动流体与TD3的无人机路径规划算法
收藏 引用
电光与控制 2024年 第1期31卷 57-62页
作者: 陈康雄 刘磊 河海大学 南京211000
针对延迟深度确定性策略梯度(TD3)算法存在的动作选取随机性低的问题,在TD3算法中依正态分布进行动作选取,并依据扰动流体路径规划方法在路径平滑度上较高的优势,提出一种基于扰动流体与TD3算法的无人机路径规划框架,将其用于解决动... 详细信息
来源: 评论
动态威胁环境下基于深度强化学习的无人机航迹规划研究
动态威胁环境下基于深度强化学习的无人机航迹规划研究
收藏 引用
作者: 赵鹏杰 哈尔滨工程大学
学位级别:硕士
航迹规划是确保无人机飞行、侦察与打击等任务成功的关键,直接影响无人机的执行效率、安全性和隐蔽性。随着战场环境的愈发复杂,并发合作任务量增大,对无人机航迹规划的安全隐蔽飞行、多机联合协作提出新的挑战。本文结合单智能体深度... 详细信息
来源: 评论
基于深度强化学习算法的无人驾驶智能控制策略研究
基于深度强化学习算法的无人驾驶智能控制策略研究
收藏 引用
作者: 孙超 东北石油大学
学位级别:硕士
随着人工智能、5G等前沿技术的高速发展,以及人类对驾驶车辆安全性、缓解交通拥堵等方面的急切需求,智能汽车已成为现代汽车工业的发展重点,将人工智能算法与无人驾驶技术相结合已成为现阶段各国学者的研究热点。深度强化学习(DRL)作为... 详细信息
来源: 评论