咨询与建议

限定检索结果

文献类型

  • 155 篇 期刊文献
  • 110 篇 学位论文
  • 4 篇 会议

馆藏范围

  • 269 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 264 篇 工学
    • 118 篇 软件工程
    • 112 篇 计算机科学与技术...
    • 109 篇 控制科学与工程
    • 76 篇 机械工程
    • 60 篇 仪器科学与技术
    • 44 篇 信息与通信工程
    • 40 篇 电子科学与技术(可...
    • 37 篇 交通运输工程
    • 34 篇 电气工程
    • 15 篇 航空宇航科学与技...
    • 11 篇 动力工程及工程热...
    • 7 篇 公安技术
    • 4 篇 材料科学与工程(可...
    • 4 篇 兵器科学与技术
    • 4 篇 网络空间安全
    • 3 篇 土木工程
    • 2 篇 建筑学
    • 2 篇 船舶与海洋工程
    • 2 篇 环境科学与工程(可...
    • 1 篇 水利工程
  • 95 篇 管理学
    • 95 篇 管理科学与工程(可...
  • 12 篇 军事学
    • 7 篇 军队指挥学
    • 4 篇 军事装备学
    • 2 篇 战术学
  • 9 篇 经济学
    • 9 篇 应用经济学
  • 4 篇 理学
    • 2 篇 数学
    • 1 篇 大气科学
    • 1 篇 系统科学
    • 1 篇 统计学(可授理学、...
  • 1 篇 文学
    • 1 篇 新闻传播学
  • 1 篇 艺术学

主题

  • 269 篇 深度确定性策略梯...
  • 80 篇 深度强化学习
  • 64 篇 强化学习
  • 17 篇 路径规划
  • 12 篇 资源分配
  • 11 篇 无人机
  • 10 篇 移动边缘计算
  • 10 篇 深度q网络
  • 9 篇 深度学习
  • 7 篇 优先经验回放
  • 7 篇 轨迹规划
  • 6 篇 任务卸载
  • 6 篇 优化调度
  • 6 篇 自动驾驶
  • 5 篇 模型预测控制
  • 5 篇 无人驾驶
  • 5 篇 多智能体系统
  • 5 篇 多智能体
  • 5 篇 车联网
  • 4 篇 机械臂

机构

  • 16 篇 吉林大学
  • 10 篇 南京航空航天大学
  • 8 篇 哈尔滨工业大学
  • 7 篇 中国科学院大学
  • 7 篇 东南大学
  • 7 篇 西北工业大学
  • 7 篇 北京邮电大学
  • 6 篇 哈尔滨工程大学
  • 5 篇 四川大学
  • 5 篇 电子科技大学
  • 5 篇 华南理工大学
  • 5 篇 北京理工大学
  • 5 篇 东北大学
  • 4 篇 大连理工大学
  • 4 篇 华北电力大学
  • 4 篇 西安电子科技大学
  • 4 篇 河北工业大学
  • 3 篇 长安大学
  • 3 篇 苏州科技大学
  • 3 篇 北京科技大学

作者

  • 3 篇 陈建文
  • 2 篇 孙毅
  • 2 篇 张小俊
  • 2 篇 成贵学
  • 2 篇 王新迎
  • 2 篇 fu qiming
  • 2 篇 张津源
  • 2 篇 林碧琳
  • 2 篇 chen jianping
  • 2 篇 李孟凡
  • 2 篇 陈盛
  • 2 篇 liu xin
  • 2 篇 高东
  • 2 篇 袁鑫
  • 2 篇 gao ang
  • 2 篇 zhang qian
  • 2 篇 韩鹏
  • 2 篇 cheng guixue
  • 2 篇 li juan
  • 2 篇 周翔

语言

  • 269 篇 中文
检索条件"主题词=深度确定性策略梯度"
269 条 记 录,以下是1-10 订阅
排序:
改进型深度确定性策略梯度的无人机路径规划
收藏 引用
系统仿真学报 2025年 第4期37卷 875-881页
作者: 张森 代强强 河南科技大学信息工程学院 河南洛阳471023
针对无人机在复杂环境下进行路径规划时,存在收敛性差和无效探索等问题,提出一种改进型深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法。采用双经验池机制,分别存储成功经验和失败经验,算法能够利用成功经验强化策... 详细信息
来源: 评论
基于深度确定性策略梯度算法的股票投资组合策略研究
收藏 引用
东北师大学报(自然科学版) 2025年 第1期57卷 29-34页
作者: 董小刚 韩元元 秦喜文 长春工业大学数学与统计学院 吉林长春130012 吉林省数据科学与智能决策重点实验室 吉林长春130012
为构建更加全面有效的投资组合,采用了深度确定性策略梯度算法,并在奖励函数中引入了风险衡量指标索提诺比率来实现风险与收益之间的权衡.除基本的股票数据外还将股票市场中的技术指标作为状态的输入,以捕捉股票市场的主要趋势.经数据检... 详细信息
来源: 评论
深度确定性策略梯度算法用于无人飞行器控制
收藏 引用
航空学报 2021年 第11期42卷 397-407页
作者: 黄旭 柳嘉润 贾晨辉 王昭磊 张隽 北京航天自动控制研究所 北京100854 宇航智能控制技术国家级重点实验室 北京100854
深度确定性策略梯度算法训练智能体学习小型无人飞行器的飞行控制策略进行了探索研究。以多数据帧的速度、位置和姿态角等信息作为智能体的观察状态,舵摆角和发动机推力指令作为智能体的输出动作,飞行器的非线性模型和飞行环境作为智... 详细信息
来源: 评论
深度确定性策略梯度和预测相结合的无人机空战决策研究
收藏 引用
西北工业大学学报 2023年 第1期41卷 56-64页
作者: 李永丰 吕永玺 史静平 李卫华 西北工业大学自动化学院 陕西西安710129 陕西省飞行控制与仿真技术重点实验室 陕西西安710129
针对无人机自主空战机动决策过程中遇到的敌方不确定性操纵问题,提出了一种目标机动指令预测和深度确定性策略梯度算法相结合的无人机空战自主机动决策方法。对空战双方的态势数据进行有效的融合和处理,搭建无人机六自由度模型和机动动... 详细信息
来源: 评论
深度确定性策略梯度学习的火星无人机控制
收藏 引用
计算机工程与应用 2023年 第8期59卷 288-296页
作者: 孙丹 郑建华 高东 韩鹏 中国科学院国家空间科学中心 北京100190 中国科学院大学 北京100049
为了降低控制器设计对火星无人机动力学模型的依赖,提高火星无人机控制系统的智能化水平,结合强化学习(reinforcement learning,RL)算法,提出了一种具有自主学习能力的火星无人机位置姿态控制器。该控制器由神经网络构成,利用深度确定... 详细信息
来源: 评论
深度确定性策略梯度算法优化
收藏 引用
辽宁工程技术大学学报(自然科学版) 2020年 第6期39卷 545-549页
作者: 刘洋 李建军 辽宁工程技术大学理学院 辽宁阜新123000
针对深度确定性策略梯度算法存在的经验利用率不高和性能差的问题,提出一种基于深度确定性策略梯度算法的复合优先经验回放算法.利用样本的立即回报和基于样本时间差分误差分别构建优先级对样本排序,随后对经验进行复合平均排序并基于... 详细信息
来源: 评论
深度确定性策略梯度算法耦合模型驱动的行人过街仿真
收藏 引用
上海大学学报(自然科学版) 2023年 第4期29卷 651-665页
作者: 宋涛 王彦林 魏昕恺 韦艳芳 湖州师范学院理学院 浙江湖州313000 湖州市数据建模与分析重点实验室 浙江湖州313000 玉林师范学院物理与电信工程学院 广西玉林537000
行人仿真在公共安全研究中扮演着重要的角色,但如何增强仿真环境中智能体的真实性一直是一个难题.本工作提出了一种深度确定性策略梯度-行人二维优化速度模型耦合驱动算法,并对无信号交叉口行人过街行为进行仿真.通过构建考虑无速度差... 详细信息
来源: 评论
基于深度确定性策略梯度的星地融合网络可拆分任务卸载算法
收藏 引用
通信学报 2024年 第10期45卷 116-128页
作者: 宋晓勤 吴志豪 赖海光 雷磊 张莉涓 吕丹阳 郑成辉 南京航空航天大学电子信息工程学院 江苏南京210016 东南大学移动通信全国重点实验室 江苏南京210096 南京控维通信科技有限公司 江苏南京211135
为解决低轨卫星网络中星地链路任务卸载时延长的问题,提出了一种基于深度确定性策略梯度(DDPG)的星地融合网络可拆分任务卸载算法。针对不同地区用户建立了星地融合网络的多接入边缘计算结构模型,通过应用多智能体DDPG算法,将系统总服... 详细信息
来源: 评论
基于多动作并行异步深度确定性策略梯度的选矿运行指标决策方法
收藏 引用
控制与决策 2022年 第8期37卷 1989-1996页
作者: 李悄然 丁进良 东北大学流程工业综合自动化国家重点实验室 沈阳110004
为了解决深度确定性策略梯度算法探索能力不足的问题,提出一种多动作并行异步深度确定性策略梯度(MPADDPG)算法,并用于选矿运行指标强化学习决策.该算法使用多个actor网络,进行不同的初始化和训练,不同程度地提升了探索能力,同时通过扩... 详细信息
来源: 评论
基于深度确定性策略梯度学习的无线反向散射数据卸载优化
收藏 引用
兵工学报 2021年 第12期42卷 2655-2663页
作者: 耿天立 高昂 王琦 段渭军 胡延苏 西北工业大学电子信息学院 陕西西安710072 物联网技术及应用国家地方联合工程实验室 陕西西安710072 长安大学电子与控制学院 陕西西安710072
无线驱动通信网络中,无线设备(WD)可以通过无线反向散射和主动射频传输两种方式进行数据卸载。如何合理分配系统中WD的主动传输和反向散射传输工作模式及其对应的工作时间,从而减小传输延迟、提高传输效率就显得尤为必要。在综合考虑卸... 详细信息
来源: 评论