咨询与建议

限定检索结果

文献类型

  • 4 篇 学位论文
  • 3 篇 期刊文献

馆藏范围

  • 7 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 6 篇 工学
    • 5 篇 计算机科学与技术...
    • 4 篇 控制科学与工程
    • 4 篇 软件工程
    • 3 篇 机械工程
    • 1 篇 仪器科学与技术
  • 4 篇 管理学
    • 4 篇 管理科学与工程(可...

主题

  • 7 篇 演员-评论家算法
  • 3 篇 强化学习
  • 3 篇 深度强化学习
  • 1 篇 机械臂抓取与放置
  • 1 篇 注意力机制
  • 1 篇 工作负载分配
  • 1 篇 旅行背包问题
  • 1 篇 近端策略优化
  • 1 篇 交通信号控制
  • 1 篇 多智能体系统
  • 1 篇 图卷积网络
  • 1 篇 高能效负载均衡
  • 1 篇 集中训练,分散执行...
  • 1 篇 组合优化
  • 1 篇 深度神经网络
  • 1 篇 异步优势演员-评论...
  • 1 篇 多智能体地标覆盖...
  • 1 篇 车辆路径问题
  • 1 篇 覆盖控制
  • 1 篇 机器人操作技能

机构

  • 3 篇 燕山大学
  • 1 篇 郑州大学
  • 1 篇 西安电子科技大学
  • 1 篇 浙江理工大学
  • 1 篇 华南理工大学
  • 1 篇 北京理工大学
  • 1 篇 北京建筑大学
  • 1 篇 建筑大数据智能处...
  • 1 篇 嘉兴大学
  • 1 篇 中山大学

作者

  • 1 篇 梁家璇
  • 1 篇 zhang lei
  • 1 篇 郭全盛
  • 1 篇 xia xiaoyun
  • 1 篇 向毅
  • 1 篇 chen zefeng
  • 1 篇 lin jian-xin
  • 1 篇 guo quan-sheng
  • 1 篇 高振峰
  • 1 篇 zhang zheng
  • 1 篇 夏小云
  • 1 篇 赵馨雨
  • 1 篇 李建武
  • 1 篇 xiang yi
  • 1 篇 陈泽丰
  • 1 篇 刘诗诚
  • 1 篇 黄新蕊
  • 1 篇 章政
  • 1 篇 张蕾
  • 1 篇 li jian-wu

语言

  • 7 篇 中文
检索条件"主题词=演员-评论家算法"
7 条 记 录,以下是1-10 订阅
排序:
融合强化学习的分阶段策略求解旅行背包问题
收藏 引用
计算机工程与科学 2025年 第1期47卷 140-149页
作者: 章政 夏小云 陈泽丰 向毅 浙江理工大学计算机科学与技术学院 浙江杭州310018 嘉兴大学人工智能学院 浙江嘉兴314001 中山大学人工智能学院 广东珠海519082 华南理工大学软件学院 广东广州510006
旅行背包问题TTP是传统的旅行商问题和背包问题的结合,属于NP难问题。相较于独立的旅行商问题和背包问题,旅行背包问题更加符合现实情况,具有更高的研究价值。先前的TTP求解算法主要为启发式算法,性能有限,其他类型的算法则研究较少。... 详细信息
来源: 评论
顾及路口压力的A2C交通信号调控
收藏 引用
计算机仿真 2023年 第9期40卷 120-124,139页
作者: 张蕾 郭全盛 林建新 李建武 北京建筑大学电气与信息工程学院 北京100044 建筑大数据智能处理方法研究北京市重点实验室 北京100044 北京建筑大学土木与交通工程学院 北京100044 北京理工大学前沿技术研究院 北京100081
对城市道路交通进行有效地智能化调控,可以缓解拥堵,缩短出行时间,维护社会稳定,有重要的理论价值和实际意义。为此提出顾及路口压力的多智能体Actor-Critic算法。先设计缓解路口压力的强化学习策略,构建基于深度神经网络的多智能体Acto... 详细信息
来源: 评论
基于深度强化学习的多智能体地标覆盖方法研究
基于深度强化学习的多智能体地标覆盖方法研究
收藏 引用
作者: 燕山大学
学位级别:硕士
近年来,随着人工智能技术的不断发展,研究者在单智能体深度强化学习领域取得了许多优秀的成果。为了解决复杂的团队任务,研究人员将深度强化学习方法应用到了多智能体领域。地标覆盖任务是最常见的多智能体协同问题之一,在国防、物流、... 详细信息
来源: 评论
基于深度强化学习的多智能体覆盖控制研究
基于深度强化学习的多智能体覆盖控制研究
收藏 引用
作者: 刘诗诚 燕山大学
学位级别:硕士
近年来,随着人工智能技术的不断开拓和智能体领域的不断深入,单智能体深度强化学习领域产出了许多优秀成果。为了解决较复杂的团队任务,深度强化学习逐渐被引入至多智能体范畴中。在多智能体系统中,多智能体覆盖控制任务是最典型的多智... 详细信息
来源: 评论
数据中心高能效负载均衡算法研究
数据中心高能效负载均衡算法研究
收藏 引用
作者: 高振峰 西安电子科技大学
学位级别:硕士
随着云服务的迅猛发展,数据中心的规模和数量需要不断扩大。然而,随之而来的巨大能源消耗阻碍了数据中心的广泛部署,大幅增加了云服务运营商的成本。因此,数据中心的高能效技术显得尤为重要。基于工作负载分配的负载均衡技术可以通过调... 详细信息
来源: 评论
基于强化学习算法的机械臂PAP操作技能学习研究
基于强化学习算法的机械臂PAP操作技能学习研究
收藏 引用
作者: 黄新蕊 燕山大学
学位级别:硕士
随着人工智能的迅速发展,强化学习逐渐成为机器人操作技能学习研究的重点算法之一。针对在机器人操作技能学习阶段面临的周期长、成本高和效率低等诸多难题,设计出具备一定自主决策和学习能力的机器人操作技能学习算法成为机器学习研究... 详细信息
来源: 评论
基于深度强化学习的车辆路径规划算法设计
收藏 引用
数字化用户 2023年 第23期29卷 270-272页
作者: 赵馨雨 郑州大学信息管理学院 河南 郑州 450001
本文针对带容量约束的车辆路径问题提出了一种基于深度强化学习的车辆路径规划算法,该算法使用改进指针网络作为策略函数,利用结合指数移动平均的演员-评论家算法进行参数更新。实验结果表明,该算法在不同规模的CVRP问题上均优于启... 详细信息
来源: 评论