咨询与建议

限定检索结果

文献类型

  • 3,245 篇 专利
  • 73 篇 学位论文
  • 48 篇 期刊文献
  • 9 篇 会议
  • 2 篇 报纸

馆藏范围

  • 3,377 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 122 篇 工学
    • 58 篇 控制科学与工程
    • 56 篇 计算机科学与技术...
    • 56 篇 软件工程
    • 34 篇 机械工程
    • 34 篇 仪器科学与技术
    • 17 篇 电子科学与技术(可...
    • 15 篇 信息与通信工程
    • 12 篇 交通运输工程
    • 9 篇 动力工程及工程热...
    • 9 篇 电气工程
    • 6 篇 航空宇航科学与技...
    • 3 篇 土木工程
    • 2 篇 建筑学
    • 2 篇 公安技术
    • 1 篇 材料科学与工程(可...
    • 1 篇 水利工程
    • 1 篇 船舶与海洋工程
    • 1 篇 核科学与技术
    • 1 篇 农业工程
    • 1 篇 生物医学工程(可授...
  • 64 篇 管理学
    • 63 篇 管理科学与工程(可...
    • 3 篇 工商管理
  • 8 篇 经济学
    • 8 篇 应用经济学
  • 8 篇 理学
    • 5 篇 系统科学
    • 2 篇 数学
    • 1 篇 天文学
    • 1 篇 大气科学
  • 4 篇 艺术学
    • 4 篇 设计学(可授艺术学...
  • 2 篇 医学
  • 1 篇 哲学
    • 1 篇 哲学
  • 1 篇 教育学
    • 1 篇 教育学

主题

  • 132 篇 强化学习算法
  • 9 篇 人工智能
  • 7 篇 路径规划
  • 6 篇 机器学习
  • 5 篇 神经网络
  • 4 篇 供应链管理
  • 4 篇 多智能体
  • 4 篇 多agent系统
  • 4 篇 智能体
  • 3 篇 柴油机调速
  • 3 篇 移动边缘计算
  • 3 篇 移动机器人
  • 3 篇 马尔可夫决策过程
  • 3 篇 硬件在环
  • 3 篇 计算卸载
  • 3 篇 资源分配
  • 3 篇 电力市场
  • 2 篇 机械臂
  • 2 篇 预防维修
  • 2 篇 pid控制器

机构

  • 99 篇 东南大学
  • 74 篇 清华大学
  • 65 篇 国家电网有限公司
  • 65 篇 北京邮电大学
  • 64 篇 南京大学
  • 63 篇 哈尔滨工业大学
  • 63 篇 电子科技大学
  • 60 篇 南京航空航天大学
  • 60 篇 北京航空航天大学
  • 53 篇 西北工业大学
  • 53 篇 南京邮电大学
  • 52 篇 浙江大学
  • 49 篇 北京理工大学
  • 46 篇 天津大学
  • 43 篇 北京工业大学
  • 40 篇 重庆邮电大学
  • 40 篇 华南理工大学
  • 39 篇 同济大学
  • 38 篇 大连理工大学
  • 36 篇 浙江工业大学

作者

  • 30 篇 俞扬
  • 24 篇 周志华
  • 23 篇 詹德川
  • 18 篇 黄亮
  • 18 篇 肖亮
  • 15 篇 王涛
  • 15 篇 余亮
  • 14 篇 钱丽萍
  • 14 篇 王伟
  • 14 篇 吴远
  • 14 篇 姚海鹏
  • 14 篇 张海君
  • 13 篇 秦熔均
  • 13 篇 岳东
  • 13 篇 孙长银
  • 13 篇 袁雷
  • 13 篇 陈虹
  • 13 篇 刘洋
  • 12 篇 王超
  • 12 篇 王晓飞

语言

  • 3,377 篇 中文
检索条件"主题词=强化学习算法"
3377 条 记 录,以下是1-10 订阅
排序:
人在回路的深度强化学习算法及其在自动驾驶智能决策中的应用
收藏 引用
Engineering 2023年 第2期21卷 75-91,M0004页
作者: 吴京达 黄志宇 胡中旭 吕辰 School of Mechanical and Aerospace Engineering Nanyang Technological UniversitySingapore 639798Singapore
由于机器学习智力和能力有限,它目前仍无法处理各种情况,因此不能在现实应用中完全取代人类。因为人类在复杂场景中表现出稳健性和适应性,所以将人类引入人工智能(AI)的训练循环并利用人类智慧进一步提升机器学习算法变得至关重要。本... 详细信息
来源: 评论
强化学习算法中启发式回报函数的设计及其收敛性分析
收藏 引用
计算机科学 2005年 第3期32卷 190-193页
作者: 魏英姿 赵明扬 中国科学院沈阳自动化所机器人学重点实验室 沈阳110016沈阳理工大学沈阳110168中国科学院研究生北京100039 中国科学院沈阳自动化所机器人学重点实验室 沈阳110016
(中国科学院沈阳自动化所机器人学重点实验室沈阳110016)
来源: 评论
基于模拟退火-强化学习算法的船舶运动控制
收藏 引用
系统仿真学报 2006年 第5期18卷 1278-1282页
作者: 叶光 郭晨 大连海事大学自动化与电气工程学院 大连116026
船舶运动控制与航行的安全性、可操纵性和经济性密切相关。本文基于模拟退火-强化学习算法提出了一种混合智能控制器,应用于船舶运动航向控制中。这种混合智能控制器发挥了各种智能算法的优势,能够克服风、浪、流等外界的干扰,船舶操纵... 详细信息
来源: 评论
平均报酬模型的多步强化学习算法
收藏 引用
控制理论与应用 2000年 第5期17卷 660-664页
作者: 胡光华 吴沧浦 北京理工大学自动控制系 北京100081
讨论模型未知的平均报酬强化学习算法 .通过结合即时差分学习与R学习算法 ,将折扣问题中的一些方法推广到了平均准则问题中 ,提出了两类算法 :R(λ)学习与截断即时差分TTD(λ)学习 .现有的R学习可视为R(λ)学习和TTD(λ)学习当λ=0时的... 详细信息
来源: 评论
基于神经网络的强化学习算法研究
收藏 引用
计算机研究与发展 2002年 第8期39卷 981-985页
作者: 陆鑫 高阳 李宁 陈世福 南京大学计算机软件新技术国家重点实验室 南京210093
BP神经网络在非线性控制系统中被广泛运用 ,但作为有导师监督的学习算法 ,要求批量提供输入输出对对神经网络训练 ,而在一些并不知道最优策略的系统中 ,这样的输入输出对事先并无法得到 ;另一方面 ,强化学习从实际系统学习经验来调整策... 详细信息
来源: 评论
多Agent系统的协作及强化学习算法研究
收藏 引用
模式识别与人工智能 2002年 第4期15卷 453-457页
作者: 郑淑丽 韩江洪 骆祥峰 蒋建文 合肥工业大学计算机学院 合肥230009
研究了多Agent环境下的协作与学习.对多Agent系统中的协作问题提出了协作模型MACM,该模型通过提供灵活协调机制支持多Agent之间的协作及协作过程中的学习.系统中的学习Agent采用分布式强化学习算法.该算法通过映射减少Q值表的存储空间,... 详细信息
来源: 评论
基于强化学习算法的静止同步补偿电压控制器
收藏 引用
电网技术 2004年 第19期28卷 9-13页
作者: 郭红霞 吴捷 刘永强 王春茹 华南理工大学电力学院 广东省广州市510640
强化学习算法应用于静止同步补偿(STATCOM)电压控制器,克服了常规 STATCOM 电压控制器对系统数学模型的依赖性,同时根据来自系统的强化学习信号,采用自适应启发评价算法更新其参数。在控制器中采用局部可测信息量,以确保其可实现性。... 详细信息
来源: 评论
强化学习算法应用于船舶运动的混合智能控制
收藏 引用
信息与控制 2002年 第2期31卷 127-131页
作者: 杨国勋 郭晨 贾欣乐 大连海事大学航海动态仿真与控制实验室 大连116026
强化学习算法与混合智能技术相结合 ,应用于船舶运动控制 ,克服了通常混合智能算法学习需要一定数量样本数据的缺陷 ,又能发挥各种智能算法的优势 .仿真结果表明在缺少样本数据情况下 ,该算法可以在一定程度上改进控制效果 .
来源: 评论
强化学习算法及卫星信号智能跟踪机制的研究
强化学习算法及卫星信号智能跟踪机制的研究
收藏 引用
作者: 徐杰 中国科学院中国遥感卫星地面站
学位级别:硕士
卫星信号跟踪系统是卫星地面接收系统的重要组成部分,负责卫星的捕捉、跟踪等多项工作。良好的卫星跟踪机制不仅可以大大有助于提高卫星数据接收的质量,而且既可以提高卫星地面接收系统的自动化程度、实现无人值守工作模式,又可以使... 详细信息
来源: 评论
一种基于团队马尔可夫博弈的多agent协同强化学习算法
收藏 引用
复旦学报(自然科学版) 2004年 第5期43卷 842-844页
作者: 王长缨 陈文伟 姚莉 国防科技大学管理科学与工程系信息与决策实验室 长沙410073
研究多agent系统的学习行为对于智能系统的适应性是至关重要的.针对一类追求系统得益最大化的协作团队的学习问题,基于马尔可夫博弈的思想,提出了一种新的多agent协同强化学习算法.协作团队中的每个agent通过观察协作相识者的历史行为,... 详细信息
来源: 评论