咨询与建议

限定检索结果

文献类型

  • 6 篇 期刊文献
  • 1 篇 学位论文

馆藏范围

  • 7 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 7 篇 工学
    • 4 篇 软件工程
    • 3 篇 电气工程
    • 3 篇 控制科学与工程
    • 3 篇 计算机科学与技术...
    • 1 篇 机械工程
    • 1 篇 仪器科学与技术
    • 1 篇 交通运输工程
    • 1 篇 网络空间安全
  • 3 篇 管理学
    • 3 篇 管理科学与工程(可...

主题

  • 7 篇 无模型强化学习
  • 3 篇 强化学习
  • 2 篇 深度强化学习
  • 2 篇 智能电网
  • 2 篇 有序充电
  • 1 篇 自适应动作噪声
  • 1 篇 策略搜索强化学习...
  • 1 篇 人工智能
  • 1 篇 马尔可夫决策过程...
  • 1 篇 连续动作空间
  • 1 篇 马尔可夫决策过程
  • 1 篇 数据驱动方法
  • 1 篇 卡尔曼滤波器
  • 1 篇 两阶段策略
  • 1 篇 机器人运动控制
  • 1 篇 状态表示
  • 1 篇 网络攻击
  • 1 篇 任务规划
  • 1 篇 离线强化学习
  • 1 篇 机器人

机构

  • 1 篇 中国科学院大学
  • 1 篇 华北电力大学
  • 1 篇 山东省工业控制技...
  • 1 篇 国网江苏省电力有...
  • 1 篇 中科合成油技术有...
  • 1 篇 安徽大学
  • 1 篇 北京邮电大学
  • 1 篇 中国科学院煤炭化...
  • 1 篇 青岛大学
  • 1 篇 南京师范大学
  • 1 篇 北京材料基因工程...
  • 1 篇 天津科技大学
  • 1 篇 北京信息科技大学

作者

  • 1 篇 赵婷婷
  • 1 篇 姚昌瑀
  • 1 篇 王迪
  • 1 篇 张亦弛
  • 1 篇 刘旭红
  • 1 篇 任坤
  • 1 篇 秦智慧
  • 1 篇 王嫄
  • 1 篇 程晓荣
  • 1 篇 马晓杰
  • 1 篇 张晓明
  • 1 篇 王莹
  • 1 篇 王洋
  • 1 篇 刘秀磊
  • 1 篇 江明
  • 1 篇 高士杰
  • 1 篇 季振亚
  • 1 篇 孙威
  • 1 篇 李宁
  • 1 篇 杨巨成

语言

  • 7 篇 中文
检索条件"主题词=无模型强化学习"
7 条 记 录,以下是1-10 订阅
排序:
无模型强化学习研究综述
收藏 引用
计算机科学 2021年 第3期48卷 180-187页
作者: 秦智慧 李宁 刘晓彤 刘秀磊 佟强 刘旭红 北京材料基因工程高精尖创新中心(北京信息科技大学) 北京100101 北京信息科技大学数据与科学情报分析实验室 北京100101 中国科学院煤炭化学研究所煤转化国家重点实验室 太原030001 中科合成油技术有限公司国家能源煤基液体燃料研发中心 北京101400 中国科学院大学 北京100049
强化学习(Reinforcement Learning,RL)作为机器学习领域中与监督学习监督学习并列的第三种学习范式,通过与环境进行交互来学习,最终将累积收益最大化。常用的强化学习算法分为模型强化学习(Model-based Reinforcement Lear-ning)... 详细信息
来源: 评论
基于无模型强化学习的电动汽车有序充电实时调控方法
基于无模型强化学习的电动汽车有序充电实时调控方法
收藏 引用
作者: 张亦弛 北京邮电大学
学位级别:硕士
近年来,为了降低化石能源的消耗和保护生态环境,我国大力推动电动汽车的发展,电动汽车的数量得以飞速增长。然而,大量电动汽车序接入电网将使得电网出现新的负荷峰值,进而导致电能质量下降、运行成本增加和变压器过载等问题。为了缓... 详细信息
来源: 评论
强化学习及其在机器人任务规划中的进展与分析
收藏 引用
模式识别与人工智能 2023年 第10期36卷 902-917页
作者: 张晓明 高士杰 姚昌瑀 褚誉 彭硕 安徽大学物质科学与信息技术研究院 合肥230601
强化学习可以让机器人通过与环境的交互,学习最优的行动策略,是目前机器人领域关注的重要前沿方向之一.文中简述机器人任务规划问题的形式化建模,分析强化学习的主要方法,分别介绍无模型强化学习、基于模型强化学习和分层强化学习的... 详细信息
来源: 评论
潜在空间中的策略搜索强化学习方法
收藏 引用
计算机科学与探索 2024年 第4期18卷 1032-1046页
作者: 赵婷婷 王莹 孙威 陈亚瑞 王嫄 杨巨成 天津科技大学人工智能学院 天津300457
策略搜索是深度强化学习领域中一种能够解决大规模连续状态空间和动作空间问题的高效学习方法,被广泛应用在现实问题中。然而,此类方法通常需要花费大量的学习样本和训练时间,且泛化能力较差,学到的策略模型难以泛化至环境中看似微小的... 详细信息
来源: 评论
基于可变保守程度离线强化学习的机器人运动控制方法
收藏 引用
控制工程 2024年
作者: 王洋 张震 王迪 任坤 青岛大学自动化学院 山东省工业控制技术重点实验室
为了解决以保守Q学习(Conservative Q-Learning, CQL)为代表的离线强化学习算法保守程度固定不变,导致学习到的策略过于保守的问题,文中提出了一种名为可变保守程度Q学习(Variable Conservativeness Q-Learning, VCQL)的离线强化学... 详细信息
来源: 评论
基于时序差分学习的充电站有序充电方法
收藏 引用
电力工程技术 2021年 第1期40卷 181-187页
作者: 江明 许庆强 季振亚 国网江苏省电力有限公司 江苏南京210024 南京师范大学电气与自动化工程学院 江苏南京210046
电动汽车有序充电是智能用电领域的重要议题。传统的模型驱动方法需对充电行为建模,但受相关参数的强随机性等影响,相关模型不能完全反映充电行为的不确定性。考虑到数据驱动下的无模型强化学习(MFRL)具有不依赖先验建模、适应强非线性... 详细信息
来源: 评论
智能电网中的网络攻击检测机制的研究
收藏 引用
网络安全技术与应用 2020年 第6期 28-29页
作者: 马晓杰 程晓荣 华北电力大学(保定)控制与计算机工程学院 河北071000
本文首先分析了智能电网数据通信中的挑战,然后对智能电网中混合式和隐身网络攻击的实时检测以及基于无模型强化学习(RL)框架的在线检测算法等一些网络攻击检测机制进行了研究。为了探究检测机制中提高安全性的工作方案,本文对现有网络... 详细信息
来源: 评论