咨询与建议

限定检索结果

文献类型

  • 3 篇 期刊文献
  • 2 篇 学位论文
  • 1 篇 会议

馆藏范围

  • 6 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 6 篇 工学
    • 5 篇 控制科学与工程
    • 3 篇 计算机科学与技术...
    • 3 篇 软件工程
    • 1 篇 电气工程
  • 3 篇 管理学
    • 3 篇 管理科学与工程(可...

主题

  • 6 篇 时序差分算法
  • 3 篇 强化学习
  • 2 篇 机器学习
  • 1 篇 q学习
  • 1 篇 启发式搜索
  • 1 篇 蒙特卡罗算法
  • 1 篇 加强学习
  • 1 篇 软件定义卫星
  • 1 篇 脱靶量
  • 1 篇 制导律
  • 1 篇 人工智能
  • 1 篇 径向基网络
  • 1 篇 电网监控
  • 1 篇 识别优化模型
  • 1 篇 自适应控制
  • 1 篇 平稳状态分布比
  • 1 篇 q-学习
  • 1 篇 比例制导
  • 1 篇 机动目标
  • 1 篇 线损异常

机构

  • 1 篇 华中科技大学
  • 1 篇 中国科学院大学
  • 1 篇 广西电网有限责任...
  • 1 篇 武汉城市职业学院
  • 1 篇 中国地质大学
  • 1 篇 华东师范大学
  • 1 篇 哈尔滨工业大学
  • 1 篇 北华航天工业学院
  • 1 篇 北京电子工程总体...

作者

  • 1 篇 许轲
  • 1 篇 陈俊
  • 1 篇 宋晶
  • 1 篇 韦杏秋
  • 1 篇 龙东
  • 1 篇 郭茂祖
  • 1 篇 李刚
  • 1 篇 袁博
  • 1 篇 张秦雪
  • 1 篇 张敏可
  • 1 篇 刘扬
  • 1 篇 敖百强
  • 1 篇 于来宝
  • 1 篇 张秦浩
  • 1 篇 谢兴旺
  • 1 篇 郭小璇
  • 1 篇 黄梯云

语言

  • 6 篇 中文
检索条件"主题词=时序差分算法"
6 条 记 录,以下是1-10 订阅
排序:
具有分布适应性的off-policy时序差分算法
具有分布适应性的off-policy时序差分算法
收藏 引用
作者: 张敏可 华东师范大学
学位级别:硕士
强化学习目前是机器学习领域所研究的重要内容,其关注的是智能体如何在与环境不断进行试错交互的过程中寻求使得期望累积奖励最大化的策略。在强化学习领域的研究方法中,当学习过程中产生样本数据的行为策略与待评估的目标策略相同时,称... 详细信息
来源: 评论
基于时序差分算法的线损异常判别优化研究
基于时序差分算法的线损异常判别优化研究
收藏 引用
2016年中国电机工程学会年会
作者: 韦杏秋 陈俊 李刚 龙东 郭小璇 广西电网有限责任公司电力科学研究院 广西省 南宁市 530022
为了提高电网监控智能化,降低线损计算误差,提出了基于时序差分算法的线损异常识别优化模型,识别异常线路和异常点,在此基础上,根据历史发售电数据对异常点进行修正,从而达到优化异常线路,提高线损计算精确度的目的.仿真实验结果研究表... 详细信息
来源: 评论
基于强化学习的过热汽温自适应PI控制器设计
收藏 引用
江苏大学学报(自然科学版) 2022年 第6期43卷 685-690页
作者: 于来宝 谢兴旺 宋晶 袁博 中国地质大学地球物理与空间信息学院 湖北武汉430074 武汉城市职业学院机电学院 湖北武汉430070 华中科技大学人工智能与自动化学院 湖北武汉430074
针对锅炉过热汽温模型结构和参数发生较大变化时常规PID控制效果难以令人满意的问题,提出一款基于actor-critic(AC)强化学习(reinforcement learning, RL)的自适应PI控制器.控制器采用径向基神经网络(RBF-NN)实现AC强化学习结构,其中ac... 详细信息
来源: 评论
Q-learning强化学习制导律
收藏 引用
系统工程与电子技术 2020年 第2期42卷 414-419页
作者: 张秦浩 敖百强 张秦雪 北京电子工程总体研究所 北京100854 北华航天工业学院计算机学院 河北廊坊065000
在未来的战场中,智能导弹将成为精确有效的打击武器,导弹智能化已成为一种主要的发展趋势。本文以传统的比例制导律为基础,提出基于强化学习的变比例系数制导算法。该算法以视线转率作为状态,依据脱靶量设计奖励函数,并设计离散化的行... 详细信息
来源: 评论
软件定义卫星姿态控制强化学习算法研究
软件定义卫星姿态控制强化学习算法研究
收藏 引用
作者: 许轲 中国科学院大学
学位级别:博士
随着卫星数量井喷式增长,对卫星姿态控制系统智能化、可重构、低成本等方面的关注在不断提升。软件定义卫星以计算为基础,软件为核心,可为智能姿控算法在轨运行提供足够的计算资源。为了满足可软件定义,软件定义卫星需要进一步研究... 详细信息
来源: 评论
加强学习主要算法的比较研究
收藏 引用
计算机工程与应用 2001年 第21期37卷 16-18,48页
作者: 郭茂祖 刘扬 黄梯云 哈尔滨工业大学计算机科学与技术学院 哈尔滨150001 哈尔滨工业大学管理学院 哈尔滨150001
文章介绍了加强学习模型,分别给出了加强学习的四个主要算法:动态规划、蒙特卡罗算法时序差分算法、Q-学习,并指出了它们之间的区别和联系。最后给出加强学习的两个应用以及今后的研究方向。
来源: 评论