咨询与建议

限定检索结果

文献类型

  • 3 篇 期刊文献

馆藏范围

  • 3 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 3 篇 工学
    • 2 篇 控制科学与工程
    • 2 篇 计算机科学与技术...
    • 2 篇 软件工程
    • 1 篇 机械工程
    • 1 篇 航空宇航科学与技...
    • 1 篇 兵器科学与技术
  • 2 篇 管理学
    • 2 篇 管理科学与工程(可...

主题

  • 3 篇 软行动者-评论家
  • 1 篇 车道保持
  • 1 篇 注意力机制
  • 1 篇 强化学习
  • 1 篇 复飞操纵
  • 1 篇 深度强化学习
  • 1 篇 优先经验重放
  • 1 篇 复飞边界
  • 1 篇 舰载机
  • 1 篇 避障
  • 1 篇 无人机
  • 1 篇 无人车
  • 1 篇 随机网络蒸馏
  • 1 篇 安全自动驾驶

机构

  • 1 篇 软件新技术与产业...
  • 1 篇 航空工业沈阳飞机...
  • 1 篇 四川大学
  • 1 篇 吉林大学
  • 1 篇 苏州大学
  • 1 篇 南京航空航天大学

作者

  • 1 篇 张志冰
  • 1 篇 袁婷慧
  • 1 篇 王家兴
  • 1 篇 代珊珊
  • 1 篇 时宏伟
  • 1 篇 刘萌月
  • 1 篇 刘全

语言

  • 3 篇 中文
检索条件"主题词=软行动者-评论家"
3 条 记 录,以下是1-10 订阅
排序:
基于PER-SAC的舰载机着舰复飞操纵策略研究
收藏 引用
中国科学:技术科学 2025年
作者: 张志冰 袁婷慧 航空工业沈阳飞机设计研究所 南京航空航天大学自动化学院
为保证舰载机着舰复飞安全,本文提出一种基于PER-SAC的舰载机着舰复飞操纵策略.考虑到舰载机在航母不同距离处的复飞风险差异较大,通过改进安全复飞准则优化了复飞边界.将军用推力与升降舵操纵相结合,提出了一种基于软行动者-评论家(sof... 详细信息
来源: 评论
基于动作约束深度强化学习的安全自动驾驶方法
收藏 引用
计算机科学 2021年 第9期48卷 235-243页
作者: 代珊珊 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
随着人工智能的发展,自动驾驶领域的研究也日益壮大。深度强化学习(Deep Reinforcement Learning,DRL)方法是该领域的主要研究方法之一。其中,安全探索问题是该领域的一个研究热点。然而,大部分DRL算法为了提高样本的覆盖率并没有对探... 详细信息
来源: 评论
基于EFRE-SAC的无人机自主避障策略
收藏 引用
计算机系统应用 2025年 第6期 53-61页
作者: 刘萌月 时宏伟 四川大学计算机学院
在无人机自主避障任务中,传统强化学习算法往往面临状态空间高维、信息稀疏以及探索效率低下等挑战.现有的SAC (soft Actor-Critic)算法虽然具备较强的稳定性和样本效率,但在复杂环境下的表现仍显不足.为此,本文提出了一种基于注意力机... 详细信息
来源: 评论