咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 控制科学与工程
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 深度强化学习(drl...
  • 1 篇 文本游戏
  • 1 篇 互信息优化
  • 1 篇 语言类强化学习任...
  • 1 篇 表示学习

机构

  • 1 篇 中国科学院大学
  • 1 篇 中科寒武纪科技股...
  • 1 篇 中国科学院计算技...

作者

  • 1 篇 彭少辉
  • 1 篇 支天
  • 1 篇 胡杏

语言

  • 1 篇 中文
检索条件"主题词=语言类强化学习任务"
1 条 记 录,以下是1-10 订阅
排序:
基于语言任务的概念化强化学习框架
收藏 引用
高技术通讯 2024年 第6期34卷 555-566页
作者: 彭少辉 胡杏 支天 中国科学院计算技术研究所处理器芯片全国重点实验室 北京100190 中国科学院大学 北京100049 中科寒武纪科技股份有限公司 北京100080
语言类强化学习任务可以促进强化学习策略的泛化性,其关键问题是自动化学习观测和语言描述的通用表示。现有方法往往隐式学习联合表示,不可避免地引入训练集中的虚假相关信息,进而损伤策略的泛化性和训练效率。针对这一问题,本文提出了... 详细信息
来源: 评论