咨询与建议

限定检索结果

文献类型

  • 1 篇 学位论文

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 理学
    • 1 篇 数学
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 深度强化学习
  • 1 篇 自适应卡尔曼滤波...
  • 1 篇 多智能体协同定位
  • 1 篇 部分可观测马尔可...
  • 1 篇 信念表示学习

机构

  • 1 篇 河南科技大学

作者

  • 1 篇 刘剑锋

语言

  • 1 篇 中文
检索条件"主题词=信念表示学习"
1 条 记 录,以下是1-10 订阅
排序:
部分可观测马尔可夫决策过程的状态估计与策略学习
部分可观测马尔可夫决策过程的状态估计与策略学习
收藏 引用
作者: 刘剑锋 河南科技大学
学位级别:博士
近年来,动态、不确定环境下的序贯决策问题成为人工智能和控制等领域的研究热点。部分可观测马尔可夫决策过程(POMDP)为这类问题提供了一个统一的描述框架。由于POMDP模型考虑了状态不确定性对决策带来的影响,因此能够更加客观地描述真... 详细信息
来源: 评论