咨询与建议

限定检索结果

文献类型

  • 21 篇 期刊文献
  • 6 篇 学位论文
  • 2 篇 会议

馆藏范围

  • 29 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 27 篇 工学
    • 18 篇 计算机科学与技术...
    • 15 篇 软件工程
    • 14 篇 控制科学与工程
    • 5 篇 机械工程
    • 4 篇 仪器科学与技术
    • 4 篇 信息与通信工程
    • 2 篇 电子科学与技术(可...
    • 1 篇 交通运输工程
    • 1 篇 航空宇航科学与技...
    • 1 篇 兵器科学与技术
  • 15 篇 管理学
    • 15 篇 管理科学与工程(可...
  • 1 篇 医学
    • 1 篇 中西医结合
    • 1 篇 药学(可授医学、理...
  • 1 篇 军事学
    • 1 篇 战术学
    • 1 篇 军队指挥学

主题

  • 29 篇 部分可观察马尔可...
  • 5 篇 强化学习
  • 4 篇 无线传感器网络
  • 4 篇 在线算法
  • 3 篇 信念状态
  • 3 篇 信念状态空间
  • 2 篇 联合优化
  • 2 篇 深度强化学习
  • 2 篇 内部状态
  • 2 篇 移动边缘计算
  • 2 篇 多智能体
  • 2 篇 马尔可夫决策过程
  • 2 篇 多agent系统
  • 2 篇 维数灾
  • 2 篇 计算卸载
  • 1 篇 有模型强化学习
  • 1 篇 q学习
  • 1 篇 优先级
  • 1 篇 行为决策
  • 1 篇 transformer

机构

  • 9 篇 深圳职业技术学院
  • 9 篇 中南大学
  • 4 篇 先进控制与智能自...
  • 3 篇 合肥工业大学
  • 2 篇 西安工业大学
  • 1 篇 中山市博爱医院
  • 1 篇 school of comput...
  • 1 篇 大连理工大学
  • 1 篇 东南大学
  • 1 篇 复旦大学
  • 1 篇 江苏大学
  • 1 篇 东莞理工学院
  • 1 篇 哈尔滨理工大学
  • 1 篇 南京大学
  • 1 篇 西北工业大学
  • 1 篇 常州纺织服装职业...
  • 1 篇 重庆邮电大学
  • 1 篇 河南师范大学
  • 1 篇 重庆大学
  • 1 篇 哈尔滨工业大学

作者

  • 10 篇 仵博
  • 8 篇 wu bo
  • 6 篇 郑红燕
  • 6 篇 冯延蓬
  • 4 篇 zheng hong-yan
  • 4 篇 feng yan-peng
  • 4 篇 吴敏
  • 3 篇 wu min
  • 3 篇 孟宪军
  • 2 篇 徐飞
  • 2 篇 苏维亚
  • 2 篇 王森
  • 2 篇 方长胜
  • 2 篇 姚宏亮
  • 2 篇 zheng hongyan
  • 2 篇 meng xian-jun
  • 2 篇 feng yanpeng
  • 2 篇 王浩
  • 1 篇 zhang ning
  • 1 篇 刘晶晶

语言

  • 29 篇 中文
检索条件"主题词=部分可观察马尔可夫决策过程"
29 条 记 录,以下是1-10 订阅
排序:
基于部分可观察马尔可夫决策过程的多被动传感器组网协同反隐身探测任务规划
收藏 引用
兵工学报 2015年 第4期36卷 731-743页
作者: 万开方 高晓光 李波 梅军峰 西北工业大学电子信息学院 陕西西安710072
针对反隐身作战需求,提出多被动传感器组网协同战术。为提升反隐身探测效能,引入部分可观察马尔可夫决策过程(POMDP)理论,分析了POMDP任务规划要素,建立起多被动传感器组网协同反隐身探测任务规划POMDP模型。建立了多被动传感器协同控... 详细信息
来源: 评论
基于非负矩阵分解更新规则的部分可观察马尔可夫决策过程信念状态空间降维算法
收藏 引用
电子与信息学报 2013年 第12期35卷 2901-2907页
作者: 仵博 陈鑫 郑红燕 冯延蓬 深圳职业技术学院教育技术与信息中心 深圳518055 中南大学信息科学与工程学院 长沙410083 先进控制与智能自动化湖南省工程实验室 长沙410083
针对求解部分可观察马尔可夫决策过程(POMDP)规划问题时遭遇的"维数诅咒",该文提出了一种基于非负矩阵分解(NMF)更新规则的POMDP信念状态空间降维算法,分两步实现低误差高维降维。第1步,利用POMDP的结构特性,将状态、观察和... 详细信息
来源: 评论
基于部分可观察马尔可夫决策过程的引导式学习模型研究
基于部分可观察马尔可夫决策过程的引导式学习模型研究
收藏 引用
作者: 罗俊 南京邮电大学
学位级别:硕士
随着知识技能日新月异,让训练对象尽能快的通过学习掌握技能和知识,以满足不同任务的需求,已经成为非常重要的研究课题。因为不同个体的学习能力有差异,而且会存在优先级高的对象个体,如何进行引导式自动学习,以提高学习的效率和质量... 详细信息
来源: 评论
一种基于部分可观察马尔可夫决策过程的股票交易策略
收藏 引用
东莞理工学院学报 2023年 第1期30卷 43-50页
作者: 黄福威 张宁 东莞理工学院计算机科学与技术学院 广东东莞523808
近年来涌现了许多把深度强化学习应用到股票交易策略的研究。深度强化学习通常依赖于马尔决策过程建模,但是股票市场中交易策略的制定需要考虑历史交易数据中包含的信息。因此,本文通过部分可观察马尔可夫决策过程对股票市场建模,... 详细信息
来源: 评论
部分可观察Markov决策过程中基于内部状态的强化学习研究
部分可观察Markov决策过程中基于内部状态的强化学习研究
收藏 引用
作者: 方长胜 合肥工业大学
学位级别:硕士
强化学习是机器学习的一个重要分支,它模拟动物学习过程,通过试探的方法修正从状态到动作的映射策略,最终学会在各种环境状态下采取最好的反应行为,从而提高智能系统的自适应性和鲁棒性。尽管强化学习技术已有很多研究成果和应用范例,... 详细信息
来源: 评论
不确定性环境下的自动驾驶汽车行为决策方法
收藏 引用
汽车工程 2024年 第2期46卷 211-221,259页
作者: 付新科 蔡英凤 陈龙 王海 刘擎超 江苏大学汽车工程研究院 镇江212013 江苏大学汽车与交通工程学院 镇江212013
在真实驾驶环境中,由于感知数据的噪声和其他交通参与者难以预测的行为意图,自动驾驶汽车如何在高度交互的复杂驾驶环境中考虑不确定性因素的影响,做出合理的决策,是当前决策规划系统须解决的主要问题之一。本文提出了一种不确定性环境... 详细信息
来源: 评论
基于点的POMDPs在线值迭代算法
收藏 引用
软件学报 2013年 第1期24卷 25-36页
作者: 仵博 吴敏 佘锦华 中南大学信息科学与工程学院 湖南长沙410083 先进控制与智能自动化湖南省工程实验室 湖南长沙410083 深圳职业技术学院教育技术与信息中心 广东深圳518055 School of Computer Science Tokyo University of Technology
部分可观察马尔可夫决策过程(partially observable Markov decision processes,简称POMDPs)是动态不确定环境下序贯决策的理想模型,但是现有离线算法陷入信念状态"维数灾"和"历史灾"问题,而现有在线算法无法同时... 详细信息
来源: 评论
基于Monte Carlo粒子滤波的POMDPs在线算法
收藏 引用
控制与决策 2013年 第6期28卷 925-929页
作者: 仵博 吴敏 中南大学信息科学与工程学院 长沙410083 中南大学先进控制与智能自动化湖南省工程实验室 长沙410083 深圳职业技术学院教育技术与信息中心 广东深圳518055
针对部分可观察马尔可夫决策过程(POMDPs)的信念状态空间是一个双指数规模问题,提出一种基于Monte Carlo粒子滤波的POMDPs在线算法.首先,分别采用粒子滤波和粒子映射更新和扩展信念状态,建立达信念状态与或树;然后,采用分支界限裁剪... 详细信息
来源: 评论
不确定性环境下基于进化算法的强化学习
收藏 引用
电子学报 2006年 第7期34卷 1356-1360页
作者: 刘海涛 洪炳熔 朴松昊 王雪梅 哈尔滨工业大学计算机科学与技术学院 黑龙江哈尔滨150001 哈尔滨理工大学自动化学院 黑龙江哈尔滨150080
不确定性和隐状态是目前强化学习所要面对的重要难题.本文提出了一种新的算法MA-Q-learning算法来求解带有这种不确定性的POMDP问题近似最优策略.利用M em etic算法来进化策略,而Q学习算法得到预测奖励来指出进化策略的适应度值.针对隐... 详细信息
来源: 评论
基于动态跳频的频谱接入
收藏 引用
计算机应用研究 2010年 第12期27卷 4684-4685,4689页
作者: 陶乃顺 鲜永菊 徐昌彪 重庆大学通信工程学院 重庆400044 重庆邮电大学移动通信重点实验室 重庆400065
在认知网络中,为了克服频谱接入方案中系统吞吐量普遍偏低的缺点,运用动态跳频技术,提出一种以使次用户顺利切换到其他信道同时增加系统吞吐量的频谱接入新方案,并利用部分可观察马尔可夫决策过程描述这一问题;最后进行了数值验证。
来源: 评论