版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:东南大学计算机科学与工程学院南京210096 南京大学计算机软件新技术国家重点实验室南京210093
出 版 物:《计算机科学》 (Computer Science)
年 卷 期:2008年第35卷第10期
页 面:6-14,48页
核心收录:
学科分类:1305[艺术学-设计学(可授艺术学、工学学位)] 13[艺术学] 081104[工学-模式识别与智能系统] 082601[工学-武器系统与运用工程] 08[工学] 082501[工学-飞行器设计] 0804[工学-仪器科学与技术] 0826[工学-兵器科学与技术] 082602[工学-兵器发射理论与技术] 081101[工学-控制理论与控制工程] 0825[工学-航空宇航科学与技术] 0811[工学-控制科学与工程]
基 金:国家自然科学基金会重大研究计划项目(90412014) 计算机软件新技术开放课题(A200707)资助
主 题:情景演算 因子化马尔可夫决策过程 逻辑马尔可夫决策过程 关系马尔可夫决策过程 Bellman方程
摘 要:抽象层次上马尔可夫决策过程的引入,使得人们可简洁地、陈述地表达复杂的马尔可夫决策过程,解决常规马尔可夫决策过程(MDPs)在实际中所遇到的大型状态空间的表达问题。介绍了结构型和概括型两种不同类型抽象马尔可夫决策过程基本概念以及在各种典型抽象MDPs中的最优策略的精确或近似算法,其中包括与常规MDPs根本不同的一个算法:把Bellman方程推广到抽象状态空间的方法,并且对它们的研究历史进行总结和对它们的发展做一些展望,使得人们对它们有一个透彻的、全面而又重点的理解。