咨询与建议

限定检索结果

文献类型

  • 5 篇 学位论文
  • 3 篇 期刊文献

馆藏范围

  • 8 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 7 篇 工学
    • 3 篇 机械工程
    • 3 篇 控制科学与工程
    • 3 篇 计算机科学与技术...
    • 3 篇 软件工程
    • 1 篇 仪器科学与技术
    • 1 篇 化学工程与技术
    • 1 篇 交通运输工程
  • 3 篇 管理学
    • 3 篇 管理科学与工程(可...
  • 1 篇 教育学
    • 1 篇 教育学
    • 1 篇 体育学
  • 1 篇 理学
    • 1 篇 系统科学

主题

  • 8 篇 时间差分算法
  • 3 篇 强化学习
  • 1 篇 九路围棋
  • 1 篇 环境补偿机制
  • 1 篇 线性回归
  • 1 篇 蒙特卡罗算法
  • 1 篇 马尔科夫决策过程
  • 1 篇 自由步态规划
  • 1 篇 多项式预测
  • 1 篇 多率采样
  • 1 篇 actor-critic网络
  • 1 篇 干扰抑制
  • 1 篇 重载六足机器人
  • 1 篇 多媒体课件
  • 1 篇 运动学
  • 1 篇 加速收敛
  • 1 篇 焦炉火道温度
  • 1 篇 计算机博弈
  • 1 篇 高斯过程
  • 1 篇 elman神经网络

机构

  • 2 篇 软件新技术与产业...
  • 2 篇 吉林大学
  • 2 篇 苏州大学
  • 1 篇 中央民族大学
  • 1 篇 西华大学
  • 1 篇 重庆理工大学
  • 1 篇 天津工业大学
  • 1 篇 电子科技大学
  • 1 篇 中南大学

作者

  • 2 篇 刘全
  • 1 篇 梁宁宁
  • 1 篇 shi sheng-miao
  • 1 篇 陈泰任
  • 1 篇 wang hui
  • 1 篇 罗宇轩
  • 1 篇 何斌
  • 1 篇 闫岩
  • 1 篇 王松
  • 1 篇 陈红名
  • 1 篇 傅启明
  • 1 篇 时圣苗
  • 1 篇 王辉
  • 1 篇 zhang xiaochuan
  • 1 篇 于俊
  • 1 篇 唐艳
  • 1 篇 he binliu quan
  • 1 篇 yu jun
  • 1 篇 liang ningning
  • 1 篇 张琳琳

语言

  • 8 篇 中文
检索条件"主题词=时间差分算法"
8 条 记 录,以下是1-10 订阅
排序:
一种基于随机投影的贝叶斯时间差分算法
收藏 引用
电子学报 2016年 第11期44卷 2752-2757页
作者: 刘全 于俊 王辉 傅启明 朱斐 苏州大学计算机科学与技术学院 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 吉林长春130012 软件新技术与产业化协同创新中心 江苏南京210023
在强化学习方法中,大部分的算法都是基于值函数评估的算法.高斯过程时间差分算法利用贝叶斯方法来评估值函数,通过贝尔曼公式和贝叶斯规则,建立立即奖赏与值函数之间的概率生成模型.在状态空间中,通过在线核稀疏化并利用最小二乘方法来... 详细信息
来源: 评论
一种加速时间差分算法收敛的方法
收藏 引用
自动化学报 2021年 第7期47卷 1679-1688页
作者: 何斌 刘全 张琳琳 时圣苗 陈红名 闫岩 苏州大学计算机科学与技术学院 苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
时间差分算法(Temporal difference methods,TD)是一类模型无关的强化学习算法.该算法拥有较低的方差和可以在线(On-line)学习的优点,得到了广泛的应用.但对于一种给定的TD算法,往往只能通过调整步长参数或其他超参数来加速收敛,这也就... 详细信息
来源: 评论
采用时间差分算法的九路围棋机器博弈系统
收藏 引用
智能系统学报 2012年 第3期7卷 278-282页
作者: 张小川 唐艳 梁宁宁 重庆理工大学计算机科学与工程学院 重庆400054
围棋机器博弈是机器博弈中重要的分支之一,其庞大的博弈空间给机器博弈研究者带来了巨大挑战.目前围棋机器博弈多采用静态估值搜索与蒙特卡洛树搜索,故将时间差分算法引入至九路围棋机器博弈系统中,提出基于时间差分算法的围棋机器博弈... 详细信息
来源: 评论
电容式触摸按键系统设计与实现
电容式触摸按键系统设计与实现
收藏 引用
作者: 赵宏涛 天津工业大学
学位级别:硕士
电容式触摸按键(Capacitive Touch Keys,CTouch)因灵敏度高、功耗低和无机械磨损等优点,越来越多地使用在高端乘用车的车门控制系统中。目前市场上使用电容式触摸按键的车门产品存在环境适应性差和抗干扰能力差的问题。主要体现在不能... 详细信息
来源: 评论
基于Actor-Critic方法的口型同步动画生成
基于Actor-Critic方法的口型同步动画生成
收藏 引用
作者: 罗宇轩 电子科技大学
学位级别:硕士
语音驱动的口型动画自动合成对于许多应用都是必不可少的,而传统的面部捕捉方法需要的装置昂贵且使用耗时。本文重点就是通过给定的音频和角色模型,生成匹配音频的口型动画,能够准确地反应整个口型与语音的协同性以及语音中的情感表现... 详细信息
来源: 评论
基于多率采样的焦炉火道温度软测量集成模型
基于多率采样的焦炉火道温度软测量集成模型
收藏 引用
作者: 陈泰任 中南大学
学位级别:硕士
焦炭是钢铁等行业的重要生产原料,广泛的应用于各行各业。焦炉加热燃烧过程是炼焦过程中重要的流程,火道温度直接影响到焦炭质量和能源消耗。然而由于成本等原因,往往难以实现实时测取火道温度;而人工测温,也存在周期太长,迟滞的缺点。... 详细信息
来源: 评论
久棋强化学习博弈研究及多媒体课件开发
久棋强化学习博弈研究及多媒体课件开发
收藏 引用
作者: 王松 中央民族大学
学位级别:硕士
久棋起源于我国四川省阿坝藏族羌族自治州和甘肃省甘南藏族自治州,是藏族一种特有的民间棋艺。围棋、象棋等为大众所熟知的棋种在计算机博弈研究领域已经取得了长足的发展,AlphaGo、绝艺等表现出色的研究成果也使得这些棋种的博弈研究... 详细信息
来源: 评论
重载六足机器人的结构设计与步态规划
重载六足机器人的结构设计与步态规划
收藏 引用
作者: 肖体熠 西华大学
学位级别:硕士
六足机器人是一种典型的足式机器人,其步态变换丰富、稳定性好、地形适应能力强、越障能力高,可广泛应用于农业生产、抢险救灾、星球探索、工地挖掘以及军事国防等,受到学术界的高度关注。论文针对复杂地形环境如农业生产、抢险救灾等领... 详细信息
来源: 评论