咨询与建议

限定检索结果

文献类型

  • 125 篇 期刊文献
  • 3 篇 会议

馆藏范围

  • 128 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 118 篇 工学
    • 103 篇 计算机科学与技术...
    • 87 篇 软件工程
    • 58 篇 控制科学与工程
    • 11 篇 机械工程
    • 2 篇 仪器科学与技术
    • 2 篇 信息与通信工程
    • 1 篇 生物医学工程(可授...
    • 1 篇 生物工程
    • 1 篇 网络空间安全
  • 65 篇 管理学
    • 64 篇 管理科学与工程(可...
    • 1 篇 图书情报与档案管...
  • 6 篇 理学
    • 4 篇 数学
    • 1 篇 物理学
    • 1 篇 系统科学
  • 2 篇 文学
    • 2 篇 新闻传播学
  • 1 篇 教育学
    • 1 篇 教育学
  • 1 篇 军事学
    • 1 篇 军队指挥学

主题

  • 28 篇 强化学习
  • 11 篇 深度强化学习
  • 7 篇 数据挖掘
  • 7 篇 深度学习
  • 4 篇 函数逼近
  • 4 篇 人工智能
  • 4 篇 支持向量机
  • 4 篇 策略梯度
  • 4 篇 行动者评论家
  • 4 篇 连续空间
  • 4 篇 经验回放
  • 4 篇 深度q网络
  • 4 篇 循环神经网络
  • 4 篇 卷积神经网络
  • 3 篇 最小二乘
  • 3 篇 遗传算法
  • 3 篇 数据结构
  • 3 篇 梯度下降
  • 3 篇 目标检测
  • 3 篇 算法

机构

  • 104 篇 吉林大学
  • 53 篇 苏州大学
  • 25 篇 软件新技术与产业...
  • 12 篇 符号计算与知识工...
  • 9 篇 辽宁大学
  • 7 篇 常熟理工学院
  • 5 篇 江苏省计算机信息...
  • 4 篇 清华大学
  • 3 篇 吉林财经大学
  • 2 篇 江苏省软件新技术...
  • 2 篇 大连理工大学
  • 2 篇 内蒙古民族大学
  • 2 篇 苏州城市学院
  • 2 篇 昆明理工大学
  • 2 篇 上海大学
  • 2 篇 东北师范大学
  • 2 篇 北京化工大学
  • 1 篇 中国科学院长春光...
  • 1 篇 苏州科技大学
  • 1 篇 苏州工业职业技术...

作者

  • 44 篇 刘全
  • 14 篇 周春光
  • 11 篇 傅启明
  • 11 篇 伏玉琛
  • 11 篇 朱斐
  • 8 篇 张永刚
  • 8 篇 徐红艳
  • 8 篇 刘大有
  • 8 篇 冯勇
  • 7 篇 王嵘冰
  • 7 篇 凌兴宏
  • 7 篇 王喆
  • 6 篇 欧阳丹彤
  • 5 篇 刘亚波
  • 5 篇 季怡
  • 5 篇 刘纯平
  • 4 篇 肖飞
  • 4 篇 齐红
  • 4 篇 闫岩
  • 4 篇 左万利

语言

  • 128 篇 中文
检索条件"基金资助=教育部重点实验室资助项目“符号计算与知识工程教育部重点实验室”资助的成果"
128 条 记 录,以下是21-30 订阅
排序:
基于动作约束深度强化学习的安全自动驾驶方法
收藏 引用
计算机科学 2021年 第9期48卷 235-243页
作者: 代珊珊 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
随着人工智能的发展,自动驾驶领域的研究也日益壮大。深度强化学习(Deep Reinforcement Learning,DRL)方法是该领域的主要研究方法之一。其中,安全探索问题是该领域的一个研究热点。然而,大分DRL算法为了提高样本的覆盖率并没有对探... 详细信息
来源: 评论
基于自指导动作选择的近端策略优化算法
收藏 引用
计算机科学 2021年 第12期48卷 297-303页
作者: 申怡 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
强化学习领域中策略单调提升的优化算法是目前的一个研究热点,在离散型和连续型控制任务中都具有了良好的性能表现。近端策略优化(Proximal Policy Optimization,PPO)算法是一种经典策略单调提升算法,但PPO作为一种同策略(on-policy)算... 详细信息
来源: 评论
基于情节经验回放的深度确定性策略梯度方法
收藏 引用
计算机科学 2021年 第10期48卷 37-43页
作者: 张建行 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
强化学习中的连续控制问题一直是近年来的研究热点。深度确定性策略梯度(Deep Deterministic Policy Gradients,DDPG)算法在连续控制任务中表现优异。DDPG算法利用经验回放机制训练网络模型,为了进一步提高经验回放机制在DDPG算法中的效... 详细信息
来源: 评论
基于耦合CNN评分预测模型的个性化商品推荐
收藏 引用
小型微型计算机系统 2020年 第2期41卷 393-398页
作者: 冯勇 韩晓龙 顾兆旭 王龙 徐孟阳 刘志国 辽宁大学信息学院 沈阳110036 辽宁轻工职业学校计算机系 辽宁大连116100 中国石油天然气股份有限公司华北化工销售公司 郑州450000
电子商务中大量评论数据蕴含着丰富的信息,该信息有助于解决个性化推荐系统存在的数据稀疏问题.为了充分挖掘评论数据蕴含的价值,提高商品推荐的准确率,本文提出了基于耦合CNN评分预测模型的个性化商品推荐方法.该方法首先利用耦合CNN... 详细信息
来源: 评论
一种权重平均值的深度双Q网络方法
收藏 引用
计算机研究与发展 2020年 第3期57卷 576-589页
作者: 吴金金 刘全 陈松 闫岩 苏州大学计算机科学与技术学院 江苏苏州215006 符号计算与知识工程教育部重点实验室(吉林大学) 长春130012 江苏省计算机信息处理技术重点实验室(苏州大学) 江苏苏州215006 软件新技术与产业化协同创新中心(南京大学) 南京210023
深度强化学习算法的不稳定性和可变性对其性能有重要的影响.深度Q网络模型在处理需要感知高维输入数据的决策控制任务中性能良好.然而,深度Q网络存在着高估动作值使agent性能变差的问题.尽管深度双Q网络能够缓解高估带来的影响,但是仍... 详细信息
来源: 评论
一种残差置乱上下文信息的场景图生成方法
收藏 引用
计算机研究与发展 2019年 第8期56卷 1721-1730页
作者: 林欣 田鑫 季怡 徐云龙 刘纯平 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学应用技术学院 江苏苏州215300 符号计算与知识工程教育部重点实验室(吉林大学) 长春130012
场景图在视觉理解中有着很重要的作用.现有的场景图生成方法对于主语、宾语以及主宾语间的视觉关系进行研究.但是,人类通过空间关系上下文、语义上下文和目标之间的互动信息来进行关系的理解和推理.为了获得更好的全局上下文表示,同时... 详细信息
来源: 评论
一种带探索噪音的深度循环Q网络
收藏 引用
计算机学报 2019年 第7期42卷 1588-1604页
作者: 刘全 闫岩 朱斐 吴文 张琳琳 苏州大学计算机科学与技术学院 江苏苏州215006 软件新技术与产业化协同创新中心 南京210000 吉林大学符号计算与知识工程教育部重点实验室 长春130012 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006
结合深度神经网络和强化学习方法的深度Q网络在Atari 2600游戏平台上取得了巨大成功.相较于深度Q网络,深度循环Q网络具有记忆历史信息的能力,在分游戏上显示出了更好的性能.然而在某些复杂的游戏环境中,一方面深度循环Q网络需要大量... 详细信息
来源: 评论
基于双深度网络的安全深度强化学习方法
收藏 引用
计算机学报 2019年 第8期42卷 1812-1826页
作者: 朱斐 吴文 伏玉琛 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 软件新技术与产业化协同创新中心 南京210000 吉林大学符号计算与知识工程教育部重点实验室 长春130012 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 常熟理工学院计算机科学与工程学院 江苏常熟215500
深度强化学习利用深度学习感知环境信息,使用强化学习求解最优决策,是当前人工智能领域的主要研究热点之一.然而,大分深度强化学习的工作未考虑安全问题,有些方法甚至特意加入带随机性质的探索来扩展采样的覆盖面,以期望获得更好的近... 详细信息
来源: 评论
基于最小二乘的双权重学习法
收藏 引用
计算机科学 2020年 第12期47卷 210-217页
作者: 李斌 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 软件新技术与产业化协同创新中心 南京210000 吉林大学符号计算与知识工程教育部重点实验室 长春130012
强化学习是人工智能领域中的一个研究热点。在求解强化学习问题时,传统的最小二乘法作为一类特殊的函数逼近学习方法,具有收敛速度快、充分利用样本数据的优势。通过对最小二乘时序差分算法(Least-Squares Temporal Difference,LSTD)的... 详细信息
来源: 评论
基于线性动态跳帧的深度双Q网络
收藏 引用
计算机学报 2019年 第11期42卷 2561-2573页
作者: 陈松 章晓芳 章宗长 刘全 吴金金 闫岩 苏州大学计算机科学与技术学院 江苏苏州215006 南京大学计算机软件新技术国家重点实验室 南京210023 吉林大学符号计算与知识工程教育部重点实验室 长春130012
深度Q网络模型在处理需要感知高维输入数据的决策控制任务中性能良好.然而,在深度Q网络及其改进算法中基本使用静态的跳帧方法,即动作被重复执行固定的次数.另外,优先级经验重放是对均匀采样的一种改进,然而目前各个研究仅将样本的时间... 详细信息
来源: 评论