咨询与建议

限定检索结果

文献类型

  • 125 篇 期刊文献
  • 3 篇 会议

馆藏范围

  • 128 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 118 篇 工学
    • 103 篇 计算机科学与技术...
    • 87 篇 软件工程
    • 58 篇 控制科学与工程
    • 11 篇 机械工程
    • 2 篇 仪器科学与技术
    • 2 篇 信息与通信工程
    • 1 篇 生物医学工程(可授...
    • 1 篇 生物工程
    • 1 篇 网络空间安全
  • 65 篇 管理学
    • 64 篇 管理科学与工程(可...
    • 1 篇 图书情报与档案管...
  • 6 篇 理学
    • 4 篇 数学
    • 1 篇 物理学
    • 1 篇 系统科学
  • 2 篇 文学
    • 2 篇 新闻传播学
  • 1 篇 教育学
    • 1 篇 教育学
  • 1 篇 军事学
    • 1 篇 军队指挥学

主题

  • 28 篇 强化学习
  • 11 篇 深度强化学习
  • 7 篇 数据挖掘
  • 7 篇 深度学习
  • 4 篇 函数逼近
  • 4 篇 人工智能
  • 4 篇 支持向量机
  • 4 篇 策略梯度
  • 4 篇 行动者评论家
  • 4 篇 连续空间
  • 4 篇 经验回放
  • 4 篇 深度q网络
  • 4 篇 循环神经网络
  • 4 篇 卷积神经网络
  • 3 篇 最小二乘
  • 3 篇 遗传算法
  • 3 篇 数据结构
  • 3 篇 梯度下降
  • 3 篇 目标检测
  • 3 篇 算法

机构

  • 104 篇 吉林大学
  • 53 篇 苏州大学
  • 25 篇 软件新技术与产业...
  • 12 篇 符号计算与知识工...
  • 9 篇 辽宁大学
  • 7 篇 常熟理工学院
  • 5 篇 江苏省计算机信息...
  • 4 篇 清华大学
  • 3 篇 吉林财经大学
  • 2 篇 江苏省软件新技术...
  • 2 篇 大连理工大学
  • 2 篇 内蒙古民族大学
  • 2 篇 苏州城市学院
  • 2 篇 昆明理工大学
  • 2 篇 上海大学
  • 2 篇 东北师范大学
  • 2 篇 北京化工大学
  • 1 篇 中国科学院长春光...
  • 1 篇 苏州科技大学
  • 1 篇 苏州工业职业技术...

作者

  • 44 篇 刘全
  • 14 篇 周春光
  • 11 篇 傅启明
  • 11 篇 伏玉琛
  • 11 篇 朱斐
  • 8 篇 张永刚
  • 8 篇 徐红艳
  • 8 篇 刘大有
  • 8 篇 冯勇
  • 7 篇 王嵘冰
  • 7 篇 凌兴宏
  • 7 篇 王喆
  • 6 篇 欧阳丹彤
  • 5 篇 刘亚波
  • 5 篇 季怡
  • 5 篇 刘纯平
  • 4 篇 肖飞
  • 4 篇 齐红
  • 4 篇 闫岩
  • 4 篇 左万利

语言

  • 128 篇 中文
检索条件"基金资助=教育部重点实验室资助项目“符号计算与知识工程教育部重点实验室”资助的成果"
128 条 记 录,以下是11-20 订阅
排序:
基于相似度约束的双策略蒸馏深度强化学习方法
收藏 引用
计算机科学 2023年 第1期50卷 253-261页
作者: 徐平安 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 软件新技术与产业化协同创新中心 南京210000 吉林大学符号计算与知识工程教育部重点实验室 长春130012 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006
策略蒸馏是一种将知识从一个策略转移到另一个策略的方法,在具有挑战性的强化学习任务中获得了巨大的成功。典型的策略蒸馏方法采用的是师生策略模型,即知识从拥有优秀经验数据的教师策略迁移到学生策略。获得一个教师策略需要耗费大量... 详细信息
来源: 评论
基于增强特征金字塔网络的场景文本检测算法
收藏 引用
计算机科学 2022年 第2期49卷 248-255页
作者: 邵海琳 季怡 刘纯平 徐云龙 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学应用技术学院 江苏苏州215300
场景文本检测有助于机器理解图像内容,在智能交通、场景理解和智能导航等领域应用广泛。现有的场景文本检测算法未充分利用高层语义信息和空间信息,限制了模型对复杂背景像素的分类能力和对不同尺度的文本实例的检测和定位能力。为解决... 详细信息
来源: 评论
信息引导和残差置乱的场景图生成方法
收藏 引用
计算机科学与探索 2021年 第10期15卷 1958-1968页
作者: 田鑫 季怡 高海燕 林欣 刘纯平 苏州大学计算机科学与技术学院 江苏苏州215006 符号计算与知识工程教育部重点实验室(吉林大学) 长春130012
场景图因其具有的表示视觉场景内容的语义和组织结构的特点,有助于视觉理解和可解释推理,成为计算机视觉研究热点之一。但由于现存的视觉场景中目标和目标之间关系标注的不平衡,导致现有的场景图生成方法受到数据集偏置影响。对场景图... 详细信息
来源: 评论
一种加速时间差分算法收敛的方法
收藏 引用
自动化学报 2021年 第7期47卷 1679-1688页
作者: 何斌 刘全 张琳琳 时圣苗 陈红名 闫岩 苏州大学计算机科学与技术学院 苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
时间差分算法(Temporal difference methods,TD)是一类模型无关的强化学习算法.该算法拥有较低的方差和可以在线(On-line)学习的优点,得到了广泛的应用.但对于一种给定的TD算法,往往只能通过调整步长参数或其他超参数来加速收敛,这也就... 详细信息
来源: 评论
基于随机加权三重Q学习的异策略最大熵强化学习算法
收藏 引用
计算机科学 2022年 第6期49卷 335-341页
作者: 范静宇 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
强化学习是机器学习中一个重要的分支,随着深度学习的发展,深度强化学习逐渐发展为强化学习研究的重点。因应用广泛且实用性较强,面向连续控制问题的无模型异策略深度强化学习算法备受关注。同基于离散动作的Q学习一样,类行动者-评论家... 详细信息
来源: 评论
一种快速收敛的最大置信上界探索方法
收藏 引用
计算机科学 2022年 第1期49卷 298-305页
作者: 敖天宇 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
深度强化学习(Deep Reinforcement Learning,DRL)方法在大状态空间控制任务上取得了出色效果,探索问题一直是该领域的一个研究热点。现有探索算法存在盲目探索、学习慢等问题。针对以上问题,提出了一种快速收敛的最大置信上界探索(Upper... 详细信息
来源: 评论
结合改进差分进化和模块密度的社区发现算法
收藏 引用
计算机科学与探索 2020年 第6期14卷 1070-1080页
作者: 冯勇 张冰茹 徐红艳 王嵘冰 张永刚 辽宁大学信息学院 沈阳110036 吉林大学符号计算与知识工程教育部重点实验室 长春130012
社区发现是个性化推荐、群体特征归集、社会网络分析等领域研究的基础与核心,而现有社区发现算法在处理日益复杂的社会网络时,存在准确性不高、收敛速度慢、模块度分辨率受限等问题。为此,将差分进化和模块密度思想引入社区发现中,提出... 详细信息
来源: 评论
视频内容特征与弹幕文本相结合的短视频推荐模型
收藏 引用
辽宁大学学报(自然科学版) 2021年 第2期48卷 108-115页
作者: 冯勇 邹宝旭 徐红艳 辽宁大学信息学院 辽宁沈阳110036
随着多媒体和互联网技术的融合发展,短视频以其时长短、内容精练的特点获得广大用户的喜爱.但目前短视频推荐大多基于用户的评论或标签,推荐的准确性不高,效率较低.为此,提出了一种视频内容特征与弹幕文本相结合的短视频推荐模型,融合... 详细信息
来源: 评论
带最大熵修正的行动者评论家算法
收藏 引用
计算机学报 2020年 第10期43卷 1897-1908页
作者: 姜玉斌 刘全 胡智慧 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
在行动者评论家算法中,策略梯度通常使用最大熵正则项来提高行动策略的随机性以保证探索.策略的随机使Agent能够遍历所有动作,但是会造成值函数的低估并影响算法的收敛速度与稳定性.针对策略梯度中最大熵正则项带来的低估问题,提出最大... 详细信息
来源: 评论
基于双重注意力机制的异步优势行动者评论家算法
收藏 引用
计算机学报 2020年 第1期43卷 93-106页
作者: 凌兴宏 李杰 朱斐 刘全 伏玉琛 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000 常熟理工学院计算机科学与工程学院 江苏常熟215500
深度强化学习是目前机器学习领域发展最快的技术之一.传统的深度强化学习方法在处理高维度大状态的空间任务时,庞大的计算量导致其训练时间过长.虽然异步深度强化学习利用异步方法极大缩短了训练时间,但会忽略某些更具价值的图像区域和... 详细信息
来源: 评论