咨询与建议

限定检索结果

文献类型

  • 497 篇 期刊文献
  • 70 篇 会议

馆藏范围

  • 567 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 542 篇 工学
    • 441 篇 计算机科学与技术...
    • 276 篇 软件工程
    • 94 篇 控制科学与工程
    • 48 篇 机械工程
    • 36 篇 网络空间安全
    • 30 篇 信息与通信工程
    • 26 篇 仪器科学与技术
    • 8 篇 电子科学与技术(可...
    • 4 篇 化学工程与技术
    • 3 篇 建筑学
    • 3 篇 船舶与海洋工程
    • 3 篇 生物医学工程(可授...
    • 2 篇 环境科学与工程(可...
  • 178 篇 管理学
    • 175 篇 管理科学与工程(可...
    • 3 篇 图书情报与档案管...
    • 2 篇 工商管理
  • 31 篇 理学
    • 11 篇 数学
    • 8 篇 生物学
    • 6 篇 系统科学
    • 4 篇 大气科学
    • 3 篇 统计学(可授理学、...
    • 1 篇 化学
  • 13 篇 艺术学
    • 13 篇 设计学(可授艺术学...
  • 8 篇 教育学
    • 7 篇 教育学
    • 1 篇 心理学(可授教育学...
  • 8 篇 文学
    • 6 篇 外国语言文学
    • 1 篇 中国语言文学
    • 1 篇 新闻传播学
  • 4 篇 经济学
    • 4 篇 应用经济学
  • 2 篇 农学
  • 1 篇 法学
    • 1 篇 社会学
  • 1 篇 医学

主题

  • 25 篇 深度学习
  • 20 篇 强化学习
  • 20 篇 指代消解
  • 17 篇 深度强化学习
  • 16 篇 语义角色标注
  • 14 篇 机器学习
  • 11 篇 支持向量机
  • 11 篇 中文信息处理
  • 11 篇 p2p
  • 11 篇 树核函数
  • 10 篇 依存关系
  • 10 篇 vpn
  • 9 篇 卷积神经网络
  • 8 篇 聚类
  • 8 篇 计算机应用
  • 7 篇 图像分割
  • 7 篇 对等网络
  • 7 篇 注意力机制
  • 7 篇 自然语言处理
  • 7 篇 sip

机构

  • 550 篇 苏州大学
  • 281 篇 江苏省计算机信息...
  • 33 篇 南京邮电大学
  • 27 篇 辽宁师范大学
  • 26 篇 软件新技术与产业...
  • 17 篇 吉林大学
  • 13 篇 江苏科技大学
  • 12 篇 南京信息工程大学
  • 10 篇 苏州科技学院
  • 10 篇 符号计算与知识工...
  • 9 篇 苏州科技大学
  • 9 篇 河南理工大学
  • 8 篇 南通大学
  • 6 篇 江苏省大数据智能...
  • 6 篇 南京交通职业技术...
  • 6 篇 南京航空航天大学
  • 6 篇 华东理工大学
  • 6 篇 常熟理工学院
  • 6 篇 扬州大学
  • 5 篇 东南大学

作者

  • 122 篇 朱巧明
  • 82 篇 李培峰
  • 61 篇 zhu qiao-ming
  • 60 篇 陆建德
  • 59 篇 周国栋
  • 52 篇 吕强
  • 44 篇 li pei-feng
  • 40 篇 zhu qiaoming
  • 35 篇 刘全
  • 33 篇 liu quan
  • 33 篇 朱艳琴
  • 32 篇 孔芳
  • 30 篇 钱培德
  • 28 篇 lu jian-de
  • 27 篇 li peifeng
  • 26 篇 kong fang
  • 24 篇 zhou guo-dong
  • 23 篇 杨哲
  • 21 篇 王红玲
  • 20 篇 lv qiang

语言

  • 566 篇 中文
  • 1 篇 英文
检索条件"机构=苏州大学计算机系江苏省计算机信息处理技术重点实验室"
567 条 记 录,以下是361-370 订阅
排序:
基于互信息优化的Option-Critic算法
收藏 引用
计算机科学 2024年 第2期51卷 252-258页
作者: 栗军伟 刘全 徐亚鹏 苏州大学计算机科学与技术学院 江苏苏州215006 软件新技术与产业化协同创新中心 南京210000 吉林大学符号计算与知识工程教育部重点实验室 长春130012 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006
时序抽象作为分层强化学习的重要研究内容,允许分层强化学习智能体在不同的时间尺度上学习策略,可以有效解决深度强化学习难以处理的稀疏奖励问题。如何端到端地学习到优秀的时序抽象策略一直是分层强化学习研究面临的挑战。Option-Crit... 详细信息
来源: 评论
多通道Laplacian矩阵融合的超图直推学习模型
收藏 引用
小型微型计算机系 2023年 第11期44卷 2566-2575页
作者: 徐良奎 杨哲 吴国荣 赵雷 苏州大学计算机科学与技术学院 江苏苏州215006 江苏省计算机信息处理技术重点实验室 江苏苏州215006 江苏省大数据智能工程实验室 江苏苏州215006 高等计算医学实验室北卡罗来纳大学教堂山分校 美国教堂山NC 27599
超图直推学习模型是机器学习领域研究热点.超图模型的性能取决于构造的超图结构及其Laplacian矩阵的质量.现有超图模型基于单一超图结构,信息表达能力有限.本文提出超图结构扩张法,将异构超图的关联矩阵和权重矩阵拼接,融合更多的顶点... 详细信息
来源: 评论
基于相似度约束的双策略蒸馏深度强化学习方法
收藏 引用
计算机科学 2023年 第1期50卷 253-261页
作者: 徐平安 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 软件新技术与产业化协同创新中心 南京210000 吉林大学符号计算与知识工程教育部重点实验室 长春130012 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006
策略蒸馏是一种将知识从一个策略转移到另一个策略的方法,在具有挑战性的强化学习任务中获得了巨大的成功。典型的策略蒸馏方法采用的是师生策略模型,即知识从拥有优秀经验数据的教师策略迁移到学生策略。获得一个教师策略需要耗费大量... 详细信息
来源: 评论
基于情节经验回放的深度确定性策略梯度方法
收藏 引用
计算机科学 2021年 第10期48卷 37-43页
作者: 张建行 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
强化学习中的连续控制问题一直是近年来的研究热点。深度确定性策略梯度(Deep Deterministic Policy Gradients,DDPG)算法在连续控制任务中表现优异。DDPG算法利用经验回放机制训练网络模型,为了进一步提高经验回放机制在DDPG算法中的效... 详细信息
来源: 评论
基于随机加权三重Q学习的异策略最大熵强化学习算法
收藏 引用
计算机科学 2022年 第6期49卷 335-341页
作者: 范静宇 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
强化学习是机器学习中一个重要的分支,随着深度学习的发展,深度强化学习逐渐发展为强化学习研究的重点。因应用广泛且实用性较强,面向连续控制问题的无模型异策略深度强化学习算法备受关注。同基于离散动作的Q学习一样,类行动者-评论家... 详细信息
来源: 评论
基于最小二乘的双权重学习法
收藏 引用
计算机科学 2020年 第12期47卷 210-217页
作者: 李斌 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 软件新技术与产业化协同创新中心 南京210000 吉林大学符号计算与知识工程教育部重点实验室 长春130012
强化学习是人工智能领域中的一个研究热点。在求解强化学习问题时,传统的最小二乘法作为一类特殊的函数逼近学习方法,具有收敛速度快、充分利用样本数据的优势。通过对最小二乘时序差分算法(Least-Squares Temporal Difference,LSTD)的... 详细信息
来源: 评论
纵横网上教学统的设计和实现
收藏 引用
苏州大学学报(自然科学版) 2000年 第2期16卷 31-38页
作者: 鲁征山 李培峰 朱巧明 江苏省计算机信息处理技术重点实验室 苏州大学工学院计算机工程系 江苏苏州215006
首先阐述了开发纵横网上教学统的背景、开发环境及相关的技术 ;然后介绍了此统的设计思想 ;最后以其中的纵横码测试部分为例 。
来源: 评论
基于视觉注意力机制的异步优势行动者-评论家算法
收藏 引用
计算机科学 2019年 第5期46卷 169-174页
作者: 李杰 凌兴宏 伏玉琛 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
异步深度强化学习能够通过多线程技术极大地减少学习模型所需要的训练时间。然而作为异步深度强化学习的一种经典算法,异步优势行动者-评论家算法没有充分利用某些具有重要价值的区域信息,网络模型的学习效率不够理想。针对此问题,文中... 详细信息
来源: 评论
一种快速收敛的最大置信上界探索方法
收藏 引用
计算机科学 2022年 第1期49卷 298-305页
作者: 敖天宇 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
深度强化学习(Deep Reinforcement Learning,DRL)方法在大状态空间控制任务上取得了出色效果,探索问题一直是该领域的一个研究热点。现有探索算法存在盲目探索、学习慢等问题。针对以上问题,提出了一种快速收敛的最大置信上界探索(Upper... 详细信息
来源: 评论
基于自指导动作选择的近端策略优化算法
收藏 引用
计算机科学 2021年 第12期48卷 297-303页
作者: 申怡 刘全 苏州大学计算机科学与技术学院 江苏苏州215006 苏州大学江苏省计算机信息处理技术重点实验室 江苏苏州215006 吉林大学符号计算与知识工程教育部重点实验室 长春130012 软件新技术与产业化协同创新中心 南京210000
强化学习领域中策略单调提升的优化算法是目前的一个研究热点,在离散型和连续型控制任务中都具有了良好的性能表现。近端策略优化(Proximal Policy Optimization,PPO)算法是一种经典策略单调提升算法,但PPO作为一种同策略(on-policy)算... 详细信息
来源: 评论