咨询与建议

限定检索结果

文献类型

  • 64 篇 期刊文献
  • 2 篇 会议
  • 1 篇 学位论文

馆藏范围

  • 67 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 51 篇 工学
    • 48 篇 计算机科学与技术...
    • 16 篇 软件工程
    • 3 篇 控制科学与工程
    • 1 篇 力学(可授工学、理...
    • 1 篇 机械工程
    • 1 篇 动力工程及工程热...
    • 1 篇 电子科学与技术(可...
    • 1 篇 生物工程
    • 1 篇 网络空间安全
  • 14 篇 理学
    • 10 篇 数学
    • 2 篇 生物学
    • 1 篇 物理学
    • 1 篇 大气科学
    • 1 篇 系统科学
  • 7 篇 管理学
    • 7 篇 管理科学与工程(可...
  • 4 篇 经济学
    • 4 篇 应用经济学
  • 1 篇 农学
    • 1 篇 作物学
  • 1 篇 医学
    • 1 篇 公共卫生与预防医...

主题

  • 13 篇 高性能计算机
  • 12 篇 排行榜
  • 12 篇 性能
  • 8 篇 分析
  • 8 篇 top100
  • 3 篇 测评技术
  • 3 篇 申威26010处理器
  • 2 篇 超级计算机
  • 2 篇 多核
  • 2 篇 mpi
  • 2 篇 sw26010-pro众核处...
  • 2 篇 人工智能
  • 2 篇 失效模型
  • 2 篇 spmv
  • 2 篇 机群
  • 2 篇 并行计算
  • 2 篇 自适应
  • 2 篇 能效
  • 2 篇 高性能计算
  • 2 篇 结构化网格

机构

  • 18 篇 中国科学院软件研...
  • 13 篇 国家并行计算机工...
  • 12 篇 数学工程与先进计...
  • 11 篇 北京大学
  • 9 篇 中国科学院大学
  • 9 篇 北京应用物理与计...
  • 8 篇 复旦大学
  • 8 篇 中国科学院软件研...
  • 7 篇 北京应用物理与计...
  • 6 篇 中国科学院数学与...
  • 6 篇 国防科技大学
  • 5 篇 解放军信息工程大...
  • 5 篇 中科院软件所并行...
  • 4 篇 中科院数学与系统...
  • 4 篇 计算机科学国家重...
  • 3 篇 中国科学院软件所...
  • 3 篇 全军后勤信息中心
  • 2 篇 国防科学技术大学
  • 2 篇 中国科学院研究生...
  • 2 篇 装备指挥技术学院

作者

  • 16 篇 孙家昶
  • 14 篇 袁国兴
  • 14 篇 张云泉
  • 12 篇 杨超
  • 11 篇 张林波
  • 10 篇 刘芳芳
  • 8 篇 张为华
  • 7 篇 陈道琨
  • 6 篇 陈左宁
  • 6 篇 张铮
  • 5 篇 姚继锋
  • 4 篇 刘鑫
  • 4 篇 马文静
  • 4 篇 张鲁飞
  • 4 篇 王正华
  • 3 篇 刘杰
  • 3 篇 张振慧
  • 3 篇 隋然
  • 3 篇 胡怡
  • 3 篇 李晓梅

语言

  • 67 篇 中文
检索条件"机构=数学并行计算实验室"
67 条 记 录,以下是1-10 订阅
排序:
使用申威人工智能加速器的控制单元最小化Transformer推理开销(英文)
收藏 引用
Frontiers of Information Technology & Electronic Engineering 2025年 第4期26卷 605-623页
作者: 赵玉龙 吴春志 王一卓 张鲁飞 张亚光 沈文渊 范昊 方韩康 秦亦 刘鑫 数学工程与先进计算国家重点实验室 航天工程大学士官学校 国家超级计算无锡中心 之江实验室 国家并行计算机工程技术研究中心
基于Transformer架构的模型已成为自然语言处理领域的基石。然而,推理过程巨大的计算开销仍然是重大挑战,限制了这些模型的实际应用。本文在人工智能(AI)加速器上使用控制单元,以最小化Transformer模型推理过程的开销,主要包含4... 详细信息
来源: 评论
面向SW26010P的异形矩阵乘法众核并行优化技术研究
收藏 引用
计算机工程与应用 2025年 第6期61卷 150-163页
作者: 胡怡 陈道琨 杨超 北京大学数学科学学院 北京100871 北京大学长沙计算与数字经济研究院先进计算研究中心 长沙410205 中国科学院软件研究所并行软件与计算科学实验室 北京100190
矩阵乘法广泛应用于科学与工程计算领域,是基础线性代数库中的关键优化对象。随着人工神经网络、计算流体力学等领域的快速发展,异形(irregular-shaped)矩阵乘法正在迅速引起关注。研究集中在针对国产新一代神威超级计算机采用的SW26010... 详细信息
来源: 评论
大语言模型微调方法研究综述
收藏 引用
中文信息学报 2025年 第2期39卷 1-26页
作者: 吴春志 赵玉龙 刘鑫 司念文 张鲁飞 范昊 数学工程与先进计算国家重点实验室 江苏无锡214125 航天工程大学士官学校 北京102200 信息工程大学信息系统工程学院 河南郑州450001 国家并行计算机工程技术研究中心 北京100083
近年来,大语言模型成为人工智能领域非常受关注的技术,引发了自然语言处理领域新的研究范式。在大语言模型训练实践中,参数微调是其中非常重要的一个环节,它允许用户在资源受限条件下,通过调整少部分参数来提升模型理解用户指令、解决... 详细信息
来源: 评论
平行六边形区域上的快速离散傅立叶变换
收藏 引用
计算数学 2004年 第3期26卷 351-366页
作者: 孙家昶 姚继锋 中科院软件所并行计算实验室 北京100080
In this paper, we propose a fast algorithm for computing the DGFT (Discrete Generalized Fourier Transforms) on hexagon domains [6], based on the geometric properties of the domain. Our fast algorithm (FDGFT) reduces t... 详细信息
来源: 评论
任意三角形区域中一组完备正交基的构造与分类
收藏 引用
计算数学 2003年 第2期25卷 219-230页
作者: 杨志杰 孙家昶 中科院软件所并行计算实验室 北京100080
In this paper, we propose a new set of orthogonal basis functions in the arbitrarytriangular domain. At first, we generalize the 1-D Sturm-Liouville equation tothe arbitrary triangular domain on a barycentric coordina... 详细信息
来源: 评论
集群网络评测模型的新探索
收藏 引用
软件学报 2005年 第6期16卷 1131-1139页
作者: 唐渊 孙家昶 张云泉 张林波 中国科学院软件研究所并行计算实验室 中国科学院数学与系统科学研究院科学与工程计算国家重点实验室 北京100080
传统集群网络(clusterareanetwork,简称cLAN)的评测模型主要考虑了延迟、带宽、路由、拥塞、网络拓扑结构等因素.但这些因素是否足以描述实际应用程序在集群上的通信行为,或者对其在集群系统上的性能给出一个很好的预测呢?当对NASParall... 详细信息
来源: 评论
计算中基于一致性约束条件的迭代模型研究
收藏 引用
计算机研究与发展 2019年 第2期56卷 431-441页
作者: 孙茹君 张鲁飞 郝子宇 陈左宁 数学工程与先进计算国家重点实验室 江苏无锡214125 国家并行计算机工程技术研究中心 北京100190
迭代计算是数值计算中有效的逼近方式,能够拟合多种计算模型.在大数据分析领域尤其是图计算中,迭代计算能够抽象描述大部分图算法,对结构化数据挖据和关联分析至关重要.随着数据规模的增长,很多精确算法的时空复杂度已经难以满足现实需... 详细信息
来源: 评论
“神威·太湖之光”计算机系统大规模应用特征分析与E级可扩展性研究
收藏 引用
计算机学报 2018年 第10期41卷 2209-2220页
作者: 刘鑫 郭恒 孙茹君 陈左宁 国家并行计算机工程技术研究中心 江苏无锡214083 数学工程与先进计算国家重点实验室 江苏无锡214125
复杂应用系统面临着全系统、全物理过程、自然尺度的计算模拟,对计算机能力提出更高要求.该文介绍了"神威·太湖之光"系统半机以上超大规模并行应用的算法特点、体系结构适应性、计算复杂度、访存复杂度和通信复杂度的大... 详细信息
来源: 评论
一类六边形网格上拉普拉斯4点差分格式及其预条件子
收藏 引用
计算数学 2005年 第4期27卷 437-448页
作者: 杨超 孙家昶 中国科学院软件研究所并行计算实验室
本文提出平面上拉普拉斯算子在一类平行六边形网格上的成对4点差分格式.这种差分格式虽然只有一阶的局部截断误差,但实际具有二阶的收敛性.基于平行六边形网格可以被分解为两套三向三角形网格,我们给出成对4点格式的二阶收敛性的证明,... 详细信息
来源: 评论
面向高性能计算的众核处理器结构级高能效技术
收藏 引用
计算机学报 2014年 第10期37卷 2176-2186页
作者: 郑方 张昆 邬贵明 高红光 唐勇 吕晖 过锋 李宏亮 谢向辉 陈左宁 数学工程与先进计算国家重点实验室 江苏无锡214125 国家并行计算机工程技术研究中心 北京100190
随着半导体技术的进步,众核处理器已经广泛应用于高性能计算领域.而要构建未来高性能计算系统,处理器必须突破严峻的"能耗墙"挑战.文中以一款自主众核处理器DFMC原型为基础,首先对其在典型负载下的能耗分布进行了分析,结合该... 详细信息
来源: 评论