咨询与建议

限定检索结果

文献类型

  • 199 篇 期刊文献
  • 69 篇 会议
  • 1 篇 学位论文

馆藏范围

  • 269 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 224 篇 工学
    • 173 篇 计算机科学与技术...
    • 78 篇 软件工程
    • 33 篇 机械工程
    • 17 篇 控制科学与工程
    • 8 篇 仪器科学与技术
    • 6 篇 力学(可授工学、理...
    • 5 篇 信息与通信工程
    • 5 篇 网络空间安全
    • 4 篇 电子科学与技术(可...
    • 3 篇 动力工程及工程热...
    • 2 篇 地质资源与地质工...
    • 2 篇 航空宇航科学与技...
    • 2 篇 核科学与技术
    • 1 篇 材料科学与工程(可...
    • 1 篇 测绘科学与技术
  • 42 篇 管理学
    • 38 篇 管理科学与工程(可...
    • 4 篇 图书情报与档案管...
  • 37 篇 理学
    • 29 篇 数学
    • 2 篇 天文学
    • 2 篇 系统科学
    • 1 篇 物理学
    • 1 篇 化学
    • 1 篇 地理学
    • 1 篇 大气科学
    • 1 篇 生物学
    • 1 篇 统计学(可授理学、...
  • 5 篇 经济学
    • 5 篇 应用经济学
  • 5 篇 艺术学
    • 5 篇 设计学(可授艺术学...
  • 2 篇 教育学
    • 2 篇 教育学
  • 1 篇 哲学
    • 1 篇 哲学
  • 1 篇 农学
  • 1 篇 军事学

主题

  • 14 篇 并行计算
  • 13 篇 高性能计算机
  • 12 篇 排行榜
  • 12 篇 性能
  • 10 篇 性能测试
  • 9 篇 opencl
  • 9 篇 gpu
  • 8 篇 分析
  • 8 篇 top100
  • 7 篇 并行算法
  • 7 篇 图形处理器
  • 6 篇 mpi
  • 6 篇 虚拟现实
  • 6 篇 稀疏矩阵向量乘
  • 6 篇 跨平台
  • 5 篇 直线加速器
  • 5 篇 粒子追踪
  • 5 篇 存储层次
  • 5 篇 cuda
  • 5 篇 性能优化

机构

  • 90 篇 中国科学院软件研...
  • 49 篇 中国科学院研究生...
  • 47 篇 中国科学院软件研...
  • 40 篇 中国科学院软件研...
  • 27 篇 中国科学院大学
  • 27 篇 中国科学院软件研...
  • 21 篇 中国科学院计算机...
  • 13 篇 北京大学
  • 13 篇 中国海洋大学
  • 12 篇 中国科学院
  • 10 篇 中科院软件所并行...
  • 9 篇 北京应用物理与计...
  • 9 篇 计算机科学国家重...
  • 8 篇 中国科学院软件研...
  • 7 篇 中国科学技术大学
  • 6 篇 国防科学技术大学
  • 6 篇 石家庄铁道大学
  • 6 篇 中国科学院数学与...
  • 5 篇 中科院计算机科学...
  • 5 篇 中国科学院软件所...

作者

  • 104 篇 张云泉
  • 29 篇 孙家昶
  • 21 篇 杨超
  • 19 篇 刘芳芳
  • 19 篇 李玉成
  • 17 篇 王婷
  • 17 篇 吴恩华
  • 14 篇 龙国平
  • 13 篇 袁国兴
  • 12 篇 贾海鹏
  • 11 篇 张常有
  • 11 篇 孙相征
  • 11 篇 曹建文
  • 11 篇 张林波
  • 10 篇 马文静
  • 10 篇 张先轶
  • 8 篇 颜深根
  • 8 篇 李焱
  • 8 篇 陈道琨
  • 8 篇 张健

语言

  • 269 篇 中文
检索条件"机构=并行软件与计算科学实验室"
269 条 记 录,以下是151-160 订阅
排序:
基于延迟隐藏因子的GPU计算模型
基于延迟隐藏因子的GPU计算模型
收藏 引用
2010年全国高性能计算学术年会(HPC china2010)
作者: 袁良 张云泉 王可 张先轶 中国科学院软件研究所并行软件与计算科学实验室 北京 100190 中国科学院计算机科学国家重点实验室 北京 100190 中国科学院研究生院 北京 100049 中国科学院软件研究所并行软件与计算科学实验室 北京 100190 中国科学院计算机科学国家重点实验室 北京 100190 中国科学院软件研究所并行软件与计算科学实验室 北京 100190
近年来在生物计算科学计算等领域成功地应用了GPU 加速计算并获得了较高加速比.然而在GPU 上 编程和调优过程非常繁琐,为此,研究人员提出了许多提高编程效率的编程模型和编译器,以及指导程序优化的 计算模型,在一定程度上简化了G... 详细信息
来源: 评论
SIMD技术与向量数学库研究
SIMD技术与向量数学库研究
收藏 引用
2010年全国高性能计算学术年会(HPC china2010)
作者: 解庆春 张云泉 王可 李炎 中国科学院软件研究所并行软件与计算科学实验室 北京 100190 中国科学院软件研究所并行软件与计算科学实验室 北京 100190 中国科学院计算机科学国家重点实验室 北京 100190 中国科学院软件研究所并行软件与计算科学实验室 北京 100190 中国科学院计算机科学国家重点实验室 北京 100190 中国科学院研究生院 北京 100049
首先,结合Intel、AMD 和IBM 处理器,介绍了SIMD 向量化技术,以及各自特点.其次,在三种平台上对各自开发的函数库中的部分向量数学函数进行了测试.实验结果表明,相对传统的标量计算,向量化技术带来的加速比较高,特别是Cell SDK ... 详细信息
来源: 评论
BLAS库在多核处理器上的性能测试与分析
BLAS库在多核处理器上的性能测试与分析
收藏 引用
2010年全国高性能计算学术年会(HPC china2010)
作者: 陈少虎 张云泉 张先轶 程豪 中国科学院软件研究所并行软件与计算科学实验室 北京 100190 中国科学院软件研究所计算机科学股价重点实验室 北京 100190 中国科学院研究生院 北京 100190 中国科学院软件研究所并行软件与计算科学实验室 北京 100190 中国科学院软件研究所计算机科学股价重点实验室 北京 100190 中国科学院软件研究所并行软件与计算科学实验室 北京 100190
BLAS 库是高性能计算中最基本的数学库,它的性能对超级计算机的性能有着极大的影响.而且随着CPU多核化的发展,BLAS的多核并行性能已经变得比与体系结构相关的单核性能更加重要.实验以流行于高性能计算的Xeon、Opteron 系列多核X86 处理... 详细信息
来源: 评论
行星流体动力学大规模并行模拟及分析
行星流体动力学大规模并行模拟及分析
收藏 引用
2010年全国高性能计算学术年会(HPC china2010)
作者: 王婷 张云泉 孙相征 杨超 中国科学院软件研究所并行软件与计算科学实验室 北京 100190 中国科学院软件研究所并行软件与计算科学实验室 北京 100190 中国科学院软件研究所计算机科学国家重点实验室 北京 100190 中国科学院软件研究所并行软件与计算科学实验室 北京 100190 中国科学院软件研究所计算机科学国家重点实验室 北京 100190 中国科学院研究生院 北京 100190
主要介绍了行星流体动力学大规模并行模拟中病态压力方程的预条件子和迭代算法的选取,并根据 强弱可扩展性的概念,对弱可扩展性的实验结果进行了分析。具体分析了在维持每核平均的浮点操作次数基 本不变的情况下,倍增处理器规模时,程序... 详细信息
来源: 评论
2009年中国高性能计算机发展现状分析与展望
收藏 引用
数据与计算发展前沿 2010年 第1期1卷 76-84页
作者: 张云泉 孙家昶 袁国兴 张林波 中国科学院软件研究所并行软件与计算科学实验室 北京应用物理与计算数学所 中国科学院数学与系统科学研究院
本文根据2009年11月发布的中国高性能计算机TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。在此基础上,根据八届排行榜积累的性能数据和能够得到的其他公开历史数据,对未来几年... 详细信息
来源: 评论
2009年中国高性能计算机发展现状分析与展望
收藏 引用
科研信息化技术与应用 2010年 第1期1卷 76-84页
作者: 张云泉 孙家昶 袁国兴 张林波 中国科学院软件研究所并行软件与计算科学实验室 北京100190 北京应用物理与计算数学所 北京100088 中国科学院数学与系统科学研究院 北京100190
本文根据2009年11月发布的中国高性能计算机TOP100排行榜的数据,对国内高性能计算机的发展现状从总体性能、制造商、行业领域等方面进行了深入分析。在此基础上,根据八届排行榜积累的性能数据和能够得到的其他公开历史数据,对未来几年... 详细信息
来源: 评论
行星流体动力学数值模拟程序的千核性能优化
收藏 引用
数据与计算发展前沿 2010年 第3期1卷 24-29页
作者: 张云泉 王婷 孙相征 杨超 李力刚 中国科学院软件研究所并行软件与计算科学实验室 中国科学院软件研究所计算机科学国家重点实验室 中国科学院研究生院 中国科学院上海天文台
基于百万亿次超级计算机深腾7000,对行星流体动力学数值模拟程序的性能优化进行了研究。首先,进行了从原基于Aztec库到PETSc库改进后的程序的8-2048核强可扩展性测试。测试结果表明,在每节点8核或4核时,PETSc程序运行时间平均是Aztec程... 详细信息
来源: 评论
行星流体动力学数值模拟程序的千核性能优化
收藏 引用
科研信息化技术与应用 2010年 第3期1卷 24-29页
作者: 张云泉 王婷 孙相征 杨超 李力刚 中国科学院软件研究所并行软件与计算科学实验室 北京100190 中国科学院软件研究所计算机科学国家重点实验室 北京100190 中国科学院研究生院 北京100190 中国科学院上海天文台 上海200030
基于百万亿次超级计算机深腾7000,对行星流体动力学数值模拟程序的性能优化进行了研究。首先,进行了从原基于Aztec库到PETSc库改进后的程序的8-2048核强可扩展性测试。测试结果表明,在每节点8核或4核时,PETSc程序运行时间平均是Aztec程... 详细信息
来源: 评论
SpMV的自动性能优化实现技术及其应用研究
收藏 引用
计算机研究与发展 2009年 第7期46卷 1117-1126页
作者: 袁娥 张云泉 刘芳芳 孙相征 中国科学院软件研究所并行计算实验室 北京100190 中国科学院研究生院 北京100049 中国科学院计算机科学国家重点实验室 北京100190
科学计算中,稀疏矩阵向量乘(SpMV)是一个十分重要且经常被大量调用的计算内核.由于SpMV一般实现算法的浮点计算和存储访问次数比率非常低,且其存储访问模式极为不规则,其实际运行性能往往很低.通过采用寄存器分块算法和启发式分块大... 详细信息
来源: 评论
平行六边形区域非均匀节点快速傅立叶变换
收藏 引用
数值计算计算机应用 2009年 第1期30卷 58-69页
作者: 李明亮 李会元 孙家昶 中国科学院软件研究所并行计算实验室中国科学院研究生院 北京100190 中国科学院软件研究所并行计算实验室 北京100190
本文研究平行六边形区域上的非均匀节点离散傅立叶变换的快速算法及其实现.首先在晶格(Lattice)的框架下建立了平行六边形区域上的非均匀节点离散傅立叶变换(NDFTH).在此基础上设计了平行六边形区域上的非均匀节点快速傅立叶变换(NFFTH... 详细信息
来源: 评论