咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >面向新一代神威超级计算机平台的大气动力学问题全隐式求解器研究 收藏

面向新一代神威超级计算机平台的大气动力学问题全隐式求解器研究

FULLY-IMPLICIT SOLVER FOR ATMOSPHERIC MODELING ON THE NEXT GENERATION SUNWAY SUPERCOMPUTERS

作     者:陈道琨 刘芳芳 杨超 Chen Daokun;Liu Fangfang;Yang Chao

作者机构:中国科学院大学北京100049 中国科学院软件研究所并行软件与计算科学实验室北京100190 中国科学院软件研究所计算机科学国家重点实验室北京100190 北京大学数学科学学院北京100871 

出 版 物:《数值计算与计算机应用》 (Journal on Numerical Methods and Computer Applications)

年 卷 期:2023年第44卷第2期

页      面:198-213页

学科分类:07[理学] 070601[理学-气象学] 0706[理学-大气科学] 

基  金:国家重点研发计划高性能计算重点专项(2020YFB0204601)资助 

主  题:大气动力学数值模拟 规则递推关系 异构并行计算 申威26010Pro处理器 结构化问题 

摘      要:大气动力学问题的数值模拟在气象预报等领域具有广泛的应用.相关数值模拟依赖超级计算机平台实现高精度高分辨率的气象预报,隐式求解不受稳定性条件限制,相比显式求解更有优势.面向新的超级计算机架构特征研究隐式大气动力学问题中一系列算子操作的并行和优化方法是非常有必要的.本文在规则递推关系的理论框架下对大气动力学问题预条件阶段的稀疏三角回代求解以及ILU矩阵分解操作的特征进行了总结,并结合申威26010Pro处理器的架构特点,对现有结构化稀疏三角线性方程组问题的并行算法进行了推广,设计了一套面向单向规则递推关系的算法框架,解决了预条件阶段各类算子的并行加速问题.本文还面向申威26010Pro处理器对大气动力学问题的模板计算等算子进行了移植和优化.实验结果显示,本文的算法框架对预条件阶段的算子能够实现26-33倍不等的加速效果,对模板计算等算子的优化相比串行计算有10-152倍的加速比.在新的神威超级计算机上最大测试到1700多万核心,浮点性能达到20.5PFlop/s.在大规模测试条件下的强(弱)可扩展性维持在56.81%(41.87%)以上.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分