版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:中国科学院软件研究所并行软件与计算科学实验室北京100190 北京大学数学科学学院北京100871 计算机科学国家重点实验室(中国科学院软件研究所)北京100190 中国科学院大学北京100049 国家并行计算机工程技术研究中心北京100190
出 版 物:《软件学报》 (Journal of Software)
年 卷 期:2020年第31卷第10期
页 面:3184-3196页
核心收录:
学科分类:08[工学] 081202[工学-计算机软件与理论] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点研发计划(2016YFB0200603) 北京市自然科学基金(JQ18001)
主 题:申威26010处理器 一维FFT 两层分解 Cooley-Tukey 众核并行
摘 要:根据申威26010众核处理器的特点提出了基于两层分解的一维FFT众核并行算法.该算法基于迭代的Stockham FFT计算框架和Cooley-Tukey FFT算法,将大规模FFT分解成一系列的小规模FFT来计算,并通过设计合理的任务划分方式、寄存器通信、双缓冲以及SIMD向量化等与计算平台相关的优化方法来提高FFT的计算性能.最后对所提出算法的性能进行了测试,相比于单主核上运行的FFTW3.3.4库,获得了平均44.53x的加速比,最高加速比可达56.33x,且其带宽利用率最高可达83.45%.