版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:国家高性能计算机工程技术研究中心北京100193 公安部网络安全保卫局北京100741 北京邮电大学计算机学院北京100876
出 版 物:《计算机科学》 (Computer Science)
年 卷 期:2014年第41卷第6期
页 面:113-118页
核心收录:
学科分类:07[理学] 070102[理学-计算数学] 0701[理学-数学]
摘 要:代数多重网格(AMG)是众多数值模拟应用的核心算法,在基于多核的NUMA架构的机群系统上,AMG的并行扩展性暴露了新的问题。通过设计感知NUMA架构的内存分配器,将划分给多个线程的数据分割并绑定到运行对应线程的CPU所属的NUMA存储节点上,从而改善了OpenMP多线程并行的数据局部性,使BoomerAMG程序在大规模多核计算平台上具有更好的并行扩展性。在单节点和小规模机群的测试中,使用NAAlloc分配器分别获得了最高16%和60%的性能提升。