时域有限差分法(FDTD)最早是由***在1966年提出的,至今已成为进行电磁场分析的重要方法。在近几十年来,由于稳定性条件的要求和采用Yee元胞体离散的方式求解Maxwell方程,用FDTD计算目标电磁散射时需要消耗大量的计算资源,计算往往需要较长时间。由于FDTD算法具有天然可并行优势,采用并行技术是提高计算效率的有效途径。因此研究基于GPU的并行FDTD算法,为FDTD应用提供一种低成本的并行计算方案是非常必要的。现代图形处理器GPU(Graphic Process Units)将数据流并行处理的概念引入科学计算中,对数据的并行处理有很强的能力。由于图形图像处理相关产业的迅速发展,GPU与CPU相比价格不高,运算能力却高出几十到几百倍。统一计算架构(CUDA)是NVIDIA公司可编程多线程GPU提供的一种技术。GPU有效地支持数量巨大的线程,因此可以提高程序的性能达几个数量级。GPU在大型电磁场FDTD计算中运算速度优势非常明显。本文主要工作如下:1、介绍CUDA的编程模型及架构,主要包括主机与设备、线程层次、硬件映射、软件体系及存储体系。2、使用CUDA对FDTD加速算法的具体实现方法,主要包括二维FDTD并行算法的线程组织形式、基于CUDA的FDTD并行算法流程、及具体实现加速的相关代码。3、通过数值仿真测试了运行时间、加速比等,证明了GPU加速FDTD方法的效果明显。一维与二维算例,仿真了TEM波在自由空间中的传播、点源在自由空间中的辐射及平面波的散射加速、二维算例分别采用了PEC、Mur、UPML三种吸收边界条件并进行了加速比较,同时使用同样的平台搭载三种显卡进行加速,结果进行比较与分析。
暂无评论