针对Julia程序运行的时限约束,提出一种基于有色Petri网的程序运行性能自适应模拟方法。面向特定领域构建适应底层计算资源特点的工具库,抽取针对Julia语言的计算原语;程序员通过Julia语言实现原语,动态选取领域工具,适应运行时限约束。结合图像对象识别案例,构建Colored Petri Net模型,借助CPN Tools工具模拟运行,自动优化备选方案。模拟实验表明,基于工具库的性能标定,CPN模拟得到的工具库映射方案接近最优。
为了提高公安机关查找犯罪车辆的效率,提高车辆识别的效率很必要。据统计,提取兴趣区域(Region Of Interest,ROI)约占车型识别过程的60%,因此如何加速提取ROI过程尤其重要。首先,通过数据划分方法实现基本并行算法;然后,经过实验分析,...
详细信息
为了提高公安机关查找犯罪车辆的效率,提高车辆识别的效率很必要。据统计,提取兴趣区域(Region Of Interest,ROI)约占车型识别过程的60%,因此如何加速提取ROI过程尤其重要。首先,通过数据划分方法实现基本并行算法;然后,经过实验分析,在基本并行算法的基础上,精心设计预处理过程的分解方案,设置多队列缓冲区,减少共用缓冲区的线程数量和每个缓冲区互斥锁锁定的次数。实验证明,所提算法在双CPU 12核(支持超线程到24线程)的服务器上运行,相对于串行算法,实现了13.1x的加速比。
稀疏矩阵向量乘(SpMV)是科学与工程计算中一个重要的核心函数,但在当前基于存储器层次结构的计算平台上,传统CSR(Compressed Sparse Row)存储的稀疏矩阵向量乘性能较低,运行效率往往远低于硬件浮点峰值的10%.目前现有的处理器架构一般都采用SIMD向量化技术进行加速,但是传统CSR格式的稀疏矩阵向量乘由于访存的不规则性,不能直接采用向量化技术进行加速,为了利用SIMD技术,对具有局部性特征的稀疏矩阵,提出了新的稀疏矩阵存储格式CSRL(Compressed Sparse Row with Local information),该格式可以减少SpMV时内存访问次数,并且能够充分利用硬件的SIMD向量化技术进行读取和计算,提高了SpMV性能.实验表明,该方法相比国际著名商业库Intel MKL10.3版平均性能提升达到29.5%,最高可达89%的性能提升.
为提高PPMLR-MHD(Lagrangian version of Piecewise Parabolic Method-Magnetohydrodynamics)数值模拟算法的计算速度,对其进行了并行化及性能调优.对于理想MHD模型,描述了基于拉格朗日坐标的逐段抛物线方法PPMLR数值模拟算法,并用OpenM...
详细信息
为提高PPMLR-MHD(Lagrangian version of Piecewise Parabolic Method-Magnetohydrodynamics)数值模拟算法的计算速度,对其进行了并行化及性能调优.对于理想MHD模型,描述了基于拉格朗日坐标的逐段抛物线方法PPMLR数值模拟算法,并用OpenMP、MPI及两者混合并行的方法进行了并行优化,在深腾7000及天河1A系统进行了测试.对于此应用算法,MPI及混合并行的优化效果不如共享内存的OpenMP线程并行优化,OpenMP并行化在深腾7000胖节点可扩展到256线程,加速比为29.3,有较好的并行效果.
暂无评论