咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >HVMS:基于混合向量化的SpMV优化机制 收藏

HVMS:基于混合向量化的SpMV优化机制

HVMS:A Hybrid Vectorization-Optimized Mechanism of SpMV

作     者:颜志远 解壁伟 包云岗 Yan Zhiyuan;Xie Biwei;Bao Yungang

作者机构:处理器芯片全国重点实验室(中国科学院计算技术研究所)北京100190 中国科学院大学北京100049 

出 版 物:《计算机研究与发展》 (Journal of Computer Research and Development)

年 卷 期:2024年第61卷第12期

页      面:2969-2984页

核心收录:

学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 

基  金:国家重点研发计划项目(2022YFB4500403) 国家自然科学基金项目(62090022) 中国科学院战略性先导科技专项(XDA0320300) 

主  题:稀疏矩阵向量乘 向量优化 稀疏矩阵 SIMD 多核系统 

摘      要:在科学计算和系统工程等领域,稀疏矩阵向量乘(sparse matrix-vector multiplication,SpMV)占据着极其重要的位置.受限于矩阵稀疏性所导致的访存不规则性,向量优化一直是SpMV的难点.针对此问题,进行深入分析并且总结影响SpMV向量化效率的主要因素.除却稀疏矩阵内非零元分布的不规则,不同稀疏矩阵之间的非零元分布特征亦有明显不同,导致单一的向量优化策略难以适用于多种不同特征的稀疏矩阵.另一方面,多样化向量硬件在向量特性和指令上的差异,影响了SpMV向量优化方法的通用性.把不规则的稀疏矩阵映射到规则的向量硬件上进行计算,是SpMV向量化面临的最主要挑战.基于此,提出一种基于混合向量化方法的SpMV优化机制(hybrid vectorization-optimized mechanism of SpMV,HVMS).HVMS首先对向量硬件的特性进行抽象建模,并基于抽象出的基本操作,设计相应的规则指导稀疏矩阵进行规则化转换.按照不同的矩阵特征,HVMS将稀疏矩阵划分为不同的部分,弱化稀疏矩阵的不规则程度,并引入不同的优化策略最大化SpMV的向量化效率,从而提升性能.基于Intel Xeon平台,在30个常用稀疏矩阵上对HVMS进行实验分析.结果表明,相比现有代表性工作如CVR,SELL-C-σ,Intel MKL,HVMS分别获得1.60倍、1.72倍和1.93倍的平均加速比.

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分