RISC-V作为一种新兴的开源精简指令集架构,是后摩尔时代处理器技术发展与创新的关键之一.浮点求和与点积运算是数值运算的基础组成部分,在众多领域应用广泛.目前RISC-V架构尚未适配兼具高精度和高效率的求和与点积运算算法,这是因为现有优化方案难以良好地平衡运算精度和效率,要么侧重于低精度算法效率,要么通过牺牲效率实现高精度运算.本文利用RVV(RISC-V Vector instruction set extension,RVV)矢量扩展指令,设计并实现了一种基于无误差变换技术的高效、高精度求和与点积算法.首先避免使用规约指令以防止运算精度降低,实现并优化两类运算基于RVV的向量化算法;其次根据算法中的数据依赖关系,对寄存器配置参数进行优化.最后针对算法核心步骤进行汇编优化,增加指令级并行度,提高流水线利用率.实验结果表明,与两类运算操作的原始算法相比,优化后的算法运算效率分别提高了4.4和4.2倍.优化后的算法与多精度库MPFR中的四精度算法有相同精度,但其运算效率明显优于后者,其计算速度与OpenBLAS的双精度计算速度相当.
低剂量CT(low-dose CT,LDCT)图像的去噪任务是一个高度复杂且不确定的逆问题。现有的基于CNN的方法虽然有效,但提升空间有限且计算成本高。相比之下,将图像先验知识与模型相结合来辅助图像去噪是一种更有效的方法。提出了一种名为AWTV_GANet的LDCT图像去噪框架。该框架利用自适应加权总变分(adaptive weighted total variation,AWTV)展开和高斯注意力引导的方法,通过端到端的CNN模型,将噪声优化模型、边缘检测模型和图像重建模型集成在一起。实验证明,AWTV_GANet能够准确地去除伪影噪声,并恢复出更精细的结构细节,与其他方法相比具有优异的性能。
暂无评论