在光谱三维CT数据中,传统卷积的全局特征捕捉能力不足,而全尺度的自注意力机制则需要大量的计算资源.为了解决这一问题,本文引入一种新视觉注意力范式(wave self-attention,WSA).相比于ViT技术,该机制使用更少的资源获得同等的自注意力信息.此外,为更充分地提取器官间的相对依赖关系并提高模型的鲁棒性和执行速度,本文为WSA机制设计了一种即插即用的模块——波随机编码器(wave random encoder,WRE).该编码器能够生成一对互逆的非对称全局(局部)位置信息矩阵.其中,全局位置矩阵用来对波特征进行全局性的随机取样,局部位置矩阵则用于补充因随机取样而丢失的局部相对依赖.本文在标准数据集Synapse和COVID-19的肾脏和肺实质的分割任务上进行实验.结果表明,本文方法在精度、参数量和推理速率方面均超越了nnFormer、Swin-UNETR等现有模型,达到了SOTA水平.
暂无评论