目标检测是对图像中感兴趣的物体进行识别和定位,是图像理解和应用的基础任务。遥感图像目标检测是目标检测应用的重要研究方向,被广泛应用于城市规划、灾害监测、军事制导和无人机导航等领域,具有很高的军用和民用价值。随着深度学习目标检测理论的发展,遥感图像目标检测性能取得了巨大的提升,然而遥感图像的高分辨率、目标尺度差异大且分布不均匀、空间场景复杂难以与目标区分等特点,增大了遥感图像目标检测的研究难度,导致遥感图像目标检测的发展滞后于普通图像目标检测的发展进程。本文在现有研究和深度学习目标检测理论的基础上,对单阶段检测网络进行改进,使其更好地应用于遥感图像目标检测领域,提出快速有效的基于单阶段检测网络的遥感图像目标检测模型。其创新点主要有三个方面。(1)在卷积神经网络中,浅层特征图包含丰富的细节信息但缺乏语义信息,深层特征图包含丰富的语义信息但缺乏细节信息,为了利用不同深度特征图的优势以及检测多尺度目标,提出采用卷积核金字塔和空洞卷积的单阶段目标检测模型(Single-Stage Detection based on Filter Pyramid and Atrous convolution,AFP-SSD)。首先,所提模型使用像素相加方式融合多层不同分辨率的特征图,并在通道维度拼接不同阶段的特征图,形成具有丰富语义信息和细节信息的特征信息融合层作为模型的预测特征层。其次,所提模型在锚框机制中引入卷积核金字塔结构以检测多尺度的目标,同时采用空洞卷积减少大尺寸卷积核增加的参数量,合理地降低锚框数量。实验结果表明,所提模型不仅具有较快的检测速度和较高的精度,而且较好地解决了小目标以及重叠目标难以检出的问题。(2)提出单阶段遥感目标检测模型:特征注意力金字塔网络FAPNet(Feature Attention Pyramid Network)。首先,FAPNet模型使用特征注意力金字塔模块融合不同特征层的特征信息,形成多个不同分辨率的预测特征层,提升遥感图像中不同尺度目标的检测精度。其次,使用弱监督注意力模块调整预测特征层的特征分布,强化目标区域特征,提升遥感图像中遮挡目标的检测精度。在特征注意力金字塔模块中,使用通道拼接方式融合不同层的特征图,并使用SE(Squeeze-and-Excitation)注意力机制对融合特征图在通道维度重标定,自适应地调整不同层特征图在融合特征图中的丰富度。在弱监督注意力模块中,将分割结果预测值作为位置注意力权重,调整预测特征层的特征分布,提升目标检测网络的性能。实验结果表明,所提模型在两个遥感图像数据集上超越基线模型和其他先进模型,取得较好的检测精度。(3)不同尺度目标和遮挡目标的检测问题是遥感图像目标检测研究中的难点问题。特征金字塔结构是提高不同尺度目标检测精度的有效方法,但是在特征金字塔结构中,逐层传递特征信息的方式容易产生特征信息丢失问题,因此提出跳跃连接特征金字塔模块进一步增强特征金字塔结构中各个特征层的语义和细节信息。另外,用位置注意力强化目标区域特征是提高遮挡目标检测精度的有效方法,但是以往的位置注意力会同时强化产生不精确预测结果的特征区域,对最终预测结果产生干扰,因此提出基于锚框的位置注意力模块,聚焦于强化更可能产生精确预测结果的特征区域。将跳跃连接特征金字塔模块和基于锚框的位置注意力模块嵌入到RetinaNet模型中,形成端到端的单阶段遥感目标检测模型:基于锚框的注意力网络AANet(Anchor-based Attention Network)。实验结果表明,AANet模型是一个快速有效的单阶段遥感目标检测器。
暂无评论