针对当前去雾算法效率不高、细节恢复较差等问题,提出一种改进多尺度AOD-Net(all in one dehazing network)的去雾算法。通过增加注意力机制、调整网络结构和改变损失函数这3方面的改进,增强网络的特征提取和恢复能力。模型的第1层增加...
详细信息
针对当前去雾算法效率不高、细节恢复较差等问题,提出一种改进多尺度AOD-Net(all in one dehazing network)的去雾算法。通过增加注意力机制、调整网络结构和改变损失函数这3方面的改进,增强网络的特征提取和恢复能力。模型的第1层增加空间金字塔注意力(spatial pyramid attention,SPA)机制,使网络在特征提取过程中避免冗余信息。将网络改成拉普拉斯金字塔型结构,使模型能够提取不同尺度的特征,保留特征图的高频信息。使用多尺度结构相似性(multi-scale structural similarity,MS-SSIM)+L1损失函数替换原有的损失函数,提高模型保留结构的能力。实验结果表明,本方法去雾效果更好,细节更丰富。在定性可视化评价方面,去雾图像效果优于原网络。在定量评估层面,与原网络相比PSNR值提升了2.55 dB,SSIM值提升了0.04,IE熵值增加了0.18,这些数值指标充分验证了本算法的出色去雾效果和稳定性。
目的相比于一般视频目标检测跟踪任务,视频羽毛球的实时定位跟踪主要面临两大难点:1)羽毛球属于小目标,同时伴有严重的运动模糊以及相似目标的干扰,使用基于矩形框的目标检测跟踪方法准确率低且会带来中心点误差问题;2)单帧图像很难准确定位羽毛球目标,利用视频前后帧的时域特征则可以跟踪到羽毛球目标,而现有提取时域特征的网络模块结构复杂,难以满足实时性要求。针对以上问题,本文使用热力图轮廓检测方法,提出了羽毛球运动小目标的定位跟踪网络算法(shuttlecock track net,STNet)。方法网络主体采用“U”型编解码结构;针对小目标像素信息少的问题,基于SE(squeeze and excitation)通道注意力与残差结构设计高效特征提取模块(SE channel attention and residual,SECAR),实现了空域信息的高效提取与传递,提高了网络的定位性能;针对目标丢失与相似目标干扰问题,设计了时序网络(temporal network,TPN)结构用于提取和记忆视频时域特征,提高了网络跟踪性能。结果在羽毛球比赛公开数据集TrackNetv2与自制数据集上的实验表明,本文方法在多个指标上取得了最好的性能表现。相较于现有性能较好的羽毛球定位跟踪方法TrackNetv2,本文方法在准确率、精确率和F1上分别提高7.5%、15.7%和7.5%,并且显著降低了参数量,满足实时处理需求(54帧/s)。结论本文提出的STNet羽毛球定位跟踪网络,在面对羽毛球目标外观剧烈变化以及背景干扰严重时,能够准确定位羽毛球比赛视频帧中可能存在的羽毛球,实现羽毛球的稳定跟踪,相比其他羽毛球定位跟踪网络,具有更优的性能。
暂无评论