现有的半监督声音事件检测方法直接使用强标签合成样本、弱标签真实样本和无标签真实样本进行训练,以缓解标签样本量不足的问题。然而,合成和真实数据域之间存在不可避免的分布差异,这种差异会干扰模型梯度优化方向,从而限制模型的泛化能力。针对这一问题,基于元学习(Meta Learning)提出了一种新颖的半监督声音事件检测学习范式MMT(Meta Mean Teacher)。具体来说,对于每个训练批次的数据,将其分为由合成样本组成的元训练集和由真实样本组成的元测试集;将模型在元训练集上计算的元梯度作为元测试梯度更新的指导,使模型感知并学习到更具泛化性的知识。在DCASE2021任务4数据集的测试集上进行对比实验,结果表明,相较于官方基线,所提出的学习范式MMT在F1,PSDS1和PSDS2指标上分别提升了8.9%,6.6%和1.1%;相较于当前的先进方法,所提出的学习范式MMT同样表现出了显著的性能优势。
针对红外弱小目标容易在网络迭代过程中损失纹理细节信息,从而导致目标定位和轮廓分割的准确性下降的问题,提出一种基于信息补偿的红外弱小目标检测方法。首先,利用图像特征提取(IFE)模块编码红外源图像的浅层细节及深层语义特征;其次,构建多级信息补偿(MIC)模块通过聚合相邻级别的特征对编码阶段下采样后的特征进行信息补偿;随后,引入全局目标响应(GTR)模块联合特征图的全局上下文信息对卷积局部性的限制进行补偿;最后,构建非对称交叉融合(ACF)模块对浅层和深层特征进行融合,以实现目标解码时纹理信息与位置信息的保留,进而完成对红外弱小目标的检测。在公开的NUAA-SIRST(Nanjing University of Aeronautics and Astronautics-Singleframe InfraRed Small Target)和NUDT-SIRST(National University of Defense Technology-Single-frame InfraRed Small Target)混合数据集上训练和测试的实验结果表明,与UIUNet(U-Net in U-Net Network)、LSPM(Local Similarity Pyramid Modules)和DNANet(Dense Nested Attention Network)等方法相比,所提方法在交并比(IoU)上分别提高了9.2、8.9和5.5个百分点,在F1分数(F1-Score)上分别提高了6.0、5.4和3.1个百分点。以上表明所提方法对红外复杂背景图像中的弱小目标可以实现准确检测和有效分割。
暂无评论