利用深度学习对声呐图像进行目标检测是近年来的研究热点,然而声呐图像存在目标尺度分布集中、数据获取难等问题,导致检测效果难以满足需求。针对该问题,提出了一种基于可变尺度先验框的目标检测方法。首先,考虑到声呐图像中目标的尺度分布具有其特殊性,基于先验统计生成可变尺度先验框。其次,为了解决声呐图像稀缺的难题,采用数据增强的方法对训练集进行扩充。最后,探索了模型的轻量化,通过删减模型的大目标检测层,在不降低模型精度的同时简化模型结构。为了评估算法的有效性,以前视声呐图像为例进行了综合试验,平均精度(mean average precision,mAP)@0.75和mAP@0.5:0.95分别达0.585和0.559,较原Yolov5网络分别提升了5.8%和3.1%,同时每秒10亿次浮点运算次数下降到14.9。结果表明,所提算法具有更高的精度和更轻量化的模型结构。
针对跟踪模型泛化能力差、跟踪模型正样本选取质量低、深层模型参数量大不利于部署等问题,本文提出了超轻量化孪生网络模型Siamese-remo。首先结合传统随机采样方法和go-turn方法,设计出新型的正负样本选取策略,增加模型泛化能力;其次采用shiftbox-remo的数据增强方式均匀正样本分布,并提升正样本采集质量;然后通过改进后的超轻量化Mobileone-remo网络提取特征,一定程度减少深层网络对跟踪平移不变性的破坏,并预设不同特征融合参数,单独训练网络分类和回归;最终加入Center-rank loss函数,根据样本点位置影响置信度、IOU排名,对网络分类回归策略进行优化。实验证明,自然场景下奶牛单目标跟踪模型期望平均重合度(Expected average overlap,EAO)达到0.475,相对于基线模型提升0.078,与现有跟踪器对比取得了较好的成绩,且参数量仅为现有主流算法的1/20,为后续自然场景下奶牛身份识别与目标跟踪系统提供了技术支持。
暂无评论