版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:山西农业大学信息科学与工程学院太谷030801 山西农业大学农业工程学院太谷030801 山西农业大学基础部太谷030801
出 版 物:《农业机械学报》 (Transactions of the Chinese Society for Agricultural Machinery)
年 卷 期:2024年第55卷第6期
页 面:219-228页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:财政部和农业农村部:国家现代农业产业技术体系建设项目(CARS-06-14.5-A21) 中央引导地方科技发展资金项目(YDZJSX20231A042) 山西省谷子现代农业产业技术体系建设项目(2023CYJSTX04-04) 山西省重点研发重大项目(2022ZDYF119) 山西省基础研究计划项目(202203021212428)
主 题:苹果 成熟度检测 复杂果园环境 YOLO v7 窗口多头自注意力机制 ASFF
摘 要:针对复杂果园环境下目标检测算法参数量大、鲁棒性差等问题,本文提出一种改进的YOLO v7网络模型用于苹果成熟度(未成熟、半成熟、成熟)检测。以YOLO v7为基线网络,在特征提取结构中引入窗口多头自注意力机制(Swin transformer,ST),极大地降低网络参数量与计算量;为提高模型对远景图像中小目标的检测能力,在特征融合结构中引入自适应空间特征融合(Adaptively spatial feature fusion,ASFF)模块优化Head部分,有效利用图像的浅层特征和深层特征,加强特征尺度不变性;采用WIoU(Wise intersection over union)代替原始CIoU(Complete intersection over union)损失函数,在提高检测准确率的同时加快模型收敛速度。试验结果表明,本文改进的YOLO v7-ST-ASFF模型在苹果图像测试集上的检测速度和准确率均有显著提高,不同成熟度检测精确率、召回率和平均精度均值可达92.5%、84.2%和93.6%,均优于Faster R-CNN、SSD、YOLO v3、YOLO v5、YOLO v7以及YOLO v8目标检测模型;针对多目标、单目标、顺光、逆光、远景、近景以及套袋、未套袋苹果目标的检测效果都较好;本文网络模型内存占用量为53.4MB,模型平均检测时间(Average detection time,ADT)为***,均优于其他目标检测模型。改进的YOLO v7-ST-ASFF模型能够满足复杂果园环境下苹果目标的检测,可为果蔬机器人自动化采摘提供技术支撑。