叶片表型检测是感知杨树生长状态的重要手段之一,叶片颜色、姿态、纹理等形态结构表型信息可揭示植株所受胁迫的程度。其中,单个叶片分割是计算、统计其表型参数的基础。当前流行的AI算法已可满足叶片分割任务的性能需求,然而常规深度学习模型训练需要大量人工标签,制约了其发展和应用。本研究提出一种融合零样本学习和迁移学习的杨树叶片实例分割方法:运用视觉大模型GroundingDINO检索杨树苗图像中的叶片,获取对应的边界框;使用Segment Anything 2模型(segment anything model v2,SAM2)分割图像中全部对象,得到对应的掩膜(mask);将GroundingDINO模型生成的边界框作为提示,辅助SAM2过滤出叶片类别的掩膜;利用迁移学习策略,将AI生成的叶片掩膜作为标签信息,训练轻量化的YOLOv8-Segment模型。此外,构建独立测试集用于评估模型分割精度,选择交并比阈值为50%的平均精度(average precision using 50%intersection over union threshold,AP_(50))和平均交并比(mean intersection over union,mIoU)作为性能指标。结果表明,基于“Leaf”这一检索词,GroundingDINO与SAM2的组合(权重约810 MB)可实现高性能的杨树叶片分割,AP_(50)为0.936,mIoU为0.778。通过过滤异常尺寸的提示边界框,AP_(50)提升至0.942。迁移学习得到的YOLOv8-Segment模型权重仅6.5 MB,AP_(50)为0.888,大幅精简模型的同时保障了精度。本研究涉及的叶片分割模型构建过程均无须人工标注,实现了高效率、低成本的杨树叶片实例分割,可为杨树叶片计数和叶面积计算等后续表型分析应用提供技术支持。
声景描述了生物多样性、人类活动和其他声音的空间和时间模式,反映了重要的人为和生态过程。声景分类不仅有助于提升不同声景成分计算分析的准确率,还有助于深入了解不同声音的特点和分布,从而为保护和改善生态环境提供依据。然而,被动声学设备采集的大量录音数据给声景数据的分析带来困难。为平衡采样数据量与采样成本之间的矛盾,有必要探索一种高效的录音策略,满足声景分类研究的需要。本研究以北京野鸭湖湿地公园的录音数据为研究对象,在不同录音策略下对比了7个声学指数(声学复杂度指数(acoustic complexity index,ACI)、声学多样性指数(acoustic diversity index,ADI)、声学均匀度指数(acoustic evenness index,AEI)、生物声学指数(bioacoustic index,BIO)、声熵指数(acoustic entropy index,H)、振幅包络线中值(median of the amplitude envelope,M)和标准化声景差异指数(normalized difference sound index,NDSI))和BYOL-A(bootstrap your own latent for audio)特征的表现,探索适合声景分类(生物声、地理声、人工声)的录音策略及声学特征。结果表明:(1)每小时均匀采集10个1 min的子样本可以较好地平衡数据量与成本之间的矛盾(Spearman相关系数ρ>0.9);(2)描述声景的多个声学指数中,ACI和H是最稳定的指标;(3)BYOL-A特征比声学指数能更有效地完成声景分类。合适的录音策略和高性能的深度学习特征——BYOL-A特征能够快速捕捉声景信息,有助于提高声景分类的准确率。本研究结果可为声景数据采集和声学特征选择提供参考依据。
暂无评论