针对细粒度鸟类检测的数据标注成本高,以及湿地地区鸟类种类繁多、现实场景复杂化等引起的湿地鸟类检测精度低的问题,该研究提出一种基于半监督CST的湿地场景下的细粒度鸟类检测算法(semi-supervised bird detection with CNN and swin ...
详细信息
针对细粒度鸟类检测的数据标注成本高,以及湿地地区鸟类种类繁多、现实场景复杂化等引起的湿地鸟类检测精度低的问题,该研究提出一种基于半监督CST的湿地场景下的细粒度鸟类检测算法(semi-supervised bird detection with CNN and swin transformer,SSBY-CST),首先基于北京14处监测站在不同湿地场景下采集到的图像,构建了涵盖17种鸟类图像数据集,为模型鲁棒性提供可靠数据支撑。其次提出基于伪标签学习法的单阶段半监督学习框架,基于Yolov5主干网络构建教师学生模型,高效利用无标签数据提升检测性能;训练阶段使用双阈值伪标签分配策略替代传统单一阈值伪标签分配,以优化无监督损失函数。然后设计了结合CNN和Swin Transformer的双通道卷积模块CST,以提高不同类别鸟类与湿地背景的区分能力。试验结果表明,仅在100张标注图像下,该文SSBY-CST算法对17种复杂环境下鸟类的检测精准率和mAP@0.5分别为77.5%和58.2%,相比同时期较先进的YOLO模型提升了17.4个百分点和15.5个百分点,在少量标注的前提下实现了较高的检测性能提升,其中黑鹳、西伯利亚银鸥的m AP@0.5分别达到了95.7%和94.5%,相比基线提升了24.9个百分点和14.3个百分点。此外,消融试验分析了双阈值伪标签分配的作用及CST模块的效果,验证了双阈值伪标签分配与CST模块设计的有效性。该框架利用无标注样本在极少量标注量下提升复杂环境下细粒度鸟类检测性能,以加强农林生态的智能数字化管理。该文将半监督扩展到细粒度鸟类检测,为处理农林生态环境下的鸟类检测提供了技术路径。
以北京市四惠枢纽为研究对象,探索以数据驱动为导向满足乘客需求的枢纽动态导向标识方案评估及优化设计方法。首先,搭建KANO乘客需求模型,通过桌面实验,形成动态导向标识在内容、样式及空间位置上的优化设计方案,与四惠枢纽现有方案形成对比。其次,基于寻路理论通过建筑信息建模(building information modeling,BIM)+虚拟现实(virtual reality,VR)仿真技术,实现人与枢纽的信息交互,提取新旧导向标识方案作用下乘客寻路过程的特征参数。最后,通过对寻路实验中主客观指标分析可知,被试在新版动态导向标识方案中寻路时间、犯错误点数及迷茫点数显著降低,且新版动态导向标识方案在内容、样式及空间位置上满意度均优于旧版。结果表明:研究搭建BIM+VR的虚拟仿真平台,形成以数据驱动为导向的枢纽动态导向标识方案综合评估及优化设计方法,为枢纽动态导向标识方案设计及合理应用提供技术与理论支撑。
暂无评论