该研究致力于构建一个高质量的数据集,用于南美白对虾养殖领域的命名实体识别(named entity recognition,NER)任务,命名为VamNER。为确保数据集的多样性,从CNKI数据库中收集了近10年的高质量论文,并结合权威书籍进行语料构建。邀请专家讨论实体类型,并经过专业培训的标注人员使用IOB2标注格式进行标注,标注过程分为预标注和正式标注两个阶段以提高效率。在预标注阶段,标注者间一致性(inter-annotation agreement,IAA)达到0.87,表明标注人员的一致性较高。最终,VamNER包含6115个句子,总字符数达384602,涵盖10个实体类型,共有12814个实体。研究通过与多个通用领域数据集和一个特定领域数据集进行比较,揭示了VamNER的独特特性。在实验中使用了预训练的基于变换器的双向编码器表示(bidirectional encoder representations from Transformers,BERT)模型、双向长短期记忆神经网络(bidirectional long short-term memory network,BiLSTM)和条件随机场模型(conditional random fields,CRF),最优模型在测试集上的F1值达到82.8%。VamNER成为首个专注于南美白对虾养殖领域的NER数据集,为中文特定领域NER研究提供了丰富资源,有望推动水产养殖领域NER研究的发展。
多目标跟踪技术对猪只精细化养殖具有重要意义。针对饲养环境差异、猪只的快速移动以及群猪之间的频繁遮挡带来的多目标跟踪挑战,该研究提出了一种基于Byte的生猪多目标跟踪算法UKFTrack。首先,构建了一个采用定向边界框(oriented bounding box,OBB)标注的多样化数据集,涵盖了猪只多种运动模式以及不同饲养场景和猪群密度;其次,引入了无迹卡尔曼滤波以更好地适配OBB标注,并对传统的状态向量进行扩展,新增了角度和角速度参数,设计了残差函数处理角度变量以避免直接相减所造成的误差。最后,提出了一种多阶段匹配策略,通过多次轨迹关联和补充匹配机制,确保在遮挡严重或剧烈运动的情况下,仍能保持对目标的持续跟踪。试验结果表明,在白天重度密集、白天极度密集、夜间重度密集和夜间极度密集4种复杂场景下,UKFTrack的高阶跟踪精度(higher order tracking accuracy,HOTA)分别为96.10%、83.10%、76.50%和84.00%,IDF1得分(identification F1 score)分别为95.70%、78.20%、70.10%和77.60%。相较于StrongSORT,UKFTrack的HOTA分别提高了1.2、13.3、5.9和6.3个百分点,IDF1分别提高了0.1、10.9、5.4和7.4个百分点。因此,该研究提出的跟踪算法能实现复杂环境下群体生猪的准确跟踪,且展现出较强的鲁棒性,能为实际应用中猪只行为与健康监测提供可靠的技术支持。
暂无评论