针对复杂语境下的蔬菜种植领域命名实体识别任务中存在实体分布不均衡、实体边界不清晰和语义关联不足等问题,提出一种基于对抗训练和多头自注意力机制的蔬菜种植领域命名实体识别模型。以番茄为研究对象,采用ALBERT(a lite BERT)提取...
详细信息
针对复杂语境下的蔬菜种植领域命名实体识别任务中存在实体分布不均衡、实体边界不清晰和语义关联不足等问题,提出一种基于对抗训练和多头自注意力机制的蔬菜种植领域命名实体识别模型。以番茄为研究对象,采用ALBERT(a lite BERT)提取语料动态词向量,结合对抗训练对词向量扰动生成对抗样本并集成为嵌入层输出,缓解农业数据不平衡问题;在特征提取层中通过引入多头自注意力机制对BiLSTM提取的序列特征进一步优化权重分布,更多关注边界信息,加强文本语义关联;最后采用条件随机场解码标注序列。在由8个类别和5542条标注样本构建的语料库Veg-Tomato上进行了实验。结果表明,该模型的精确率、召回率和F1值分别达89.26%、85.77%、87.48%,较最优基线模型提高了0.69、3.56、2.21个百分点,在小样本数据上仍能表现较高的识别精度,适用于蔬菜种植领域命名实体识别任务。
[目的/意义]借助智能化识别及图像处理等技术来实现对移栽后蔬菜状态的识别和分析,将会极大提高识别效率。为了实现甘蓝大田移栽情况的实时监测和统计,提高甘蓝移栽后的成活率以及制定后续工作方案,减少人力和物力的浪费,研究一种自然环境下高效识别甘蓝移栽状态的算法。[方法]采集移栽后的甘蓝图像,利用数据增强方式对数据进行处理,输入YOLOv8s(You Only Look Once Version 8s)算法中进行识别,通过结合可变形卷积,提高算法特征提取和目标定位能力,捕获更多有用的目标信息,提高对目标的识别效果;通过嵌入多尺度注意力机制,降低背景因素干扰,增加算法对目标区域的关注,提高模型对不同尺寸的甘蓝的检测能力,降低漏检率;通过引入Focal-EIoU Loss(Focal Extended Intersection over Union Loss),优化算法定位精度,提高算法的收敛速度和定位精度。[结果和讨论]提出的算法经过测试,对甘蓝移栽状态的召回率R值和平均精度均值(Mean Average Precision,mAP)分别达到92.2%和96.2%,传输速率为146帧/s,可满足实际甘蓝移栽工作对移栽状态识别精度和速度的要求。[结论]提出的甘蓝移栽状态检测方法能够实现对甘蓝移栽状态识别的准确识别,可以提升移栽质量测量效率,减少时间和人力投入,提高大田移栽质量调查的自动化程度。
暂无评论