本研究致力于构建一个高质量的数据集,用于南美白对虾养殖领域的命名实体识别(Named Entity Recognition,NER)任务,命名为VamNER。为确保数据集的多样性,从CNKI数据库中收集了近10年的高质量论文,并结合权威书籍进行语料构建。邀请专家讨论实体类型,并经过专业培训的标注人员使用IOB2标注格式进行标注,标注过程分为预标注和正式标注两个阶段以提高效率。在预标注阶段,标注者间一致性(Inter-annotation agreement,IAA)达到0.87,表明标注人员的一致性较高。最终,VamNER包含6,115个句子,总字符数达384,602,涵盖10个实体类型,共有12,814个实体。研究通过与多个通用领域数据集和一个特定领域数据集进行比较,揭示了VamNER的独特特性。在实验中使用了预训练的基于变换器的双向编码器表示(Bidirectional Encoder Representations from Transformers,BERT)模型、双向长短期记忆神经网络(Bidirectional Long Short-Term Memory Network,BiLSTM)和条件随机场模型(Conditional Random Fields,CRF),最优模型在测试集上的F1值达到82.8%。VamNER成为首个专注于南美白对虾养殖领域的NER数据集,为中文特定领域NER研究提供了丰富资源,有望推动水产养殖领域NER研究的发展。
针对传统评价方法存在的缺陷,提出了一种新的软件质量评价模型。首先,针对已有投影模型存在的缺陷,给出了一个新的标准化的投影模型。在群决策环境下,使用区间数作为决策信息,借助所建的投影模型和TOPSIS (Technique for Order Preferen...
详细信息
针对传统评价方法存在的缺陷,提出了一种新的软件质量评价模型。首先,针对已有投影模型存在的缺陷,给出了一个新的标准化的投影模型。在群决策环境下,使用区间数作为决策信息,借助所建的投影模型和TOPSIS (Technique for Order Preference by Similarity to Ideal Solution)技术,建立了一种软件质量的评价模型,并给出了详细的评价程序。评价模型包括评价矩阵、加权评价矩阵、正负理想决策、加权评价矩阵到理想决策的投影测度以及它们的相关系数,评价信息来源于问卷调查。通过一个实例和实验分析,验证了该方法的可行性和有效性。实验结果表明,该评价模型具有较强的实用性、较好的鲁棒性和容易操作的特性。
暂无评论