版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202310746380.2
公 开 号:CN117217222A
发 明 人:宋颖毅 张杭 杨雨婷 王又辰 田宗凯 范昕煜 栾真 邹烨 葛志 杜田沣
代 理 人:辛海明
代理机构:中国兵器工业集团公司专利中心
专利类型:发明专利
申 请 日:20231212
公 开 日:20230625
专利主分类号:G06F40/295
关 键 词:标注 原始数据集 训练模型 模型预测结果 信息抽取技术 参数设置 错误标注 结果修改 军事领域 模型集成 模型融合 模型训练 事件检测 数据修正 投票结果 污染数据 修正数据 样本类别 预测结果 鲁棒性 模型层 训练集 预测 准确率 分层 适配 推理 样本 修正 学习 融合 引入 投票
摘 要:本发明涉及一种军事领域标注数据修正与事件检测方法,属于信息抽取技术领域。本发明使用原始数据集训练模型,并对原始标注数据进行预测,对于预测得分大于一定阈值的样本,将原始数据集的标注结果修改为模型预测结果,从而修正数据集中的错误标注数据和污染数据,提高训练集的质量。本发明在模型训练时引入了分层学习率策略,为靠近下游任务的模型层参数设置更大的学习率,提高预训练模型对于下游任务的适配能力;在模型推理时采用基于投票修正的模型融合方法,通过模型集成的方式提升少样本类别事件的召回率和准确率,融合多个模型的投票结果确定最终预测结果,从而提升模型的鲁棒性。