版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202010547313.4
公 开 号:CN111831788A
发 明 人:田然 苏杨 庞渊源 陈轩 顾彬 王磊 吴子辰 李霁轩 陈鑫 朱晓鸿 王鑫 于广荣
代 理 人:史俊军
代理机构:32224 南京纵横知识产权代理有限公司
专利类型:发明申请
申 请 日:20201027
公 开 日:20200616
专利主分类号:G06F16/33(20190101)
关 键 词:语料 标记模型 预设要求 训练集 人工成本 放入 构建 重复
摘 要:本发明公开了一种电力语料标记模型构建方法,包括对训练集中的已标记电力语料进行扩展,训练初始的标记模型;判断训练的标记模型是否满足预设要求,若不满足预设要求,用该标记模型对未标记的电力语料进行标记,并将标记后的电力语料放入训练集,对训练集中的已标记电力语料进行扩展,重新训练标记模型,重复该步骤,直到训练的标记模型满足预设要求。同时公开了相应的系统。本发明对训练集中的已标记电力语料进行扩展,用不满足预设要求的标记模型标记电力语料,并将标记后的电力语料加入训练集,采用滚雪球的方式扩大训练集,大大减少人工成本。