版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202311017516.2
公 开 号:CN116756294A
发 明 人:沈一
代 理 人:韩正魁;陈曦
代理机构:北京汲智翼成知识产权代理事务所(普通合伙)
专利类型:发明专利
申 请 日:20230915
公 开 日:20230814
专利主分类号:G06F16/332
关 键 词:意图识别 样本集 模型框架 构建 拼接 关键词文本 训练样本集 对话 存储空间 迭代更新 类别提取 模型训练 训练模型 原始数据 新样本 样本 存储 输出 节约
摘 要:本发明公开了一种对话意图识别模型的构建方法、对话意图识别方法及系统。该构建方法包括如下步骤:获取预训练样本集,并基于第一模型框架进行预训练,以形成预训练模型;针对多个意图类别,分别提取关键词,以形成关键词文本;将关键词文本输入第二模型框架,以输出对应于多个意图类别的旧样本集;获取新样本集,并与旧样本集进行拼接,形成拼接样本集;基于拼接样本集对第一模型框架再次进行模型训练,以形成最终的对话意图识别模型。利用该方法构建的对话意图识别模型无需存储预训练样本集的原始数据,只需要根据已有意图类别提取关键词样本即可进行不断迭代更新,从而节约了存储空间。