版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202310574990.9
公 开 号:CN116595144A
专利类型:发明专利
申 请 日:20230815
公 开 日:20230519
专利主分类号:G06F16/332
关 键 词:多语言 对话 构建 对话数据 评论数据 生成系统 质量评估 语言 质量评估结果 质量评估模型 预处理 对话模型 对话系统 评估数据 生成模型 输出生成 应用场景 有效促进 语言构建 自动生成 回复 游戏 评论 论坛
摘 要:本发明公开了一种多语言对话模型构建及质量评估方法,包括以下步骤:根据语言从Reddit论坛中提取不同语言的评论,按照语言构建评论数据集;根据构建好的评论数据集构建对话数据集;对话数据集预处理;对话评估数据集扩充;训练多语言对话生成模型;训练多语言对话质量评估模型;输出生成对话列表及质量评估结果。本发明构建的多语言对话生成系统可以根据输入的上文自动生成一个对应语言高相关性的回复下文,并提出了一种多语言对话质量评估方法来辅助改善多语言对话生成系统,能够有效促进多语言对话系统在游戏、社交媒体等应用场景下的发展。