版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202210875264.6
公 开 号:CN115408494A
代 理 人:耿慧敏;成丹
代理机构:北京市诚辉律师事务所
专利类型:发明专利
申 请 日:20221129
公 开 日:20220725
专利主分类号:G06F16/33
关 键 词:句子 向量 文本匹配 交互特征 特征融合 编码层 表示层 连接层 融合层 输入层 隐藏层 注意力 模型估计 目标文本 匹配结果 匹配模型 损失函数 位置向量 训练文本 语义信息 对齐 融合 构建 叠加 分段 匹配 多头
摘 要:本发明公开一种融合多头注意力对齐的文本匹配方法。该方法包括:构建文本匹配模型,包括输入层、BERT编码层、交互式句子表示层、融合层和全连接层;基于设定的损失函数训练文本匹配模型;利用经训练的文本匹配模型估计目标文本间的匹配程度。其中输入层以第一句子和第二句子两个句子作为输入;BERT编码层以对应句子的字符级向量、位置向量和分段向量的叠加向量作为输入,提取具有语义信息的隐藏层向量;交互式句子表示层基于隐藏层向量进行句向量间的注意力交互,以分别提取两个句子的交互特征;融合层对两个句子的交互特征进行融合,得到特征融合向量;全连接层基于特征融合向量,获得句子间的匹配结果。本发明能提高文本匹配的准确性。