版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202011212947.0
公 开 号:CN112133294A
代 理 人:徐丁峰;戴亚南
代理机构:11481 北京睿邦知识产权代理事务所(普通合伙)
专利类型:发明专利
申 请 日:20201225
公 开 日:20201102
专利主分类号:G10L15/06(20130101)
关 键 词:模型分数 语音段 转换器模型 集合 路径分数 声学特征 转移路径 语音 语音识别系统 输入转换器 状态机模块 存储介质 文字集合 文字解码 语音识别 时间步 正确率 建模 加权 输出 概率
摘 要:本发明提供一种语音识别方法、装置和系统及存储介质。方法包括:获取待识别语音;提取待识别语音的声学特征;将声学特征输入转换器模型,以在第i个时间步获得转换器模型输出的与第i个语音段相对应的模型分数集合,i=1,2,……,n,模型分数集合包括与转换器模型所建模的文字集合中的所有文字一一对应的模型分数,每个模型分数表示第i个语音段属于该模型分数所对应的文字的概率;结合模型分数集合以及加权有限状态机模块,计算从第1个语音段至第i个语音段中的所有语音段所对应的至少一个转移路径各自的路径分数;基于至少一个转移路径各自的路径分数,获得与第i个语音段相对应的文字解码结果。该方法有助于提高整个语音识别系统的识别正确率。