版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:中国铁道科学研究院集团有限公司电子计算技术研究所北京100081 中国国家铁路集团有限公司客运部北京100844
出 版 物:《中国铁路》 (China Railway)
年 卷 期:2025年第1期
页 面:30-39页
学科分类:12[管理学] 13[艺术学] 08[工学] 1305[艺术学-设计学(可授艺术学、工学学位)] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 082303[工学-交通运输规划与管理] 0804[工学-仪器科学与技术] 0835[工学-软件工程] 081101[工学-控制理论与控制工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)] 0823[工学-交通运输工程]
基 金:中国铁道科学研究院集团有限公司科研开发基金项目(2023YJ132)
主 题:铁路领域语言模型 多方言 语音识别 RepVGG Transformer LSTM
摘 要:随着铁路智能客服系统的持续发展,现有语音识别模型的准确率已达到较高水平,但面对铁路领域术语和多样化方言场景,其语音识别效果仍然较差,因此提出1种融合铁路领域知识的多方言免切换语音识别方法。基于RepVGG网络模型构建方言语种识别器,以获取语种信息;对Transformer语音识别模型进行改进,通过在编码器中融合注意力机制的语种残差模块,并在解码器中嵌入语种信息,以实现多方言免切换功能;基于LSTM网络模型在铁路文本语料库上训练铁路领域专用的语言模型,并将其与改进的Transformer模型进行融合,以提升对铁路术语的识别准确率;在自建数据集上对所提方法进行实验验证,结果表明:所提方法在粤语、四川话和普通话上的识别准确率均超过90%,且有效提升对铁路领域术语的识别性能,具有一定应用价值。