咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于语音识别的文本处理方法、装置、电子设备及介质 收藏
基于语音识别的文本处理方法、装置、电子设备及介质

基于语音识别的文本处理方法、装置、电子设备及介质

专利申请号:CN202110302727.5

公 开 号:CN113053390B

发 明 人:王天哲 

代 理 人:何辉

代理机构:北京云知万象专利代理事务所(普通合伙)

专利类型:发明专利

申 请 日:20221202

公 开 日:20210322

专利主分类号:G10L15/26

关 键 词:静音 标点符号 时长 单字 语音识别 可读性 标点 断句 语音识别技术 语音识别器 存储介质 电子设备 动态跟踪 目标文本 文本处理 文本识别 文本序列 相邻单词 用户文本 自动添加 单词 匹配 语音 文本 申请 

摘      要:本发明实施例公开了一种基于语音识别的文本处理方法、装置、电子设备及存储介质。所述方法包括:将语音识别获取的初始文本序列切分为至少两个切分对象,并确定至少两个切分对象中相邻两个切分对象之间的静音时长,进而依据各个相邻两个切分对象之间的静音时长,在至少两个切分对象中添加匹配的标点符号,得到带标点符号的目标文本序列。采用本申请技术方案,在对语音进行识别后可利用识别的文本中相邻单词或单字之间的静音时长,通过进行静音长度动态跟踪在各个单词或单字之间添加合适的标点符合,简单地使用语音识别器的静音信息就能实现快速标点符号断句的效果,增加文本识别结果的可读性,解决相关语音识别技术中无法自动添加标点符号,从而降低用户文本可读性的问题。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分