版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202310301273.9
公 开 号:CN116312541A
代 理 人:北京英创嘉友知识产权代理事务所(普通合伙)郑国敏
代理机构:北京英创嘉友知识产权代理事务所(普通合伙)
专利类型:发明专利
申 请 日:20230623
公 开 日:20230324
专利主分类号:G10L15/26
关 键 词:目标音频 特征集合 嵌入 处理模型 获取目标 目标结果 表征目标 电子设备 可读介质 区分信息 信息丢失 音频处理 音频内容 预先生成 区分性 输出
摘 要:本公开实施例涉及一种音频处理方法、装置、可读介质及电子设备。该方法包括:获取待处理的目标音频,将该目标音频输入预先生成的目标音频处理模型中,得到该目标音频处理模型输出的目标结果。其中,该目标音频处理模型可以用于提取目标音频的第一音频嵌入特征集合,根据该第一音频嵌入特征集合获取目标音频对应的目标结果,该第一音频嵌入特征集合可以用于表征目标音频的音频区分性信息。这样,通过该第一音频嵌入特征集合可以获取目标音频的音频区分信息,避免信息丢失导致音频内容理解错误的问题,从而可以提高对目标音频进行处理的准确性。