版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202110917217.9
公 开 号:CN113744753B
代 理 人:苏州创元专利商标事务所有限公司吴芳
代理机构:苏州创元专利商标事务所有限公司
专利类型:发明专利
申 请 日:20230908
公 开 日:20210811
专利主分类号:G10L21/0272
关 键 词:激活函数 卷积 语音 分离模型 混合语音数据 归一化处理 输入编码器 并行计算 乘积运算 分段处理 分离函数 时序关系 特征数据 训练效率 重叠操作 输出 编码器 映射 注意力 三维
摘 要:本发明公开了一种多人语音分离方法及语音分离模型的训练方法,分离方法包括以下步骤:将混合语音数据输入编码器处理以输出三维的特征张量;对特征张量进行组归一化处理、卷积操作和分段处理,将其结果输入到自注意力块中处理,以对其进行分离函数映射,再经过第一激活函数处理、卷积操作后进行重叠操作,对其结果进行卷积操作后分别经过第二激活函数和第三激活函数的处理,以得到两个特征张量,作乘积运算后进行卷积和第四激活函数处理,并与编码器的输出进行乘积操作,以分离出不同说话人的特征数据。本发明提供的多人语音分离方法及语音分离模型的训练方法不依赖时序关系,能够很容易地进行并行计算,提升模型的训练效率。