版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202211472628.2
公 开 号:CN116230019A
代 理 人:梁小林
代理机构:长沙新裕知识产权代理有限公司
专利类型:发明专利
申 请 日:20230606
公 开 日:20221117
专利主分类号:G10L25/63
关 键 词:预处理 特征提取 语音情感 语音数据 半监督 回归器 聚类 分类器模块 分类器模型 标记数据 标签分配 模型框架 损失函数 特征融合 语音表示 语音片段 语音特征 数据集 语料库 句子 网络 回归 预测 联合
摘 要:本发明涉及一种基于半监督语音情感识别框架的深度情感聚类方法,属于语音情感识别技术领域,对输入的语料库中的音频进行预处理;使用Attn‑Convolution网络对预处理后的语音数据在空间上进行特征提取;使用BiGRU网络对预处理后的语音数据在时间上进行特征提取;将提取出的语音特征使用ADD函数进行特征融合;在聚类分类器模块中对未标记的数据集进行伪标签分配;在情感回归器中对每个句子i的语音片段sij进行回归预测;使用新的CCC‑CE联合损失作为回归器与分类器模型的损失函数。有益效果在于,使用较少未标记数据的模型框架比现有的半监督框架实现了更好的语音表示,并且在下游任务中优于最先进的方法。