检索结果-内蒙古大学图书馆

人工智能 2018年第1期 83-91页

作者：凌震华伍宏传中国科学技术大学信息科学技术学院中国科学技术大学语音及语言信息处理国家工程实验室

近二十年来,统计参数语音合成方法发展迅速,声学建模与声码器是其中两个关键技术。声码器用于从语音波形中提取基频、频谱等声学特征,以及基于声学模型预测的声学特征,以重构语音波形,传统声码器基于源-滤波器思想设计。但是现阶段基于... 详细信息

近二十年来,统计参数语音合成方法发展迅速,声学建模与声码器是其中两个关键技术。声码器用于从语音波形中提取基频、频谱等声学特征,以及基于声学模型预测的声学特征,以重构语音波形,传统声码器基于源-滤波器思想设计。但是现阶段基于源-滤波器模型的声码器仍然制约着统计参数合成语音质量的进一步提升。本文介绍了一种基于神经网络的语音合成声码器。

关键词：声码器声学建模合成语音 WaveNet 声学特征

来源：评论

学校读者我要写书评

暂无评论

基于LDOF准则的自适应高斯后端语种识别方法

引用

通信学报 2017年第4期38卷 17-24页

作者：叶中付戚婷李赛峰宋彦中国科学技术大学信息科学技术学院安徽合肥230027 中国科学技术大学语音及语言信息处理国家工程实验室安徽合肥230027 数学工程与先进计算国家重点实验室江苏无锡214125

针对由语种类内多样性引起的测试样本和训练模型不匹配的问题,提出一种基于局部距离离群因子准则(LDOF,local distance-based outlier factor)的自适应高斯后端语种识别方法。定义LDOF准则,实现有效的参数寻优过程并动态地在多类语种训... 详细信息

针对由语种类内多样性引起的测试样本和训练模型不匹配的问题,提出一种基于局部距离离群因子准则(LDOF,local distance-based outlier factor)的自适应高斯后端语种识别方法。定义LDOF准则,实现有效的参数寻优过程并动态地在多类语种训练集上挑选出与测试样本特性相近的训练样本,调整原高斯后端,进而得到改进的语种识别方法。在NIST LRE 2009的6个易混淆语种任务集上的实验结果表明,所提方法的等错误概率(EER,equal error rate)和平均检测代价有显著提升。

关键词：语种识别类内多样性自适应高斯后端 LDOF

来源：评论

学校读者我要写书评

暂无评论

复杂噪声场景下的活动语音检测方法

引用

清华大学学报（自然科学版） 2016年第11期56卷 1190-1195页

作者：郭武马啸空中国科学技术大学信息科学技术学院语音及语言信息处理国家工程实验室

该文提出一种适用于各种复杂噪声场景下的鲁棒性活动语音检测方法。采用能量、主频率分量和短时谱熵3种声学参数形成三维特征,这3种参数在各种各样的噪声中表现出很强的互补性;在活动语音脉冲检测中,采用K均值聚类算法自适应地选择特征... 详细信息

该文提出一种适用于各种复杂噪声场景下的鲁棒性活动语音检测方法。采用能量、主频率分量和短时谱熵3种声学参数形成三维特征,这3种参数在各种各样的噪声中表现出很强的互补性;在活动语音脉冲检测中,采用K均值聚类算法自适应地选择特征并且计算语音检测过程中所用到的阈值。在美国国家标准与技术研究院说话人评测2008和2012年任务上进行实验,结果表明：所提出的方法在各种不同噪声环境下均具有较好的性能,相比传统的非监督和有监督活动语音检测算法更加鲁棒高效。

关键词：说话人识别活动语音检测谱熵 K均值聚类

来源：评论

学校读者我要写书评

暂无评论

特约主编寄语

引用

南京信息工程大学学报 2019年第3期11卷 238页

作者：陈恩红中国科学技术大学大数据学院中国科学技术大学计算机科学与技术学院中科大智慧城市研究院(芜湖) 语音及语言信息处理国家工程实验室大数据分析及应用安徽省重点实验室安徽省计算机学会中国计算机学会

信息技术的飞速发展将人们带入了移动互联的网络时代,从而引发了数据的爆炸式增长。大量数据蕴含的丰富信息已成为社会舆论与经济民生的晴雨表,大数据利用成为提高核心竞争力的关键因素。国家"十三五"规划明确将大数据升级为... 详细信息

信息技术的飞速发展将人们带入了移动互联的网络时代,从而引发了数据的爆炸式增长。大量数据蕴含的丰富信息已成为社会舆论与经济民生的晴雨表,大数据利用成为提高核心竞争力的关键因素。国家"十三五"规划明确将大数据升级为国家战略,驱动经济社会创新发展。而大数据时代科学研究范式正发生重大变革,它要求从各种各样类型的海量数据中,揭示新规律、发现新知识、得出新

关键词：深度学习机器学习

来源：评论

学校读者我要写书评

暂无评论

发音过程中舌头运动的3D可视化方法

引用

模式识别与人工智能 2016年第5期29卷 385-392页

作者：李睿於俊罗常伟汪增福中国科学院合肥智能机械研究所核环境遥操纵机器人研究室合肥230031 中国科学技术大学语音及语言信息处理国家工程实验室合肥230027 中国科学技术大学信息科学技术学院合肥230027

研究中文发音过程中舌头运动的3D可视化问题.根据核磁共振数据构建舌头精细的3D模型,在此基础上,提取舌背表面处3个点的EMA数据为驱动源,利用弹簧网技术真实再现中文发音过程中的舌头运动.为了验证文中建模和舌头运动合成方法的有效性,... 详细信息

研究中文发音过程中舌头运动的3D可视化问题.根据核磁共振数据构建舌头精细的3D模型,在此基础上,提取舌背表面处3个点的EMA数据为驱动源,利用弹簧网技术真实再现中文发音过程中的舌头运动.为了验证文中建模和舌头运动合成方法的有效性,使用计算机图形学的方法模拟舌头运动的细节效果,并对比其与由语言学家亲自拍摄的"普通话发音器官动作特征"的X光影像.实验表明,文中方法实现的3D舌头运动符合真实的舌头运动情况,拥有广泛的应用前景.

关键词： 3D可视化发音动画舌头建模舌头运动模拟碰撞处理

来源：评论

学校读者我要写书评

暂无评论

运用核聚类和偏最小二乘回归的歌唱声音转换

引用

智能系统学报 2016年第1期11卷 55-60页

作者：方鹏李贤汪增福中国科学技术大学信息科学技术学院安徽合肥230027 中国科学院合肥智能机械研究所安徽合肥230031 语音及语言信息处理国家工程实验室安徽合肥230027

语音转换是计算机听觉领域的热点问题之一,将歌声运用于语音转换是一种新的研究方向,同时拓宽了语音转换的应用范围。经典的高斯混合模型的方法在少量训练数据时会出现过拟合的现象,而且在转换时并未有效利用音乐信息。为此提出一种歌... 详细信息

语音转换是计算机听觉领域的热点问题之一,将歌声运用于语音转换是一种新的研究方向,同时拓宽了语音转换的应用范围。经典的高斯混合模型的方法在少量训练数据时会出现过拟合的现象,而且在转换时并未有效利用音乐信息。为此提出一种歌唱声音转换方法以实现少量训练数据时的音色转换,并且利用歌曲的基频信息提高转换歌声的声音质量。该方法使用核聚类和偏最小二乘回归进行训练得到转换函数,采用梅尔对数频谱近似(MLSA)滤波器对源歌唱声音的波形直接进行滤波来获得转换后的歌唱声音,以此提高转换歌声的声音质量。实验结果表明,在少量训练数据时,该方法在相似度和音质方面都有更好的效果,说明在少量训练数据时该方法优于传统的高斯混合模型的方法。

关键词：计算机视觉语音转换歌唱声音核聚类偏最小二乘回归高斯混合模型 MLSA

来源：评论

学校读者我要写书评

暂无评论

深度神经网络在维吾尔语大词汇量连续语音识别中的应用

引用

数据采集与处理 2015年第2期30卷 365-371页

作者：麦麦提艾力.吐尔逊戴礼荣中国科学技术大学语音及语言信息处理国家工程实验室合肥230027 新疆师范大学计算机科学技术学院乌鲁木齐830054

研究将深度神经网络有效地应用到维吾尔语大词汇量连续语音识别声学建模中的两种方法:深度神经网络与隐马尔可夫模型组成混合架构模型(Deep neural network hidden Markov model,DNNHMM),代替高斯混合模型进行状态输出概率的计算;深度... 详细信息

研究将深度神经网络有效地应用到维吾尔语大词汇量连续语音识别声学建模中的两种方法:深度神经网络与隐马尔可夫模型组成混合架构模型(Deep neural network hidden Markov model,DNNHMM),代替高斯混合模型进行状态输出概率的计算;深度神经网络作为前端的声学特征提取器提取瓶颈特征(Bottleneck features,BN),为传统的GMM-HMM(Gaussian mixture model-HMM)声学建模架构提供更有效的声学特征(BN-GMM-HMM)。实验结果表明,DNN-HMM模型和BN-GMM-HMM模型比GMM-HMM基线模型词错误率分别降低了8.84%和5.86%,两种方法都取得了较大的性能提升。

关键词：深度神经网络维吾尔语 GMM-HMM 瓶颈特征

来源：评论

学校读者我要写书评

暂无评论

宽线性波束形成技术综述

引用

数据采集与处理 2014年第3期29卷 333-340页

作者：叶中付徐东阳曹圣红徐旭中国科学技术大学信息科学技术学院合肥 230027 中国科学技术大学语音及语言信息处理国家工程实验室合肥230027

在圆信号的假设条件下,传统的线性波束形成技术仅仅利用了天线阵列观测矢量的协方差矩阵。然而,现代通信领域中的很多人工调制信号具有非圆特性,观测矢量不仅存在协方差矩阵,还存在伪协方差矩阵。宽线性波束形成技术是针对非圆信号环境... 详细信息

在圆信号的假设条件下,传统的线性波束形成技术仅仅利用了天线阵列观测矢量的协方差矩阵。然而,现代通信领域中的很多人工调制信号具有非圆特性,观测矢量不仅存在协方差矩阵,还存在伪协方差矩阵。宽线性波束形成技术是针对非圆信号环境提出的一类新技术,该类技术通过构造一个包含天线阵列观测矢量及其共轭的扩展观测矢量,建立有利于特定方向信号接收的目标函数及约束,推导出相应的扩展权重矢量。同传统线性波束形成技术相比,宽线性波束形成技术对非圆信号的接收性能有了明显提升。本文介绍了圆信号和非圆信号定义,给出了阵列模型并介绍了最小方差无畸变响应波束形成,对各种宽线性波束形成算法进行了综述,并对宽线性波束形成技术的下一步研究方向进行了展望。

关键词：非回信号波束形成宽线性波束形成稳健宽线性波束形成

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：