咨询与建议

限定检索结果

文献类型

  • 8 篇 期刊文献

馆藏范围

  • 8 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 4 篇 理学
    • 4 篇 系统科学
  • 3 篇 工学
    • 2 篇 仪器科学与技术
    • 1 篇 机械工程
    • 1 篇 电子科学与技术(可...
    • 1 篇 信息与通信工程
    • 1 篇 控制科学与工程
  • 1 篇 艺术学
    • 1 篇 设计学(可授艺术学...

主题

  • 1 篇 波束形成
  • 1 篇 3d可视化发音动画
  • 1 篇 谱熵
  • 1 篇 wavenet
  • 1 篇 类内多样性
  • 1 篇 语音转换
  • 1 篇 声学特征
  • 1 篇 碰撞处理
  • 1 篇 稳健宽线性波束形...
  • 1 篇 核聚类
  • 1 篇 偏最小二乘回归
  • 1 篇 自适应高斯后端
  • 1 篇 瓶颈特征
  • 1 篇 声码器
  • 1 篇 声学建模
  • 1 篇 舌头建模
  • 1 篇 歌唱声音
  • 1 篇 k均值聚类
  • 1 篇 深度神经网络
  • 1 篇 gmm-hmm

机构

  • 8 篇 中国科学技术大学
  • 2 篇 语音及语言信息处...
  • 1 篇 中科大智慧城市研...
  • 1 篇 中国计算机学会
  • 1 篇 大数据分析及应用...
  • 1 篇 中国科学院合肥智...
  • 1 篇 中国科学院合肥智...
  • 1 篇 新疆师范大学
  • 1 篇 数学工程与先进计...
  • 1 篇 安徽省计算机学会

作者

  • 2 篇 汪增福
  • 2 篇 叶中付
  • 1 篇 李睿
  • 1 篇 曹圣红
  • 1 篇 徐旭
  • 1 篇 伍宏传
  • 1 篇 麦麦提艾力.吐尔逊...
  • 1 篇 方鹏
  • 1 篇 罗常伟
  • 1 篇 郭武
  • 1 篇 于俊
  • 1 篇 李贤
  • 1 篇 宋彦
  • 1 篇 马啸空
  • 1 篇 陈恩红
  • 1 篇 凌震华
  • 1 篇 李赛峰
  • 1 篇 徐东阳
  • 1 篇 戴礼荣
  • 1 篇 戚婷

语言

  • 8 篇 中文
检索条件"机构=中国科学技术大学信息科学技术学院语音及语言信息处理国家工程实验室"
8 条 记 录,以下是1-10 订阅
排序:
基于WaveNet的语音合成声码器研究
收藏 引用
人工智能 2018年 第1期 83-91页
作者: 凌震华 伍宏传 中国科学技术大学信息科学技术学院 中国科学技术大学语音及语言信息处理国家工程实验室
近二十年来,统计参数语音合成方法发展迅速,声学建模与声码器是其中两个关键技术。声码器用于从语音波形中提取基频、频谱等声学特征,以基于声学模型预测的声学特征,以重构语音波形,传统声码器基于源-滤波器思想设计。但是现阶段基于... 详细信息
来源: 评论
基于LDOF准则的自适应高斯后端语种识别方法
收藏 引用
通信学报 2017年 第4期38卷 17-24页
作者: 叶中付 戚婷 李赛峰 宋彦 中国科学技术大学信息科学技术学院 安徽合肥230027 中国科学技术大学语音及语言信息处理国家工程实验室 安徽合肥230027 数学工程与先进计算国家重点实验室 江苏无锡214125
针对由语种类内多样性引起的测试样本和训练模型不匹配的问题,提出一种基于局部距离离群因子准则(LDOF,local distance-based outlier factor)的自适应高斯后端语种识别方法。定义LDOF准则,实现有效的参数寻优过程并动态地在多类语种训... 详细信息
来源: 评论
复杂噪声场景下的活动语音检测方法
收藏 引用
清华大学学报(自然科学版) 2016年 第11期56卷 1190-1195页
作者: 郭武 马啸空 中国科学技术大学信息科学技术学院语音及语言信息处理国家工程实验室
该文提出一种适用于各种复杂噪声场景下的鲁棒性活动语音检测方法。采用能量、主频率分量和短时谱熵3种声学参数形成三维特征,这3种参数在各种各样的噪声中表现出很强的互补性;在活动语音脉冲检测中,采用K均值聚类算法自适应地选择特征... 详细信息
来源: 评论
特约主编寄语
收藏 引用
南京信息工程大学学报 2019年 第3期11卷 238页
作者: 陈恩红 中国科学技术大学大数据学院 中国科学技术大学计算机科学与技术学院 中科大智慧城市研究院(芜湖) 语音及语言信息处理国家工程实验室 大数据分析及应用安徽省重点实验室 安徽省计算机学会 中国计算机学会
信息技术的飞速发展将人们带入了移动互联的网络时代,从而引发了数据的爆炸式增长。大量数据蕴含的丰富信息已成为社会舆论与经济民生的晴雨表,大数据利用成为提高核心竞争力的关键因素。国家"十三五"规划明确将大数据升级为... 详细信息
来源: 评论
发音过程中舌头运动的3D可视化方法
收藏 引用
模式识别与人工智能 2016年 第5期29卷 385-392页
作者: 李睿 於俊 罗常伟 汪增福 中国科学院合肥智能机械研究所核环境遥操纵机器人研究室 合肥230031 中国科学技术大学语音及语言信息处理国家工程实验室 合肥230027 中国科学技术大学信息科学技术学院 合肥230027
研究中文发音过程中舌头运动的3D可视化问题.根据核磁共振数据构建舌头精细的3D模型,在此基础上,提取舌背表面处3个点的EMA数据为驱动源,利用弹簧网技术真实再现中文发音过程中的舌头运动.为了验证文中建模和舌头运动合成方法的有效性,... 详细信息
来源: 评论
运用核聚类和偏最小二乘回归的歌唱声音转换
收藏 引用
智能系统学报 2016年 第1期11卷 55-60页
作者: 方鹏 李贤 汪增福 中国科学技术大学信息科学技术学院 安徽合肥230027 中国科学院合肥智能机械研究所 安徽合肥230031 语音及语言信息处理国家工程实验室 安徽合肥230027
语音转换是计算机听觉领域的热点问题之一,将歌声运用于语音转换是一种新的研究方向,同时拓宽了语音转换的应用范围。经典的高斯混合模型的方法在少量训练数据时会出现过拟合的现象,而且在转换时并未有效利用音乐信息。为此提出一种歌... 详细信息
来源: 评论
深度神经网络在维吾尔语大词汇量连续语音识别中的应用
收藏 引用
数据采集与处理 2015年 第2期30卷 365-371页
作者: 麦麦提艾力.吐尔逊 戴礼荣 中国科学技术大学语音及语言信息处理国家工程实验室 合肥230027 新疆师范大学计算机科学技术学院 乌鲁木齐830054
研究将深度神经网络有效地应用到维吾尔语大词汇量连续语音识别声学建模中的两种方法:深度神经网络与隐马尔可夫模型组成混合架构模型(Deep neural network hidden Markov model,DNNHMM),代替高斯混合模型进行状态输出概率的计算;深度... 详细信息
来源: 评论
宽线性波束形成技术综述
收藏 引用
数据采集与处理 2014年 第3期29卷 333-340页
作者: 叶中付 徐东阳 曹圣红 徐旭 中国科学技术大学信息科学技术学院合肥 230027 中国科学技术大学语音及语言信息处理国家工程实验室 合肥230027
在圆信号的假设条件下,传统的线性波束形成技术仅仅利用了天线阵列观测矢量的协方差矩阵。然而,现代通信领域中的很多人工调制信号具有非圆特性,观测矢量不仅存在协方差矩阵,还存在伪协方差矩阵。宽线性波束形成技术是针对非圆信号环境... 详细信息
来源: 评论