咨询与建议

限定检索结果

文献类型

  • 12 篇 期刊文献
  • 9 篇 会议

馆藏范围

  • 21 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 13 篇 工学
    • 8 篇 计算机科学与技术...
    • 8 篇 软件工程
    • 3 篇 仪器科学与技术
    • 3 篇 控制科学与工程
    • 1 篇 机械工程
    • 1 篇 信息与通信工程
  • 8 篇 理学
    • 8 篇 系统科学
  • 3 篇 艺术学
    • 3 篇 设计学(可授艺术学...
  • 1 篇 文学
    • 1 篇 外国语言文学

主题

  • 5 篇 语音识别
  • 4 篇 模糊匹配
  • 3 篇 多方言口音
  • 3 篇 融合
  • 3 篇 说话人识别
  • 2 篇 说话人确认
  • 2 篇 鲁棒性
  • 2 篇 短语音说话人识别
  • 2 篇 查询扩展
  • 2 篇 gmm-ubm
  • 2 篇 声学模型重构
  • 2 篇 身份认证
  • 2 篇 双层结构
  • 2 篇 可靠口音相关单元
  • 2 篇 快速说话人辨认
  • 2 篇 感知对数面积比系...
  • 2 篇 生物特征识别
  • 2 篇 音素类多模型
  • 2 篇 参考说话人模型
  • 2 篇 相对语速

机构

  • 19 篇 清华大学
  • 8 篇 清华信息科学技术...
  • 6 篇 清华信息科学技术...
  • 2 篇 太原理工大学
  • 2 篇 中国建设银行信息...
  • 1 篇 江苏师范大学
  • 1 篇 the university o...
  • 1 篇 清华信息科学与技...
  • 1 篇 贵州大学
  • 1 篇 资讯通信研究院
  • 1 篇 奥克兰大学

作者

  • 19 篇 郑方
  • 6 篇 张陈昊
  • 6 篇 邬晓钧
  • 5 篇 夏云庆
  • 4 篇 李蓝天
  • 4 篇 刘轶
  • 4 篇 张超
  • 4 篇 王琳琳
  • 3 篇 曹犟
  • 3 篇 zheng fang
  • 3 篇 王刚
  • 3 篇 li lantian
  • 2 篇 王东
  • 2 篇 askar rozi
  • 2 篇 张晓东
  • 2 篇 艾斯卡尔.肉孜
  • 2 篇 waleed h.abdulla
  • 2 篇 尹聪
  • 2 篇 thomas fang zhen...
  • 2 篇 白静

语言

  • 21 篇 中文
检索条件"机构=清华大学计算机系清华信息科学与技术国家实验室技术创新和开发部语音和语言技术中心"
21 条 记 录,以下是1-10 订阅
排序:
面向多口音语音识别的声学模型重构
收藏 引用
清华大学学报(自然科学版) 2011年 第9期51卷 1161-1166页
作者: 张超 刘轶 郑方 清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心 北京100084 清华大学计算机科学与技术系 北京100094
该文提出了应用声学似然分作为置信度来生成可靠口音相关单元的方法。基于可靠口音相关单元构造声学模型,并通过声学模型重构的方法将它们融合到标准普通话模型中,以改善普通话语音识别器对带多方言口音语音的识别效果。另外,还提出了... 详细信息
来源: 评论
基于参考说话人模型和双层结构的说话人辨认
收藏 引用
清华大学学报(自然科学版) 2011年 第9期51卷 1261-1266页
作者: 王刚 邬晓钧 郑方 王琳琳 张陈昊 清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心 北京100084 清华大学计算机科学与技术系 北京100084
为了提高基于Gauss混合模型通用背景模型(GMM-UBM)的说话人辨认统的运算效率,提出一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来... 详细信息
来源: 评论
基于多音素类模型的文本无关短语音说话人识别
收藏 引用
清华大学学报(自然科学版) 2013年 第6期53卷 813-817页
作者: 张陈昊 郑方 王琳琳 清华大学计算机科学与技术系 清华信息科学技术国家实验室技术创新和开发部语音和语言技术中心信息技术研究院语音和语言技术中心北京100084
对于基于Gauss混合模型-通用背景模型(Gaussianmixure model-universal background model,GMM-UBM)方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降。为了充分利用文本内容信息,该文提出了一种基于K-top多音素... 详细信息
来源: 评论
电话信道下应用DMFCC进行说话人识别
收藏 引用
清华大学学报(自然科学版) 2009年 第10期49卷 1597-1600页
作者: 王刚 郑方 清华信息科学与技术国家实验室技术创新与开发部 语音和语言技术中心北京100084 清华大学计算机科学与技术系 北京100084
鉴别性Mel频率倒谱数(DMFCC)是一种修正的Mel频率倒谱数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFCC的作用和效果已经被证明;但在窄带信号应用中,DMFCC还鲜见有... 详细信息
来源: 评论
中文信息检索统的模糊匹配算法研究和实现
收藏 引用
中文信息学报 2007年 第6期21卷 59-64页
作者: 王静帆 邬晓钧 夏云庆 郑方 清华大学计算机系清华信息科学与技术国家实验室技术创新和开发部语音和语言技术中心 北京100084
在现代中文信息检索统中,用户输入的字符串和实际数据库中的条目往往存在局偏差,而基于关键词匹配的检索技术不能很好地解决这一问题。本文参考并改进了Tarhio和Ukkonen提出的过滤算法[1],针对汉字拼音输入法中常出现的同音字/近音... 详细信息
来源: 评论
说话人识别中的分数域语速归一化
收藏 引用
清华大学学报(自然科学版) 2018年 第4期58卷 337-341页
作者: 艾斯卡尔·肉孜 王东 李蓝天 郑方 张晓东 金磐石 清华大学计算机科学与技术系、清华信息科学技术国家实验室技术创新和开发部语音和语言技术中心、信息技术研究院语音和语言技术中心 北京100084 中国建设银行信息技术管理部 北京100000
语速变化导致说话人识别统性能显著下降。该文提出一种分数域语速归一化方法来降低语速变化对说话人识别统的影响。由不同语速语音数据组成参考集(全局和局),对每一个登入说话人估计其对参考集中每一类参考语音的分数分布,局... 详细信息
来源: 评论
基于PLAR的说话人确认统的噪音鲁棒性
收藏 引用
清华大学学报(自然科学版) 2013年 第6期53卷 791-795页
作者: 尹聪 白静 龚宬 张陈昊 郑方 Waleed H.Abdulla 太原理工大学信息工程学院 清华大学计算机科学与技术系 清华信息科学技术国家实验室技术创新和开发部语音和语言技术中心 奥克兰大学
针对Mel频率倒谱数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比数(perceptual log area ratio,PLAR)特征的说话人... 详细信息
来源: 评论
基于拼音索引的中文模糊匹配算法
收藏 引用
清华大学学报(自然科学版) 2009年 第S1期49卷 1328-1332页
作者: 曹犟 邬晓钧 夏云庆 郑方 清华大学计算机科学与技术系 北京100084 清华信息科学技术国家实验室技术创新和开发部语音和语言技术中心 北京100084
主流商业搜索引擎主要基于关键词精确匹配技术。为提高在用户的输入错误时的检索效率,提出了有索引的汉语模糊匹配算法。该算法采用汉字、拼音和拼音改良的编辑距离这3种汉字相似程度的不同度量方式,对用户查询进行扩展,将模糊匹配转化... 详细信息
来源: 评论
基于词义类簇的文本聚类
收藏 引用
中文信息学报 2013年 第3期27卷 113-119页
作者: 唐国瑜 夏云庆 张民 郑方 清华信息科学技术国家实验室技术创新和开发部语音和语言技术中心 清华大学信息技术研究院语音和语言技术中心清华大学计算机科学与技术系北京100084 资讯通信研究院 新加坡138632
文档表示是文本聚类的重要组成分,该文旨在通过改进文档表示改进文本聚类。同义词和多义词现象是文档表示所面临的重要挑战。为此该文提出了词义类簇模型(Sense Cluster Model,SCM),在词义类簇空间上表示文档。SCM首先构造词义类簇空... 详细信息
来源: 评论
混合口音语音识别中的声学和语音层发音变异性研究
收藏 引用
中国科技论文在线 2011年 第10期6卷 743-749页
作者: 张超 刘轶 清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心 北京100084 清华大学计算机科学与技术系 北京100084
通过在语音层使用多发音字典对完全发音变异进行建模,在声学层分别使用上下文无关分变异音子模型(partial change phone model,PCPM)对分发音变异进行建模,从而探究了语音层和声学层发音变异模型的特征、区别和联,并将它们整合到... 详细信息
来源: 评论