检索结果-内蒙古大学图书馆

清华大学学报（自然科学版） 2011年第9期51卷 1161-1166页

作者：张超刘轶郑方清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心北京100084 清华大学计算机科学与技术系北京100094

该文提出了应用声学似然分作为置信度来生成可靠口音相关单元的方法。基于可靠口音相关单元构造声学模型,并通过声学模型重构的方法将它们融合到标准普通话模型中,以改善普通话语音识别器对带多方言口音语音的识别效果。另外,还提出了... 详细信息

该文提出了应用声学似然分作为置信度来生成可靠口音相关单元的方法。基于可靠口音相关单元构造声学模型,并通过声学模型重构的方法将它们融合到标准普通话模型中,以改善普通话语音识别器对带多方言口音语音的识别效果。另外,还提出了使用增量式决策树融合及根据支配度选择Gauss混合2种方法来减少冗余的Gauss混合,从而提高了重构后的声学模型的效率。实验表明:该方法在不降低对标准普通话的识别率的前提下,对粤、吴口音的绝对音节错误率分别下降了9.25%和9.21%。

关键词：语音识别多方言口音可靠口音相关单元声学模型重构

来源：评论

学校读者我要写书评

暂无评论

基于参考说话人模型和双层结构的说话人辨认

引用

清华大学学报（自然科学版） 2011年第9期51卷 1261-1266页

作者：王刚邬晓钧郑方王琳琳张陈昊清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心北京100084 清华大学计算机科学与技术系北京100084

为了提高基于Gauss混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率,提出一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来... 详细信息

为了提高基于Gauss混合模型通用背景模型(GMM-UBM)的说话人辨认系统的运算效率,提出一种基于参考说话人模型的双层结构用于目标说话人剪枝,采用矢量量化方法从目标说话人模型集合中训练参考说话人模型,利用语音与参考说人模型的偏差来描述说话人的发音特性,将辨认语音偏差向量和目标说话人偏差向量的相似性作为距离度量来进行目标说话人剪枝。实验结果表明:在基于GMM-UBM的说话人辨认系统中,对包含5 200个目标说话人和1 000个集外说话人的测试集进行开集辨认的条件下,在提高辨认的运算效率12.5倍的同时识别率仅下降0.3%。

关键词：双层结构快速说话人辨认参考说话人模型

来源：评论

学校读者我要写书评

暂无评论

基于多音素类模型的文本无关短语音说话人识别

引用

清华大学学报（自然科学版） 2013年第6期53卷 813-817页

作者：张陈昊郑方王琳琳清华大学计算机科学与技术系清华信息科学技术国家实验室技术创新和开发部语音和语言技术中心信息技术研究院语音和语言技术中心北京100084

对于基于Gauss混合模型-通用背景模型(Gaussianmixure model-universal background model,GMM-UBM)方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降。为了充分利用文本内容信息,该文提出了一种基于K-top多音素... 详细信息

对于基于Gauss混合模型-通用背景模型(Gaussianmixure model-universal background model,GMM-UBM)方法的文本无关说话人识别,当测试语音时长缩短到很短时,识别率会严重下降。为了充分利用文本内容信息,该文提出了一种基于K-top多音素类模型混合(KPCMMM)的建模方法。在音素识别阶段,利用语音识别得到训练语音的音素序列,在说话人识别阶段利用音素序列对每个说话人训练多个音素类模型,测试语音则在最相近的音素类模型上进行打分判决,K是选取的相近音素类数。由于音素类定义的不同,KPCMMM方法分为基于专家知识和数据驱动这两类。实验结果显示选择合适的K值可以得到更好的识别结果。不同的音素类定义方法的比较实验结果显示:当测试语音时长小于2s时,对比GMM-UBM基线系统,该方法的等错误率(EER)相对下降38.60%。

关键词：短语音说话人识别语音识别音素类多模型

来源：评论

学校读者我要写书评

暂无评论

电话信道下应用DMFCC进行说话人识别

引用

清华大学学报（自然科学版） 2009年第10期49卷 1597-1600页

作者：王刚郑方清华信息科学与技术国家实验室技术创新与开发部语音和语言技术中心北京100084 清华大学计算机科学与技术系北京100084

鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFCC的作用和效果已经被证明;但在窄带信号应用中,DMFCC还鲜见有... 详细信息

鉴别性Mel频率倒谱系数(DMFCC)是一种修正的Mel频率倒谱系数(MFCC),其更加强调语音频谱各个子带携带的鉴别性信息,采用自适应的非均匀的滤波器组设置。在宽带信号应用中,DMFCC的作用和效果已经被证明;但在窄带信号应用中,DMFCC还鲜见有成功应用的例子。该文在电话信道下对应用DMFCC进行说话人识别研究,在美国国家标准技术研究院(NIST)2006年说话人识别评测Female核心测试集上,以MFCC作为特征参数的系统的等错误率为7.57%,以DMFCC作为特征参数的系统的等错误率为7.25%,而采用基于逻辑自回归的线性融合方法把基于两种不同特征的系统在分数域进行融合后系统的等错误率可达到6.31%,相对于基于MFCC的系统等错误率下降16.6%。实验表明,在电话信道下直接应用DMFCC可小幅度提高性能;理论分析以及实验结果表明:二者存在一定的互补性,即把DMFCC和MFCC融合应用能够大幅度提高电话信道下说话人识别的性能。

关键词：电话信道说话人识别鉴别性Mel频率倒谱系数(DMFCC) 融合

来源：评论

学校读者我要写书评

暂无评论

中文信息检索系统的模糊匹配算法研究和实现

引用

中文信息学报 2007年第6期21卷 59-64页

作者：王静帆邬晓钧夏云庆郑方清华大学计算机系清华信息科学与技术国家实验室技术创新和开发部语音和语言技术中心北京100084

在现代中文信息检索系统中,用户输入的字符串和实际数据库中的条目往往存在局部偏差,而基于关键词匹配的检索技术不能很好地解决这一问题。本文参考并改进了Tarhio和Ukkonen提出的过滤算法[1],针对汉字拼音输入法中常出现的同音字/近音... 详细信息

在现代中文信息检索系统中,用户输入的字符串和实际数据库中的条目往往存在局部偏差,而基于关键词匹配的检索技术不能很好地解决这一问题。本文参考并改进了Tarhio和Ukkonen提出的过滤算法[1],针对汉字拼音输入法中常出现的同音字/近音字混用现象,将算法进一步扩展到广义的Edit Distance上。实验表明,本文提出的算法能有效提高中文信息检索系统的召回率,在实际应用中可达到"子线性"的效率。

关键词：计算机应用中文信息处理模糊匹配过滤算法动态规划

来源：评论

学校读者我要写书评

暂无评论

说话人识别中的分数域语速归一化

引用

清华大学学报（自然科学版） 2018年第4期58卷 337-341页

作者：艾斯卡尔·肉孜王东李蓝天郑方张晓东金磐石清华大学计算机科学与技术系、清华信息科学技术国家实验室技术创新和开发部语音和语言技术中心、信息技术研究院语音和语言技术中心北京100084 中国建设银行信息技术管理部北京100000

语速变化导致说话人识别系统性能显著下降。该文提出一种分数域语速归一化方法来降低语速变化对说话人识别系统的影响。由不同语速语音数据组成参考集（全局和局部）,对每一个登入说话人估计其对参考集中每一类参考语音的分数分布,局部... 详细信息

语速变化导致说话人识别系统性能显著下降。该文提出一种分数域语速归一化方法来降低语速变化对说话人识别系统的影响。由不同语速语音数据组成参考集（全局和局部）,对每一个登入说话人估计其对参考集中每一类参考语音的分数分布,局部参考集通过按相对语速划分全局参考集而获得。基于该文录制的语速数据库在GMM-UBM（Gaussian mixture model-universal background model）框架下对测试语音进行分数归一化,并通过训练数据扩展有效解决了数据系数问题,最终等错误率相对下降33.33%。研究结果表明：全局和局部归一化方法都有效减少了语速变化对说话人识别系统的影响。

关键词：说话人识别分数域语速归一化相对语速 GMM-UBM

来源：评论

学校读者我要写书评

暂无评论

基于PLAR的说话人确认系统的噪音鲁棒性

引用

清华大学学报（自然科学版） 2013年第6期53卷 791-795页

作者：尹聪白静龚宬张陈昊郑方 Waleed H.Abdulla 太原理工大学信息工程学院清华大学计算机科学与技术系清华信息科学技术国家实验室技术创新和开发部语音和语言技术中心奥克兰大学

针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人... 详细信息

针对Mel频率倒谱系数(Mel frequency cepstralcoefficient,MFCC)特征的说话人确认系统在干净语音环境下具有很高识别率但在噪音环境下识别率急剧下降的缺点,构建了基于感知对数面积比系数(perceptual log area ratio,PLAR)特征的说话人确认系统,并对该系统的噪音鲁棒性进行研究。结果表明:PLAR特征具有较强的噪音鲁棒性。将PLAR与MFCC进行特征域和分数域的融合,利用两者之间存在着的互补性,可有效提高说话人确认系统的识别性能。

关键词：说话人确认感知对数面积比系数(PLAR) 鲁棒性融合

来源：评论

学校读者我要写书评

暂无评论

基于拼音索引的中文模糊匹配算法

引用

清华大学学报（自然科学版） 2009年第S1期49卷 1328-1332页

作者：曹犟邬晓钧夏云庆郑方清华大学计算机科学与技术系北京100084 清华信息科学技术国家实验室技术创新和开发部语音和语言技术中心北京100084

主流商业搜索引擎主要基于关键词精确匹配技术。为提高在用户的输入错误时的检索效率,提出了有索引的汉语模糊匹配算法。该算法采用汉字、拼音和拼音改良的编辑距离这3种汉字相似程度的不同度量方式,对用户查询进行扩展,将模糊匹配转化... 详细信息

主流商业搜索引擎主要基于关键词精确匹配技术。为提高在用户的输入错误时的检索效率,提出了有索引的汉语模糊匹配算法。该算法采用汉字、拼音和拼音改良的编辑距离这3种汉字相似程度的不同度量方式,对用户查询进行扩展,将模糊匹配转化为多个精确匹配,对精确匹配的结果按与查询串的相似程度进行排序。在实验中,将该方法应用于网页文本语料库中。在使用基于拼音改良的编辑距离度量方式时,在时间和空间复杂度增长不大的情况下,该方法取得了60.42%的准确率与50.41%召回率。

关键词：文件信息处理拼音索引模糊匹配查询扩展

来源：评论

学校读者我要写书评

暂无评论

基于词义类簇的文本聚类

引用

中文信息学报 2013年第3期27卷 113-119页

作者：唐国瑜夏云庆张民郑方清华信息科学技术国家实验室技术创新和开发部语音和语言技术中心清华大学信息技术研究院语音和语言技术中心清华大学计算机科学与技术系北京100084 资讯通信研究院新加坡138632

文档表示是文本聚类的重要组成部分,该文旨在通过改进文档表示改进文本聚类。同义词和多义词现象是文档表示所面临的重要挑战。为此该文提出了词义类簇模型(Sense Cluster Model,SCM),在词义类簇空间上表示文档。SCM首先构造词义类簇空... 详细信息

文档表示是文本聚类的重要组成部分,该文旨在通过改进文档表示改进文本聚类。同义词和多义词现象是文档表示所面临的重要挑战。为此该文提出了词义类簇模型(Sense Cluster Model,SCM),在词义类簇空间上表示文档。SCM首先构造词义类簇空间,然后将文档表示在词义类簇空间上,获得每篇文档在每个词义类簇的概率。在词义类簇空间构造这一步骤中,首先利用词义归纳技术从文本中自动发现词义,接着采用词义聚类技术识别相同或者相似的词义从而获得词义类簇。词义类簇空间构造后,该文首先进行词义消歧,然后利用词义消歧的结果将文档表示在词义空间上。实验表明,SCM在标准测试集上的性能优于基线系统以及经典话题模型LDA。

关键词：文档聚类文档表示话题模型

来源：评论

学校读者我要写书评

暂无评论

混合口音语音识别中的声学和语音层发音变异性研究

引用

中国科技论文在线 2011年第10期6卷 743-749页

作者：张超刘轶清华信息科学技术国家实验室技术创新与开发部语音和语言技术中心北京100084 清华大学计算机科学与技术系北京100084

通过在语音层使用多发音字典对完全发音变异进行建模,在声学层分别使用上下文无关部分变异音子模型(partial change phone model,PCPM)对部分发音变异进行建模,从而探究了语音层和声学层发音变异模型的特征、区别和联系,并将它们整合到... 详细信息

通过在语音层使用多发音字典对完全发音变异进行建模,在声学层分别使用上下文无关部分变异音子模型(partial change phone model,PCPM)对部分发音变异进行建模,从而探究了语音层和声学层发音变异模型的特征、区别和联系,并将它们整合到语音识别系统的不同部分中,实现了对发音变异的分层处理。应用分层发音变异模型,对带方言口音汉语普通话朗读语音进行测试,提高了识别结果。最好情况下,应用多发音字典使音节准确率提高了1.24%;应用上下文无关PCPM使音节的准确率提高了9.7%。分别使用带有重庆、广州和上海口音的普通话进行实验,从实验结果对汉语不同方言口音之间发音变异的区别和关联进行了分析。

关键词：电信技术口音语音识别完全变异部分变异分层发音变异模型

来源：评论

学校读者我要写书评

暂无评论

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案：

请选择收藏分类：

通借通还

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

限定检索结果

文献类型

馆藏范围

日期分布

学科分类号

主题

机构

作者

语言

请选择保存的检索档案： 新增检索档案 确定 取消

请选择收藏分类： 新增自定义分类 确定 取消

通借通还

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

请选择保存的检索档案：

请选择收藏分类：