咨询与建议

限定检索结果

文献类型

  • 13 篇 专利
  • 3 篇 期刊文献
  • 1 篇 学位论文

馆藏范围

  • 17 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 3 篇 理学
    • 3 篇 系统科学
  • 3 篇 工学
    • 3 篇 计算机科学与技术...
    • 2 篇 控制科学与工程
    • 2 篇 软件工程
  • 2 篇 管理学
    • 2 篇 管理科学与工程(可...

主题

  • 1 篇 卷积层
  • 1 篇 双向长短期记忆
  • 1 篇 self-attention
  • 1 篇 straight模型
  • 1 篇 语音转换
  • 1 篇 long short-term ...
  • 1 篇 卷积核
  • 1 篇 时域和频域相关性
  • 1 篇 深度卷积神经网络
  • 1 篇 multi-head atten...
  • 1 篇 dcnn
  • 1 篇 耳语转换
  • 1 篇 时域相关性
  • 1 篇 韵律模型
  • 1 篇 speech emotion r...
  • 1 篇 基频曲线
  • 1 篇 frame-level feat...
  • 1 篇 特征融合
  • 1 篇 dcrnn
  • 1 篇 dnn

机构

  • 14 篇 东南大学
  • 3 篇 安徽大学
  • 1 篇 school of inform...
  • 1 篇 school of biolog...

作者

  • 17 篇 连海伦
  • 14 篇 路成
  • 14 篇 郑文明
  • 13 篇 宗源
  • 11 篇 赵焱
  • 8 篇 唐传高
  • 7 篇 李溯南
  • 4 篇 赵力
  • 3 篇 lian hailun
  • 2 篇 王金岑
  • 2 篇 齐天铧
  • 2 篇 王拥
  • 2 篇 zhou jian
  • 2 篇 常洪丽
  • 2 篇 周健
  • 2 篇 张佳成
  • 1 篇 王华彬
  • 1 篇 zhao yan
  • 1 篇 pang cong
  • 1 篇 tang chuangao

语言

  • 17 篇 中文
检索条件"作者=连海伦"
17 条 记 录,以下是1-10 订阅
排序:
基于卷积神经网络的耳语向正常语音转换研究
基于卷积神经网络的耳语向正常语音转换研究
收藏 引用
作者: 连海伦 安徽大学
学位级别:硕士
耳语是指无声带振动的低能量发音。它是人与人之间一种特殊且必不可少的交流方式。例如,在像图书馆和会议室之类禁止大声讲话的场所,人们通常使用耳语进行人与人之间的交流或者人机交互;并且近年来,与表面肌电图接口和磁共振成像接口相... 详细信息
来源: 评论
利用深度卷积神经网络将耳语转换为正常语音
收藏 引用
声学学报 2020年 第1期45卷 137-144页
作者: 连海伦 周健 胡雨婷 郑文明 安徽大学计算智能与信号处理教育部重点实验室 合肥230601 东南大学儿童发展与学习科学教育部重点实验室 南京210096
耳语是一种特殊发音方式,将耳语转换为正常语音是提升耳语质量和可懂度的关键方法。为了充分利用语音的频域和时域相关性实现耳语转换,提出了使用深度卷积神经网络(Deep Convolutional Neural Networks,DCNN)将耳语转换为正常语音。它... 详细信息
来源: 评论
一种基于特征融合的耳语音向正常音的转换方法
收藏 引用
南京航空航天大学学报 2020年 第5期52卷 777-782页
作者: 庞聪 连海伦 周健 王华彬 陶亮 安徽大学计算智能与信号处理教育部重点实验室 合肥230039
使用耳语音的频谱包络来预估正常音的基频特征,这类算法在对正常音基频预测的准确性上存在一定不足,在合成语音自然度方面存在着明显欠缺,有时会出现音调失常等问题。本文提出一种声学特征融合的方法,通过双向长短期记忆(Bi‑long short‑... 详细信息
来源: 评论
Multi-head attention-based long short-term memory model for speech emotion recognition
收藏 引用
Journal of Southeast University(English Edition) 2022年 第2期38卷 103-109页
作者: Zhao Yan Zhao Li Lu Cheng Li Sunan Tang Chuangao Lian Hailun School of Information Science and Engineering Southeast University Nanjing 210096 China School of Biological Science and Medical Engineering Southeast University Nanjing 210096 China
To fully make use of information from different representation subspaces,a multi-head attention-based long short-term memory(LSTM)model is proposed in this study for speech emotion recognition(SER).The proposed model ... 详细信息
来源: 评论
基于深度直推式迁移网络的跨库语音情感识别方法及装置
基于深度直推式迁移网络的跨库语音情感识别方法及装置
收藏 引用
作者: 郑文明 赵焱 宗源 赵力 路成 连海伦 211102 江苏省南京市江宁区东南大学路2号
本发明公开了一种基于深度直推式迁移网络的跨库语音情感识别方法及装置,方法包括:(1)获取源语音情感数据库和目标语音情感数据库(2)将源数据库和目标数据库的情感音频处理成语谱图(3)建立深度回归神经网络(4)将源数据库和目标数据库... 详细信息
来源: 评论
一种基于时序情感信息建模的语音情感识别方法及系统
一种基于时序情感信息建模的语音情感识别方法及系统
收藏 引用
作者: 路成 王拥 郑文明 宗源 连海伦 赵焱 211189 江苏省南京市江宁区东南大学路2号
本发明公开了一种基于时序情感信息建模的语音情感识别方法及系统,首先通过特征提取模块获取语音信号的对数短时离散傅里叶变换谱特征,鲁棒性更好,然后通过卷积模块进行时序编码并特征降维,循环神经网络模块进行长程依赖关系建模,T... 详细信息
来源: 评论
一种基于时频Transformer的语音情感识别方法及系统
一种基于时频Transformer的语音情感识别方法及系统
收藏 引用
作者: 路成 王拥 郑文明 宗源 连海伦 赵焱 211189 江苏省南京市江宁区东南大学路2号
本发明公开了一种基于时频Transformer的语音情感识别方法及系统,通过特征提取模块得到的语音对数梅尔频谱特征时频情感信息丰富,然后通过编码器与相应的Transformer模块得到与情感高度相关又与噪声等干扰无关的高泛化性的特征,最后... 详细信息
来源: 评论
基于置信度显著分析的多尺度目标检测方法及装置
基于置信度显著分析的多尺度目标检测方法及装置
收藏 引用
作者: 郑文明 李溯南 宗源 赵焱 路成 连海伦 211102 江苏省南京市江宁区东南大学路2号
本发明公开了一种基于置信度显著分析的多尺度目标检测方法及装置,方法包括:(1)获取基于航拍的遥感图像目标检测数据库;(2)将数据库中的遥感图像进行预处理;(3)建立深度卷积神经网络;(4)将预处理的图像及其对应标签作为样本输入卷... 详细信息
来源: 评论
基于多层级韵律特征的情感语音生成方法及装置
基于多层级韵律特征的情感语音生成方法及装置
收藏 引用
作者: 郑文明 齐天铧 宗源 路成 连海伦 赵焱 李溯南 211102 江苏省南京市江宁区东南大学路2号
本发明公开了一种基于多层级韵律特征的情感语音生成方法及装置,方法包括:将文本数据转换为拼音序列,将所述音频数据转换为线性声谱图;根据所述拼音序列预测具有情感类别标签对应情感的语言学韵律变量;根据所述线性声谱图提取具有... 详细信息
来源: 评论
基于TSTRN的跨库语音情感识别方法及装置
基于TSTRN的跨库语音情感识别方法及装置
收藏 引用
作者: 郑文明 王金岑 宗源 赵焱 路成 连海伦 李溯南 211102 江苏省南京市江宁区东南大学路2号
本发明公开了一种基于TSTRN(双阶段迁移回归神经网络)的跨库语音情感识别方法及装置,包括:(1)选择两个不同的语音情感数据库作为源数据库和目标数据库;(2)对于源数据库和目标数据库的各语音样本进行预处理,提取语谱图特征;(3)建立T... 详细信息
来源: 评论