咨询与建议

限定检索结果

文献类型

  • 3 篇 期刊文献

馆藏范围

  • 3 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 3 篇 工学
    • 3 篇 计算机科学与技术...
    • 3 篇 软件工程
    • 2 篇 控制科学与工程
  • 2 篇 管理学
    • 2 篇 管理科学与工程(可...

主题

  • 1 篇 说话人自适应
  • 1 篇 说话人嵌入
  • 1 篇 深度强化学习
  • 1 篇 先验控制向量
  • 1 篇 时长模型
  • 1 篇 语音合成
  • 1 篇 策略梯度算法
  • 1 篇 多模态感知
  • 1 篇 语言大模型
  • 1 篇 小数据
  • 1 篇 马尔可夫决策过程
  • 1 篇 跨模态认知
  • 1 篇 分布式智能体
  • 1 篇 自然语言生成

机构

  • 3 篇 上海交通大学
  • 1 篇 苏州思必驰信息科...
  • 1 篇 新华社媒体融合生...

作者

  • 3 篇 俞凯
  • 2 篇 yu kai
  • 1 篇 陈露
  • 1 篇 张思拓
  • 1 篇 liu qi
  • 1 篇 陈博
  • 1 篇 徐志航
  • 1 篇 张辉
  • 1 篇 ma rao
  • 1 篇 chen bo
  • 1 篇 xu zhi-hang
  • 1 篇 situo zhang
  • 1 篇 刘奇
  • 1 篇 马娆
  • 1 篇 lu chen
  • 1 篇 kai yu
  • 1 篇 zhang hui

语言

  • 3 篇 中文
检索条件"机构=上海交通大学计算机科学与工程系跨媒体语言智能实验室"
3 条 记 录,以下是1-10 订阅
排序:
小数据下的音素级别说话人嵌入的语音合成自适应方法
收藏 引用
计算机学报 2022年 第5期45卷 1003-1017页
作者: 徐志航 陈博 张辉 俞凯 上海交通大学人工智能研究院人工智能教育部重点实验室 上海200240 上海交通大学计算机科学与工程系跨媒体语言智能实验室 上海200240 苏州思必驰信息科技有限公司 江苏苏州215000
在语音合成中,使用少量的用户录制数据进行说话人自适应一直面临着一个问题:如何在不过分降低合成声音的自然度的情况下,提高合成声音的相似度.现有的句子级别、帧级别说话人嵌入等自适应方法在合成训练集外说话人声音时会出现低相似度... 详细信息
来源: 评论
跨模态语言大模型:进展及展望
收藏 引用
中国科学基金 2023年 第5期37卷 776-785页
作者: 陈露 张思拓 俞凯 上海交通大学计算机科学与工程系跨媒体语言智能实验室 上海200240 上海交通大学人工智能教育部重点实验室 上海200240
以ChatGPT为代表的对话式语言大模型通过使用超大规模模型参数和海量训练数据,涌现出很强的上下文学习能力和思维链推理能力,在各种自然语言处理任务上取得了显著的进步,被视为颠覆性通用人工智能技术。在纯文本语言大模型突破的基础上... 详细信息
来源: 评论
马尔可夫决策过程和先验控制向量在弱约束自然语言生成中的应用
收藏 引用
计算机学报 2022年 第2期45卷 289-301页
作者: 刘奇 马娆 俞凯 上海交通大学人工智能研究院人工智能教育部重点实验室 上海200240 上海交通大学计算机科学与工程系跨媒体语言智能实验室 上海200240 新华社媒体融合生产技术与系统国家重点实验室第一联合创新中心 北京100803
自然语言生成是目前非常重要且具有挑战性的一类人工智能任务.长短时记忆(Long Short-Term Memory,LSTM)语言模型是目前最为主流的自然语言生成模型.但是,LSTM语言模型的训练准则是词语级别的交叉熵,这会导致暴露偏差问题.此外,一般自... 详细信息
来源: 评论