咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献
  • 1 篇 学位论文

馆藏范围

  • 2 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 理学
    • 1 篇 系统科学
  • 1 篇 工学
    • 1 篇 计算机科学与技术...
    • 1 篇 软件工程

主题

  • 2 篇 迁移学习
  • 2 篇 跨模态翻译
  • 1 篇 自动音频描述
  • 1 篇 音频剪辑
  • 1 篇 强化学习
  • 1 篇 自动音频字幕
  • 1 篇 对比学习

机构

  • 1 篇 西交利物浦大学
  • 1 篇 北京邮电大学
  • 1 篇 南京邮电大学

作者

  • 1 篇 陈堃
  • 1 篇 童骁
  • 1 篇 彭焘
  • 1 篇 shao xi
  • 1 篇 zhu chenyang
  • 1 篇 tong xiao
  • 1 篇 潘超凡
  • 1 篇 pan chaofan
  • 1 篇 邵曦
  • 1 篇 li shengchen
  • 1 篇 朱晨阳
  • 1 篇 李圣辰
  • 1 篇 peng tao

语言

  • 2 篇 中文
检索条件"主题词=跨模态翻译"
2 条 记 录,以下是1-10 订阅
排序:
基于对比学习和迁移学习的自动音频字幕系统
收藏 引用
智能计算机与应用 2025年 第3期15卷 1-6页
作者: 潘超凡 童骁 彭焘 李圣辰 朱晨阳 邵曦 南京邮电大学通信与信息工程学院 南京210003 西交利物浦大学智能工程学院 江苏苏州215123
自动音频字幕是一项跨模态翻译任务,旨在使用自然语言来描述一段音频剪辑的内容。该任务近年来受到国内外广泛关注。现有的自动音频字幕系统通常基于编码器-解码器结构,而数据稀缺问题始终是自动音频字幕系统训练面临的一大难题。针对... 详细信息
来源: 评论
基于多任务的音频特征提取在音频描述系统中的应用
基于多任务的音频特征提取在音频描述系统中的应用
收藏 引用
作者: 陈堃 北京邮电大学
学位级别:硕士
自动音频描述是一种模态翻译任务,其通过对输入音频信息进行理解,并使用一句完整的句子将信息表示出来。如输入一段音频,系统生成“几个人在森林里边走路边聊天”的描述性文本。作为一种以文本形式总结音频信息的方式,音频描述任务... 详细信息
来源: 评论