咨询与建议

限定检索结果

文献类型

  • 1 篇 学位论文

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 机械工程

主题

  • 1 篇 多模式编码器
  • 1 篇 增强注意力机制
  • 1 篇 图像描述
  • 1 篇 结构注意力机制

机构

  • 1 篇 云南大学

作者

  • 1 篇 郑甜

语言

  • 1 篇 中文
检索条件"主题词=多模式编码器"
1 条 记 录,以下是1-10 订阅
排序:
基于增强注意力机制和多模式编码器的图像描述
基于增强注意力机制和多模式编码器的图像描述
收藏 引用
作者: 郑甜 云南大学
学位级别:硕士
图像描述指采用自然语言描述图像的内容信息,涉及图像信息与文本信息的转换。该任务不仅涉及计算机视觉技术,还运用了自然语言处理的相关技术。图像描述模型采用编码器-解码框架。在该架构中,首先由编码器将图像转换为中间特征向量,... 详细信息
来源: 评论