咨询与建议

限定检索结果

文献类型

  • 3 篇 学位论文
  • 1 篇 期刊文献

馆藏范围

  • 4 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 4 篇 工学
    • 3 篇 计算机科学与技术...
    • 3 篇 软件工程
    • 2 篇 机械工程
    • 1 篇 控制科学与工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 4 篇 跨模态任务
  • 2 篇 注意力机制
  • 2 篇 行人检索
  • 1 篇 关系对齐
  • 1 篇 短视频描述生成
  • 1 篇 感知损失
  • 1 篇 目标检测
  • 1 篇 视觉问答
  • 1 篇 记忆网络
  • 1 篇 文本语义学习
  • 1 篇 潜在关系
  • 1 篇 特征匹配
  • 1 篇 关系推理

机构

  • 2 篇 天津理工大学
  • 1 篇 多模态人工智能系...
  • 1 篇 北京邮电大学
  • 1 篇 西安理工大学

作者

  • 2 篇 李博
  • 1 篇 叶舟
  • 1 篇 张飞飞
  • 1 篇 xu chang-sheng
  • 1 篇 zhang fei-fei
  • 1 篇 li bo
  • 1 篇 徐常胜
  • 1 篇 程文芳

语言

  • 4 篇 中文
检索条件"主题词=跨模态任务"
4 条 记 录,以下是1-10 订阅
排序:
模态间关系促进的行人检索方法
收藏 引用
软件学报 2024年 第10期35卷 4766-4780页
作者: 李博 张飞飞 徐常胜 天津理工大学计算机科学与工程学院 天津300384 多模态人工智能系统全国重点实验室(中国科学院自动化研究所) 北京100190
基于文本描述的行人检索是一个新兴的模态检索子任务,由传统行人重识别任务衍生而来,对公共安全以及人员追踪具有重要意义.相比于单模态图像检索的行人重识别任务,基于文本描述的行人检索解决了实际应用中缺少查询图像的问题,其主要... 详细信息
来源: 评论
面向潜在关系建模的模态行人检索
面向潜在关系建模的跨模态行人检索
收藏 引用
作者: 李博 天津理工大学
学位级别:硕士
近年来,模态行人检索为寻找犯罪嫌疑人和失踪人员提供了巨大帮助。相比于单模态图像检索的行人重识别,文本描述的获取相对容易,模态行人检索可以通过文本查询检索行人图像,适用于缺少查询图像的情况,更加灵活且贴合实际应用。但现... 详细信息
来源: 评论
基于记忆网络与图注意力机制的视觉问答技术研究
基于记忆网络与图注意力机制的视觉问答技术研究
收藏 引用
作者: 程文芳 西安理工大学
学位级别:硕士
近年来,随着计算机视觉与自然语言处理技术的快速发展,跨模态任务受到了国内外众多学者的关注,视觉问答便是其中最具代表性的任务之一。视觉问答旨在正确回答给定图片提出的问题,因其丰富的应用领域而具有重要的研究价值。目前,视觉问... 详细信息
来源: 评论
基于目标检测的短视频描述生成与优化方法研究
基于目标检测的短视频描述生成与优化方法研究
收藏 引用
作者: 叶舟 北京邮电大学
学位级别:硕士
随着互联网及5G通讯技术的发展,视频成为了人们生活中一种十分便捷的沟通和娱乐方式。在使用计算机分析这些视频数据时,往往会遇到越不同模态之间处理信息的情况,如视频描述任务就是其中最常见的一种。短视频服务作为视频领域中一个... 详细信息
来源: 评论