咨询与建议

限定检索结果

文献类型

  • 3 篇 期刊文献
  • 1 篇 学位论文

馆藏范围

  • 4 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 4 篇 工学
    • 3 篇 机械工程
    • 2 篇 计算机科学与技术...
    • 2 篇 软件工程
    • 1 篇 光学工程
    • 1 篇 仪器科学与技术
    • 1 篇 电子科学与技术(可...
    • 1 篇 控制科学与工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 4 篇 跨模态特征对齐
  • 2 篇 异质图像增广
  • 2 篇 跨模态行人重识别
  • 2 篇 模态差异
  • 1 篇 跨模态检索
  • 1 篇 数据优化
  • 1 篇 图像描述生成
  • 1 篇 文献综述
  • 1 篇 视频理解
  • 1 篇 大语言模型(llm)

机构

  • 1 篇 粤港澳情感智能与...
  • 1 篇 深圳北理莫斯科大...
  • 1 篇 复旦大学
  • 1 篇 重庆金美通信有限...
  • 1 篇 澳大利亚阿德莱德...
  • 1 篇 武汉迈力特通信有...
  • 1 篇 中南民族大学
  • 1 篇 深圳大学

作者

  • 1 篇 zhong wu
  • 1 篇 zhao wangrong
  • 1 篇 fan zhihao
  • 1 篇 段海涵
  • 1 篇 魏忠钰
  • 1 篇 胡希平
  • 1 篇 王瑞泽
  • 1 篇 承怡菁
  • 1 篇 曾润浩
  • 1 篇 张辉
  • 1 篇 黄萱菁
  • 1 篇 liu shihong
  • 1 篇 王宇晖
  • 1 篇 李嘉梁
  • 1 篇 wei zhongyu
  • 1 篇 陈奇
  • 1 篇 钟武
  • 1 篇 刘世洪
  • 1 篇 wang ruize
  • 1 篇 范智昊

语言

  • 4 篇 中文
检索条件"主题词=跨模态特征对齐"
4 条 记 录,以下是1-10 订阅
排序:
大语言模型引导的视频检索数据迭代优化
收藏 引用
中国图象图形学报 2025年 第5期30卷 1257-1271页
作者: 曾润浩 李嘉梁 卓奕深 段海涵 陈奇 胡希平 深圳北理莫斯科大学人工智能研究院 粤港澳情感智能与普适计算联合实验室 深圳大学机电与控制工程学院 澳大利亚阿德莱德大学计算机科学学院
目的 视频文本模态检索旨在从视频库或给定视频中检索出语义上与给定查询文本最相似的视频或视频片段,是视频理解的重要应用之一。现有方法主要聚焦于如何通过模态交互提高模态间的语义匹配,但忽略了目前数据集存在一个查询文本... 详细信息
来源: 评论
基于图像和特征联合优化的模态行人重识别研究
收藏 引用
荆楚理工学院学报 2023年 第2期38卷 9-17页
作者: 张辉 刘世洪 钟武 武汉迈力特通信有限公司 湖北武汉430075 重庆金美通信有限责任公司 重庆400030
模态行人重识别(VI-ReID)旨在匹配可见光和红外摄像头下捕获的行人图像,十分具有挑战性。为减小可见光图像和红外图像之间的模态差异,本文提出了异质图像增广方法和跨模态特征对齐方法来优化模态行人重识别网络,利用轻量级异质图像... 详细信息
来源: 评论
从视觉到文本:图像描述生成的研究进展综述
收藏 引用
中文信息学报 2020年 第7期34卷 19-29页
作者: 魏忠钰 范智昊 王瑞泽 承怡菁 赵王榕 黄萱菁 复旦大学大数据学院 上海200433 复旦大学工程与应用技术研究院 上海200433 复旦大学计算机科学与技术学院 上海200433
近年来,模态研究吸引了越来越多学者的关注,尤其是连接视觉和语言的相关课题。该文针对视觉和语言模态研究中的核心任务——图像描述生成,进行文献综述。该文从基于视觉的文本生成框架、基于视觉的文本生成研究中的关键问题、图像... 详细信息
来源: 评论
面向可见光和红外的模态行人重识别方法研究
面向可见光和红外的跨模态行人重识别方法研究
收藏 引用
作者: 王宇晖 中南民族大学
学位级别:硕士
随着深度神经网络的发展、城市视频监控系统的普及和监控网络的完善,行人重识别(Person Re-identification,Re ID)技术逐渐成为近年来计算机视觉领域的热门研究课题,在智能视频监控和安防领域发挥着越来越重要的作用。传统行人重识别技... 详细信息
来源: 评论