咨询与建议

限定检索结果

文献类型

  • 4 篇 期刊文献
  • 1 篇 学位论文

馆藏范围

  • 5 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 5 篇 工学
    • 3 篇 机械工程
    • 2 篇 计算机科学与技术...
    • 2 篇 软件工程
    • 1 篇 信息与通信工程
    • 1 篇 控制科学与工程
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 5 篇 对比语言-图像预训...
  • 1 篇 遥感影像
  • 1 篇 transformer
  • 1 篇 跨模态检索
  • 1 篇 注意力机制
  • 1 篇 语义解析
  • 1 篇 数据异构
  • 1 篇 特征保留策略
  • 1 篇 自监督学习
  • 1 篇 长尾分布
  • 1 篇 视频异常行为检测
  • 1 篇 多模态融合
  • 1 篇 模态交互
  • 1 篇 空间语义
  • 1 篇 特征增强
  • 1 篇 无参考视频质量评...
  • 1 篇 联邦学习
  • 1 篇 时间相关性
  • 1 篇 换装行人重识别

机构

  • 1 篇 中国人民公安大学
  • 1 篇 广州大学
  • 1 篇 江苏大学
  • 1 篇 昆明理工大学
  • 1 篇 武汉大学
  • 1 篇 航天恒星科技有限...
  • 1 篇 西安测绘研究所

作者

  • 1 篇 金澄
  • 1 篇 汪尧
  • 1 篇 邢凤闯
  • 1 篇 guo fang
  • 1 篇 li wenbin
  • 1 篇 liu yang
  • 1 篇 kang dong
  • 1 篇 曾志昊
  • 1 篇 陈旭
  • 1 篇 付晓东
  • 1 篇 刘钊
  • 1 篇 赵裴
  • 1 篇 geng xia
  • 1 篇 康栋
  • 1 篇 耿霞
  • 1 篇 弋步荣
  • 1 篇 liu zhao
  • 1 篇 刘扬
  • 1 篇 wang yao
  • 1 篇 jin cheng

语言

  • 5 篇 中文
检索条件"主题词=对比语言-图像预训练"
5 条 记 录,以下是1-10 订阅
排序:
结合旋转自监督和CLIP指导的长尾数据联邦学习
收藏 引用
计算机工程 2025年
作者: 刘海军 付晓东 昆明理工大学信息工程与自动化学院 昆明理工大学云南省计算机技术应用重点实验室
现实世界的数据通常遵循长尾分布,假设全局数据分布平衡的联邦学习方法难以对长尾数据中的尾类数据进行准确分类。为此,现有研究为全局模型重新训练一个平衡的分类器来缓解长尾数据带来的影响,但未考虑平衡模型的特征提取器和如何让... 详细信息
来源: 评论
基于特征增强和模态交互的视频异常行为检测
收藏 引用
计算机辅助设计与图形学学报 2025年 第3期37卷 407-413页
作者: 吴沛宸 李文斌 郭放 刘钊 中国人民公安大学信息网络安全学院 北京100038 中国人民公安大学网络空间安全与法治协同创新中心 北京100038
对比语言-图像预训练模型作为一种基于多模态对比训练的神经网络,通过训练大量的语言-图像对提取具有判别性的图像特征.为了关注连续帧之间的时序关系,消除不同模态特征之间的信息分布差异,提出一种基于特征增强和模态交互的视频异常... 详细信息
来源: 评论
基于CLIP增强细粒度特征的换装行人重识别方法
收藏 引用
计算机工程 2025年 第4期51卷 293-302页
作者: 耿霞 汪尧 江苏大学计算机科学与通信工程学院 江苏镇江212000
换装行人重识别旨在检索穿着不同服装的目标行人。现有方法通过引入额外信息(如轮廓、步态、3D信息)辅助学习服装无关特征。但受光照、姿态变化等因素的影响,提取的生物特征可能存在误差。为提高准确性,探索对比语言-图像预训练(CLIP)... 详细信息
来源: 评论
基于Transformer的超高清视频质量评估方法研究
基于Transformer的超高清视频质量评估方法研究
收藏 引用
作者: 邢凤闯 广州大学
学位级别:博士
视频作为一种信息载体,因其丰富且生动的内容使其在日常生活中得到广泛应用。然而,随着视频数量的急剧增长,许多低质量的视频也不断涌入人们的视野,大大降低了用户的观看体验。视频质量评估(Video Quality Assessment,VQA)系统能有效估... 详细信息
来源: 评论
一种顾及空间语义的跨模态遥感影像检索技术
收藏 引用
中国电子科学研究院学报 2023年 第4期18卷 328-335,385页
作者: 金澄 弋步荣 曾志昊 刘扬 陈旭 赵裴 康栋 西安测绘研究所 陕西西安710000 航天恒星科技有限公司 北京100080 武汉大学计算机学院 湖北武汉430072
随着遥感影像获取的场景和目标内容日益丰富,传统的基于关键字和属性字段的检索手段无法反映对于影像内容的语义检索,导致用户无法从大规模影像中获取满足需求语义的数据。OpenAI发布的语言-图像训练对比模型(CLIP),为跨模态开放要素... 详细信息
来源: 评论