咨询与建议

限定检索结果

文献类型

  • 11 篇 学位论文
  • 6 篇 期刊文献

馆藏范围

  • 17 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 17 篇 工学
    • 11 篇 机械工程
    • 8 篇 计算机科学与技术...
    • 7 篇 软件工程
    • 5 篇 控制科学与工程
    • 1 篇 仪器科学与技术
    • 1 篇 石油与天然气工程
    • 1 篇 生物医学工程(可授...
    • 1 篇 生物工程
  • 4 篇 管理学
    • 4 篇 管理科学与工程(可...
  • 1 篇 理学
    • 1 篇 系统科学
  • 1 篇 艺术学
    • 1 篇 设计学(可授艺术学...

主题

  • 17 篇 跨模态对齐
  • 2 篇 视频时刻检索
  • 2 篇 视频理解
  • 1 篇 行人分割
  • 1 篇 关系学习
  • 1 篇 测井含水饱和度预...
  • 1 篇 视觉先验
  • 1 篇 先验权重
  • 1 篇 推荐系统
  • 1 篇 情境识别
  • 1 篇 视觉常识推理
  • 1 篇 视觉—语言交互
  • 1 篇 跨模态检索
  • 1 篇 时刻定位
  • 1 篇 自编码器
  • 1 篇 视频片段检索
  • 1 篇 注意力机制
  • 1 篇 跨模态声源分离
  • 1 篇 医疗影像报告生成
  • 1 篇 视觉与语言

机构

  • 4 篇 电子科技大学
  • 1 篇 华中科技大学
  • 1 篇 湖南大学
  • 1 篇 中国科学院大学
  • 1 篇 天津大学
  • 1 篇 油气藏地质及开发...
  • 1 篇 西南石油大学
  • 1 篇 广西大学
  • 1 篇 西北工业大学
  • 1 篇 山东大学
  • 1 篇 大陆动力学国家重...
  • 1 篇 山东建筑大学
  • 1 篇 西安电子科技大学
  • 1 篇 南昌航空大学
  • 1 篇 哈尔滨工业大学
  • 1 篇 西北大学
  • 1 篇 河北地质大学
  • 1 篇 中南大学

作者

  • 1 篇 闫文尚
  • 1 篇 潘嘉男
  • 1 篇 牛凯
  • 1 篇 王承伟
  • 1 篇 suo wei
  • 1 篇 yin jiang
  • 1 篇 陈星廷
  • 1 篇 yin yi-long
  • 1 篇 刘岱宗
  • 1 篇 谭智方
  • 1 篇 吴明言
  • 1 篇 chen xingting
  • 1 篇 李昊渊
  • 1 篇 luo renze
  • 1 篇 尹义龙
  • 1 篇 wu juan
  • 1 篇 孙梦阳
  • 1 篇 石楚豪
  • 1 篇 周妍
  • 1 篇 王国庆

语言

  • 17 篇 中文
检索条件"主题词=跨模态对齐"
17 条 记 录,以下是1-10 订阅
排序:
基于多尺度注意力和跨模态对齐的医学报告生成
基于多尺度注意力和跨模态对齐的医学报告生成
收藏 引用
作者: 唐晟 中南大学
学位级别:硕士
医学报告的自动生成是基于人工智能和自然语言处理等技术的一项重要研究领域。医学报告在临床诊疗过程中起着至关重要的作用,它记录了医生对患者进行的诊断和治疗的结果,并提供了后续医疗决策的依据。因此,医学报告自动生成技术的发展... 详细信息
来源: 评论
基于模态语义对齐的视频时刻检索研究
基于跨模态语义对齐的视频时刻检索研究
收藏 引用
作者: 王公勉 电子科技大学
学位级别:硕士
随着互联网技术的繁荣和视频技术的发展,视频内容正被越来越多的人们所青睐。每天,世界上都有大量的视频被拍摄、剪辑,并上传到互联网上。由于视频内容每天都在指数级地增长,研究人员越来越多地关注于使用视频检索技术来处理大量的视频... 详细信息
来源: 评论
基于大语言模型的致密砂岩储层测井含水饱和度预测
收藏 引用
天然气工业 2024年 第9期44卷 77-87页
作者: 武娟 罗仁泽 雷璨如 殷疆 陈星廷 西南石油大学地球科学与技术学院 610500 油气藏地质及开发工程全国重点实验室·西南石油大学 西南石油大学电气信息学院 西北大学地质学系 大陆动力学国家重点实验室·西北大学
致密砂岩储层测井含水饱和度预测是油气藏储层评价和产量预测的关键步骤,应用机器学习模型预测含水饱和度在一定程度上缓解了常规方法预测误差大的问题。但是现有的机器学习方法通常使用有限的测井数据从头开始训练模型,导致模型能力受... 详细信息
来源: 评论
模态融合的高效弱监督视频时刻检索算法
收藏 引用
北京航空航天大学学报 2023年
作者: 蒋寻 徐行 沈复民 王国庆 杨阳 电子科技大学计算机科学与工程学院
弱监督视频时刻检索旨在基于视频与自然语言文本的匹配关系训练深度学习算法模型,以实现根据自然语言查询文本从未经修剪的视频中检索特定事件内容的起始与结束时间。大多数现有的弱监督视频时刻检索方法采用多模态融合机制来理解视频... 详细信息
来源: 评论
基于自然语言的视频片段定位综述
收藏 引用
计算机科学 2022年 第9期49卷 111-122页
作者: 聂秀山 潘嘉男 谭智方 刘新放 郭杰 尹义龙 山东建筑大学计算机科学与技术学院 济南250101 山东大学软件学院 济南250100
自然语言视频定位(Natural Language Video Localization, NLVL)是一项新颖而富有挑战性的任务。该任务的目的是根据给定的查询文本从未修剪的视频中找到与这条查询文本语义最为相似的目标片段。与传统的时序动作定位任务不同,NLVL具有... 详细信息
来源: 评论
文本属性激活视觉的广义零样本图像识别
收藏 引用
计算机工程与应用 2024年
作者: 闫文尚 张桂梅 南昌航空大学江西省图像处理与模式识别重点实验室
现有的零样本学习方法存在语义信息与视觉特征无法有效对齐,且视觉特征中存在较多冗余信息,导致零样本和广义零样本图像识别精度不佳。针对该问题,提出文本属性激活视觉的广义零样本图像识别方法。首先,借助大语言模型生成判别性语... 详细信息
来源: 评论
基于视觉与语言的行人理解
基于视觉与语言的行人理解
收藏 引用
作者: 荆雅 中国科学院大学
学位级别:博士
基于视觉与语言的行人理解是一个融合了计算机视觉、自然语言处理和机器学习的综合问题。其任务目标是对行人图像以及关于行人的自然语言描述进行共同理解。现在随着基础设备和互联网的普及,每天都会产生海量的多模态数据,包括视觉数... 详细信息
来源: 评论
基于自编码器的零样本图像分类
基于自编码器的零样本图像分类
收藏 引用
作者: 崔碧莹 天津大学
学位级别:硕士
大数据时代,随着深度学习算法在计算机视觉领域的不断发展,图像分类技术也取得了巨大的进步。监督学习依赖于庞大的有标注图像实现对模型的训练,然而对现实世界中数以万计的图像进行标注需要耗费极高的人力和时间成本。即便如此,某些稀... 详细信息
来源: 评论
基于特征点的指代表达理解算法研究
基于特征点的指代表达理解算法研究
收藏 引用
作者: 赵沛芝 广西大学
学位级别:硕士
作为人类在现实世界中交互的基本手段,使用自然语言对实体或者抽象概念进行统一的指代可以实现高效的信息交流。因此让智能体能够在视觉概念与自然语言概念上构建关联是实现人工智能模型在现实世界中与人类交互的关键性技术。随着深度... 详细信息
来源: 评论
自监督音视频理解研究
自监督音视频理解研究
收藏 引用
作者: 王化森 电子科技大学
学位级别:硕士
深度学习和人工智能的发展极大影响了人类社会,已经深入到人们学习生活中。尽管在人工智能和计算机视觉领域,视觉更加受到研究者的青睐,但音频仍然是我们学习和理解现实世界不可或缺的重要信息。视觉和音频是人们感知现实世界最直接的方... 详细信息
来源: 评论