咨询与建议

限定检索结果

文献类型

  • 6 篇 期刊文献
  • 5 篇 学位论文

馆藏范围

  • 11 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 10 篇 工学
    • 6 篇 计算机科学与技术...
    • 5 篇 软件工程
    • 4 篇 机械工程
    • 1 篇 控制科学与工程
  • 2 篇 管理学
    • 2 篇 管理科学与工程(可...
    • 1 篇 图书情报与档案管...
  • 1 篇 教育学
    • 1 篇 教育学
  • 1 篇 理学
    • 1 篇 系统科学

主题

  • 11 篇 多模态预训练模型
  • 1 篇 预训练大模型
  • 1 篇 课堂行为
  • 1 篇 文本语义分类
  • 1 篇 图像-文本匹配
  • 1 篇 视觉文档问答
  • 1 篇 数据增强
  • 1 篇 注意力机制
  • 1 篇 风格迁移
  • 1 篇 预训练任务
  • 1 篇 混合cnn和vit
  • 1 篇 人工智能
  • 1 篇 跨模态图像检索
  • 1 篇 组合图像检索
  • 1 篇 图像描述生成
  • 1 篇 多标签图像分类
  • 1 篇 图文特征对齐
  • 1 篇 语言大模型
  • 1 篇 多模态神经机器翻...
  • 1 篇 多阶段预训练

机构

  • 2 篇 北京邮电大学
  • 2 篇 哈尔滨工业大学
  • 1 篇 大连理工大学
  • 1 篇 中国科学院自动化...
  • 1 篇 中国科学院大学
  • 1 篇 广西建设职业技术...
  • 1 篇 山东大学
  • 1 篇 山东建筑大学
  • 1 篇 广西交通职业技术...
  • 1 篇 昆明理工大学
  • 1 篇 杭州电子科技大学
  • 1 篇 大连民族大学
  • 1 篇 浙江农林大学

作者

  • 1 篇 孙世昶
  • 1 篇 hu yanrong
  • 1 篇 林鸿飞
  • 1 篇 聂礼强
  • 1 篇 王雷
  • 1 篇 liu shuang
  • 1 篇 詹圳宇
  • 1 篇 贾少杰
  • 1 篇 葛万钊
  • 1 篇 meng jiana
  • 1 篇 xiao wenhao
  • 1 篇 吴欣雅
  • 1 篇 刘洪久
  • 1 篇 薛悦平
  • 1 篇 liu meng
  • 1 篇 nie xiu-shan
  • 1 篇 xue yueping
  • 1 篇 肖文浩
  • 1 篇 聂秀山
  • 1 篇 刘萌

语言

  • 11 篇 中文
检索条件"主题词=多模态预训练模型"
11 条 记 录,以下是1-10 订阅
排序:
基于多模态预训练模型的水稻病虫害图像描述生成研究
收藏 引用
南京农业大学学报 2024年 第4期47卷 782-791页
作者: 薛悦平 胡彦蓉 刘洪久 童莉珍 葛万钊 浙江农林大学数学与计算机科学学院/浙江省林业智能监测与信息技术研究重点实验室/林业感知技术与智能装备国家林业和草原局重点实验室 浙江杭州311300
[目的]针对水稻病虫害图像分类技术缺少对病症描述的问题,本文提出一种轻量化的水稻病虫害图像描述模型,对水稻病虫害图像进行更为具体的描述。[方法]以白叶枯病、细菌性条斑病、恶苗病、三化螟虫、稻瘟病、稻曲病、纹枯病、飞虱、稻蓟... 详细信息
来源: 评论
多模态预训练模型在课堂行为智能辅助教学中的应用与拓展研究
收藏 引用
教育观察 2024年 第11期13卷 24-27页
作者: 范文阳 黄海波 广西交通职业技术学院交通信息工程学院 广西建设职业技术学院管理工程学院
多模态预训练模型能够处理图像、文本、语音等多种模态数据。将多模态预训练模型应用于课堂行为智能辅助教学,可实现教育过程的课堂行为分析和优化。对学生的课堂行为进行多模态数据的收集和分析,可以全面了解学生的学习状态和需求。... 详细信息
来源: 评论
基于多模态预训练模型的文档图像问答技术研究与应用
基于多模态预训练模型的文档图像问答技术研究与应用
收藏 引用
作者: 吴欣雅 北京邮电大学
学位级别:硕士
文档视觉问答(Document Visual Question Answer,DocVQA)是指基于视觉文档回答问题的任务,该任务需要有效利用图像中的语言信息来回答问题。DocVQA在实际生活中有广泛的应用,得到了不少研究。但是,现有研究主要集中于“in-line”问题,... 详细信息
来源: 评论
基于多模态预训练模型和受限数据的图像分类
基于多模态预训练模型和受限数据的图像分类
收藏 引用
作者: 郭梓贤 哈尔滨工业大学
学位级别:硕士
深度学习领域中针对大规模训练模型的研究在近些年取得了丰厚的研究成果,其中视觉-语言多模态预训练模型由于其在开放域中良好的语义识别能力而得到了广泛的关注,基于这些多模态预训练模型模型迁移和适配方法也被广泛研究。本文所... 详细信息
来源: 评论
基于轻量级模型多模态训练技术及其可视化研究
基于轻量级模型的多模态预训练技术及其可视化研究
收藏 引用
作者: 刘同同 北京邮电大学
学位级别:硕士
随着深度学习以及高性能计算资源的发展,基于注意力机制的训练模型在自然语言处理以及多模态领域都取得了优异的成绩。但是,当前的训练模型需要大量训练数据,模型规模巨大,导致其训练成本高,很难部署在低资源设备上。为此,本文研究... 详细信息
来源: 评论
ChatGPT给语言大模型带来的启示和多模态模型新的发展思路
收藏 引用
数据分析与知识发现 2023年 第3期7卷 26-35页
作者: 赵朝阳 朱贵波 王金桥 中国科学院自动化研究所 北京100190
【目的】剖析ChatGPT的基础技术原理,探讨其对大语言模型发展产生的影响,以及对多模态模型发展思路产生的影响。【方法】通过分析ChatGPT的发展过程和技术原理,探讨指令微调、数据采集与标注、基于人类反馈的强化学习等模型构建方法... 详细信息
来源: 评论
基于深度学习的图像-文本匹配研究综述
收藏 引用
计算机学报 2023年 第11期46卷 2370-2399页
作者: 刘萌 齐孟津 詹圳宇 曲磊钢 聂秀山 聂礼强 山东建筑大学计算机科学与技术学院 济南250101 山东大学(青岛)计算机科学与技术学院 山东青岛266000 哈尔滨工业大学(深圳)计算机科学与技术学院 广东深圳518055
图像-文本匹配任务旨在衡量图像和文本描述之间的相似性,其在桥接视觉和语言中起着至关重要的作用.近年来,图像与句子的全局对齐以及区域与单词的局部对齐研究方面取得了很大的进展.本文对当前先进的研究方法进行分类和描述.具体地,本... 详细信息
来源: 评论
细粒度文本引导的跨模态风格迁移
收藏 引用
中文信息学报 2024年 第12期38卷 170-180页
作者: 孙世昶 魏爽 孟佳娜 林鸿飞 肖文浩 刘爽 大连民族大学计算机科学与工程学院 辽宁大连116600 大连理工大学计算机科学与技术学院 辽宁大连116024
借助于StyleGANs的解纠缠表示和多模态预训练模型中不同模态之间的语义对应关系,现有方法在跨模态风格迁移领域取得了较好的结果。然而,基于图像尺度分解的StyleGANs的潜在空间不利于局部属性的编辑,这会造成在迁移时对无关部分的干扰... 详细信息
来源: 评论
基于粗细粒度融合的组合图像检索研究
基于粗细粒度融合的组合图像检索研究
收藏 引用
作者: 黄拼拼 杭州电子科技大学
学位级别:硕士
在不断扩增的多模态数据浪潮中,以组合多模态信息作为检索条件的图像检索技术日益成为研究重点。组合图像检索的研究普遍采用融合学习范式,通过将文本-图像查询构建为一个联合嵌入向量,并计算其与候选图像的相似度来完成检索过程。现有... 详细信息
来源: 评论
基于图文交互增强低资源神经机器翻译方法研究
基于图文交互增强低资源神经机器翻译方法研究
收藏 引用
作者: 霍茜曈 昆明理工大学
学位级别:硕士
神经机器翻译技术已经在生产生活中占有重要地位,尤其随着国家与国家的联系更加紧密,世界趋向整个经济体的今天,机器翻译有较强应用价值。然而神经机器翻译模型性能依赖于大量高质量平行语料随,因此某些低资源翻译语种对难以达到高资源... 详细信息
来源: 评论