咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 工学
    • 1 篇 电气工程
    • 1 篇 计算机科学与技术...

主题

  • 1 篇 yes-no visual qu...
  • 1 篇 visual informati...
  • 1 篇 oracle task
  • 1 篇 question answeri...
  • 1 篇 object sequences
  • 1 篇 guesswhat datase...
  • 1 篇 neural network a...
  • 1 篇 vqa task
  • 1 篇 neural net archi...
  • 1 篇 text-based quest...
  • 1 篇 categorical obje...
  • 1 篇 language informa...
  • 1 篇 image coding
  • 1 篇 spatial object i...
  • 1 篇 text analysis
  • 1 篇 image sequences
  • 1 篇 language-based f...
  • 1 篇 visual features

机构

  • 1 篇 indian inst tech...

作者

  • 1 篇 garg shivam
  • 1 篇 srivastava rajee...

语言

  • 1 篇 英文
检索条件"主题词=spatial object information encoding"
1 条 记 录,以下是1-10 订阅
排序:
object sequences: encoding categorical and spatial information for a yes/no visual question answering task
收藏 引用
IET COMPUTER VISION 2018年 第8期12卷 1141-1150页
作者: Garg, Shivam Srivastava, Rajeev Indian Inst Technol BHU Dept Comp Sci & Engn Varanasi 221005 Uttar Pradesh India
The task of visual question answering (VQA) has gained wide popularity in recent times. Effectively solving the VQA task requires the understanding of both the visual content in the image and the language information ... 详细信息
来源: 评论