大多数现有的视觉语言预训练方法侧重于理解任务,并在训练时使用类似于BERT的损失函数(掩码语言建模和图像文本匹配).尽管它们在许多理解类型的下游任务中表现良好,例如视觉问答、图像文本检索和视觉蕴涵,但它们不具备生成信息的能力.为了解决这个问题,提出了视觉语言理解和生成的统一多模态预训练(unified multimodal pre-training for vision-language understanding and generation,UniVL).UniVL能够处理理解任务和生成任务,并扩展了现有的预训练范式,同时使用随机掩码和因果掩码,因果掩码即掩盖未来标记的三角形掩码,这样预训练的模型可以具有自回归生成的能力.将几种视觉语言理解任务规范为文本生成任务,并使用基于模版提示的方法对不同的下游任务进行微调.实验表明,在使用同一个模型时,理解任务和生成任务之间存在权衡,而提升这两个任务的可行方法是使用更多的数据.UniVL框架在理解任务和生成任务方面的性能与最近的视觉语言预训练方法相当.此外,实验还证明了基于模版提示的生成方法更有效,甚至在少数场景中它优于判别方法.
Medline是当前国际上最权威的生物医学文献数据库.人们不仅可以从这些文献得到大量的诊疗信息,而且可以从不同年代发表的文献主题之间的差异挖掘出生物医疗研究不同时间的关注点.基于此,开发了基于Medline的生物医学文献分析系统(biomedical literature analysis system based on Medline,Medas),系统设计实现了一系列的文献挖掘算法,提供了生物医疗领域的演变分析、疾病诊疗方案查询、生物医疗领域研究主题变迁分析等功能.这些功能可以为医护人员提供诊疗护理建议,可以帮助医疗研究人员了解生物医疗领域的研究趋势以及不同疾病、诊疗方案在不同时期的关注度,也可以为普通用户查询疾病基本相关信息提供帮助.
暂无评论