版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:大连理工大学计算机科学与技术学院辽宁大连116024 大连理工大学公共管理与法学学院辽宁大连116024 认知智能国家重点实验室(科大讯飞)合肥230088
出 版 物:《计算机学报》 (Chinese Journal of Computers)
年 卷 期:2019年第42卷第10期
页 面:2160-2174页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金(61632011,61572102,61602078,61562080) 认知智能国家重点实验室开放基金(COGOS-20190001) 博士后科学基金面上项目(2018M641691) 教育部人文社会科学基金青年项目(19YJCZH199) 中央高校基本科研业务费专项资金(DUT18ZD102)资助
主 题:生物医学文献检索 医学主题词表 词共现模型 查询扩展 组排序
摘 要:近年来,随着生物医学相关研究的快速发展,生物医学文献的数量与日俱增,相关人员从海量文献中获取所需信息变得越来越困难,信息检索技术能够为用户提供所需信息,但由于领域专业度高,术语庞杂,传统通用领域的检索技术往往很难胜任这项任务,而生物医学领域存在丰富的语义资源,这些资源涵盖该领域专业术语,可以对文献检索起到辅助和提升作用.因此,为进一步提升生物医学文献检索的性能,该文尝试基于词共现查询扩展模型,结合生物医学领域特征,利用医学主题词表衡量扩展词的重要性,综合权衡扩展词与查询词的共现关系和扩展词在医学主题词表中的分布情况,选择优质扩展词;并在此基础上提出一种基于组排序学习的监督式查询扩展方法,该方法根据候选扩展词对检索性能的影响和候选扩展词能否反映查询的主题信息两个方面对扩展词进行相关性标注,提取与扩展词相关的上下文特征和领域语义特征对扩展词进行向量化表示,最后采用组排序学习方法训练扩展词选择模型,完成查询扩展.在TREC基因任务数据集上的实验结果表明,该方法能够有效提升查询扩展性能,与基于排序学习方法ListMLE的监督式查询扩展方法相比,在文档平均准确率方面分别提升4.41%和11.35%,有效提升了生物医学文献检索的综合性能.