版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:复旦大学计算机科学技术学院上海201203 上海市智能信息处理重点实验室上海200433
出 版 物:《计算机工程》 (Computer Engineering)
年 卷 期:2015年第41卷第8期
页 面:162-167页
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金资助项目(61472088 61473092)
主 题:半结构化数据 查询 数据检索 图模型 全局因子 特征集合
摘 要:随着用户输入查询的自由度越来越高,导致已有半结构化数据检索模型无法满足用户需求。针对该问题,提出一种新的半结构化数据检索模型。在对原始查询进行分词后,把得到的词条作为基本元素,通过特征方程给每个词条设定对应权重,使用基于朴素贝叶斯的内容属性匹配方法进行内容属性匹配概率设定,并采用基于编辑距离的字符串相似度算法改善检索质量。从某商业搜索网站的查询日志中随机抽取真实的查询记录,人工为这些查询标注正确答案,从而做性能评估。实验结果表明,与层次语言模型、半结构化数据概率检索模型相比,该模型能有效提高半结构化数据的检索性能。