版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:清华大学计算机系智能技术与系统国家重点实验室北京100084
出 版 物:《中文信息学报》 (Journal of Chinese Information Processing)
年 卷 期:2004年第18卷第2期
页 面:8-14页
核心收录:
学科分类:081203[工学-计算机应用技术] 08[工学] 0835[工学-软件工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家重点基础研究 (973)资助项目 (G19980 30 5 0 9) 自然科学基金资助项目 (6 0 2 2 30 0 4 ) 国家86 3高科技资助项目 (2 0 0 1AA114 0 82 )
主 题:计算机应用 中文信息处理 Web信息检索 数据集选择 结果融合 排序
摘 要:在Internet中 ,由于海量数据的多样性 ,在分布式数据集合上进行有效的检索就成为Web信息检索的一种必要方式。由此 ,引出多个检索结果的融合问题。对不同检索结果的相似度评分可能完全不可比的情况 ,本文给出一种新的解决方案 :按位加权插入合并算法。在 18GB的大规模web标准测试集上的实验证明 ,该算法始终能够提高综合检索性能 ,且分布数据集检索结果越好 ,则合并后性能改善越多。其中系统平均精度提高接近 10 %,突破了传统方法对分布数据集结果合并的综合效果总是低于使用集中数据集检索的性能局限。