改进索引术语质量的衡量方法可以有效提高IR系统的检索效率,但术语的固有属性易受文档长度影响,难以全面衡量术语质量。对此,本文从术语内在的区分性出发,借鉴词袋模型的基本思想,提出了术语区分能力(term discriminative capacity,TDC)这一理论及3种不同的计算方法。本文还采集了Web of Science的3个子数据库中包含4个著录项的900条记录作为实验数据,来实现TDC的大规模计算,并观察3种算法在实践中的差异。经过实验分析得出,计算术语区分能力的最佳方法为TDC-T,该算法在多个方面表现稳定,且不受DF值的影响,可以作为衡量术语质量的全新指标,记为TDC。但是本研究所选取的A&HCI数据库的记录较少,这或许会造成另两个领域计算结果的失衡。
通过对引用布鲁克斯情报学哲学思想的相关文献进行引文分析,透视布鲁克斯关于情报学哲学基础的观点对我国情报学发展的影响,考察国内学界对情报学哲学基础领域问题是否已经形成统一、成熟的认知。采集引用论文“The foundations of info...
详细信息
通过对引用布鲁克斯情报学哲学思想的相关文献进行引文分析,透视布鲁克斯关于情报学哲学基础的观点对我国情报学发展的影响,考察国内学界对情报学哲学基础领域问题是否已经形成统一、成熟的认知。采集引用论文“The foundations of information science:Part *** aspects”且被引频次≥1的中文文献,分析这些文献的时间分布、主题分布、引证文献。研究表明:布鲁克斯情报学哲学思想对我国情报学基础理论研究影响甚广;中国情报学界在情报学哲学基础方面依然没有形成统一认识,需要继续加强研究,以夯实情报学理论基础。
暂无评论