版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者单位:武汉理工大学
学位级别:硕士
导师姓名:唐建雄;熊前兴
授予年度:2011年
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)]
摘 要:XML是W3C于1998年提出的一种标记语言,由于独特的技术优势,XML推出后很快就成为Internet上信息描述和交换的标准。随着XML应用的越来越广泛,Web上的XML文档与日俱增,为了实现对海量XML数据的高效存储与访问,基于数据库技术的XML查询优化已成为一个十分重要的研究课题。 论文首先分析了XML数据库的发展现状,接着介绍了XML Schema等XML的相关概念;为了有效地支持XML查询优化,对XML数据的几种编码方法和关系存储模型以及查询优化的几种方式做了一些探究。本文主要是对基于关系数据库的XML查询优化技术进行研究,所做的主要工作包括: (1)基于区间编码和XRel关系存储模型的基础上,提出了扩展的关系存储模型,该模型可以高效地实现结构连接中包含关系与位置关系的计算。 (2)提出了一种基于XML模式信息的路径表达式的优化方法,其实现步骤包括:模式信息的提取、判断结点是否可优化以及优化算法描述,当路径表达式较长时,这种方法能够很好的减少路径表达式的连接操作次数,从而实现路径的优化。 (3)由于XML文档的查询通常被转化为两个结点之间的包含关系或文档位置关系的计算,因此有效地支持结构连接对XML查询的实现意义重大。文章对结构连接算法进行了研究和改进,基于扩展的关系存储模型实现了更为有效地包含关系的结构连接算法。改进的算法能够避免对内表的重复扫描,在对双亲/孩子关系的结构连接操作时,CPU时间和I/O复杂度比原算法要低得多,特别是当双亲结点的队列中存在嵌套结点时,改进后的算法更优越。