云计算环境下存储于不同单位、不同部门的数据资源具有跨域、分布式、类型多样、数据敏感等特点。数据即服务(Data as a Service,DaaS)作为一种新的云计算服务模式,在跨域异构数据的集成、处理、挖掘和分析等方面得到了广泛关注。数据服...
详细信息
云计算环境下存储于不同单位、不同部门的数据资源具有跨域、分布式、类型多样、数据敏感等特点。数据即服务(Data as a Service,DaaS)作为一种新的云计算服务模式,在跨域异构数据的集成、处理、挖掘和分析等方面得到了广泛关注。数据服务(Data service)是一种具有统一描述模式的数据模型,能够将数据资源以服务的形式进行发布,并为用户提供统一的数据访问接口,是DaaS的核心技术。然而,数据资源的多样性和用户需求的动态性对数据服务技术提出了巨大挑战。以此为背景,本文对云环境下数据服务自动封装、数据组合视图自动生成以及视图实时更新等关键技术展开了研究,主要研究内容包括:(1)针对数据资源服务化的问题,提出了一种基于REST的数据服务自动抽取与封装方法。根据数据内在的依赖关系构建了数据依赖图,以此为基础给出了数据服务自动抽取算法,并设计了基于REST的数据服务封装框架,通过服务模板对数据服务进行自动封装;该方法提高了数据服务封装的自动化程度,能够得到成熟度较高的数据服务。(2)针对用户需求动态多变的问题,提出了一种基于服务依赖图的数据组合视图自动生成方法。根据服务间的依赖关系建立了数据服务依赖图,通过搜索依赖图中的最优子图得到复合数据服务,再执行复合数据服务自动生成数据组合视图;该方法能够得到最优组合方案,并能高效地生成数据组合视图。(3)针对数据视图一致性的问题,提出了一种基于增量日志的数据组合视图定位更新方法。根据数据源日志的增量变化获取最新变更数据,对数据组合视图中的属性和元组建立索引,通过定位属性计算差异元组的索引号,并根据变更类型直接对差异元组执行更新操作;该方法的更新效率优于已有的更新策略,并保证了更新的实时性。以云环境下不同部门的电梯设计单位数据集、使用单位数据集、制造单位数据集、销售单位数据集、维保单位数据集等数据为例,开发了一个电梯行业数据服务原型系统,主要包括电梯原子数据服务生成、电梯服务依赖图可视化、电梯复合数据服务组合和电梯数据组合视图生成等模块,可以有效地集成和共享电梯数据资源,为电梯数据挖掘分析奠定了基础。
暂无评论