数据挖掘是信息技术自然演化的结果,是摆脱“数据丰富,知识缺乏”困境的有效途径。它是从大量数据中挖掘出有用的知识的一种方法,其应用涉及、金融业、零售业、电行业和生物医学等众多行业。本论文就探讨了以业界标准为指导的数据挖掘技术在交易所IT基础设施监控系统中系统维护和决策方面的应用。\n 本文以国内某商品交易所IT基础设施监控系统项目为背景,在深入调研与分析国内外数据挖掘相关理论、技术、应用和标准文献的基础上,利用该系统中的数据作为实验对象,主要研究了数据挖掘过程中的以下几个问题:数据挖掘项目开发过程模型、数据预处理的流程和方法、数据挖掘语言的标准和时序数据处理技术。本论文的主要研究工作与成果有:\n ①针对目前的数据挖掘过程模型在实际应用中仅考虑数据挖掘技术,忽略了项目的规划、部署与数据挖掘技术协调的问题,本论文深入研究了数据挖掘过程标准Cross-Industry Process for Data Mining(跨行业数据挖掘过程标准,CRISP-DM),并将其应用到具体的项目实施过程中,使数据挖掘技术能够更好地解决商业问题。\n ②根据IT基础设施监控系统中数据的是典型的时序数据的事实,探讨了数据预处理技术和时序数据处理技术,在实际应用过程中对这些技术进行有针对性的定制,并将数据挖掘的最终结果以独立于系统和应用的Predictive Model Markup Language(预测模型标记语言,PMML)表达。\n ③本文从项目实施的角度研究了数据挖掘技术的一个新应用,并使用了业界普遍采纳的标准和成熟的数据挖掘技术搭建了一个应用的框架。\n 经过反复的研究与论证,结果表明,本文的理论,方法与技术正确有效,为数据挖掘项目的开发提供了有效的理论指导,具有良好的实际应用前景,对以后类似的实践有一定的借鉴意义。
暂无评论