咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于重标极差分析理论的时间序列数据挖掘的关键问题的研究 收藏
基于重标极差分析理论的时间序列数据挖掘的关键问题的研究

基于重标极差分析理论的时间序列数据挖掘的关键问题的研究

作     者:王帅 

作者单位:山东大学 

学位级别:硕士

导师姓名:陈曙;孙梅玉

授予年度:2010年

学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 

主      题:数据挖掘 时间序列 重标极差分析 相似性查找 符号化表示 

摘      要:随着信息系统的广泛应用,在日常生活、工作和科学研究中产生了各种类型的数据。而随着信息化程度的日益提高,这些保存的数据数量越来越大,其中绝大部分是时间序列数据,例如:金融证券市场中的股票价格变化;零售行业POS系统中,某种商品每天的销售额;在气象预报研究中,某一地区的每天气温和气压的读数等。时间序列数据挖掘是近年来提出的的一种新型数据分析技术,利用这种技术可以对海量的时间序列数据进行分析和处理,进而发现这些数据之间的关联关系以及人们希望得到的关联规则等内容,能够为人们正确的认识事物的发展变化以及进行对生产进行科学的决策起到辅助作用,具有非常重要的意义。因此有关时间序列分析的研究一直以来都受到了研究人员的广泛重视,是一个具有重要理论和实用价值的热点研究课题。本文针对非平稳时间序列数据挖掘技术中的时间序列表示方法、相似性查找、时间序列距离度量等关键技术进行了深入的分析研究。本文主要研究内容和创新点如下: 1)时间序列表示方法研究 本文将分形的思想首次应用到APCA (Adaptive Piecewise Constant Approximation)中,提出了一种基于分形和符号化的高精度时间序列表示方法RSPA (Rescaled range Symbolic Piecewise Approximation),该方法将符号化方法和重标极差理论应用到现已有的时间序列表示法中,在保留了时间序列的非线性和分形等重要特征的同时也简化了维度。实验表明,该方法在分类任务和相似性查找等多种数据挖掘任务中均具有较高的效率。 2)时间序列的距离度量方法研究 本文提出了一种基于RSPA表示法的时间序列距离度量公式,并给出了相应的理论证明,证明了用我们所给出的距离度量公式计算两个时间序列间的距离要比原始时间序列间的欧氏距离小,从而证明了该时间序列表示法的可用性;本文还给出了相似性挖掘任务的算法描述,实验表明,该方法在时间序列的相似性挖掘任务中具有较少的存储空间需求和较高的挖掘精度。 3)时间序列数据挖掘系统构架研究 本文在分析市场上存在的证券软件系统的基础上提出了一个时间序列的数据挖掘系统的体系框架结构,该架构的突出优点是模块化,整个数据挖掘模块功能既独立又互相联系;数学模式库以及相似性度量算法模块的使用,增强了该架构的兼容性和可扩充性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分