近年来,数据流作为一种特殊的数据形态,广泛出现于金融、互联网、科学研究等各个领域,引起了数据挖掘界极大的兴趣。其数据量无穷,数据概念随时间变化,对问题要求快速响应等特点给研究工作带来了极大的挑战。该文聚焦于数据流分类问题,提出了一种基于演变的规则知识库的数据流分类模型:SCBA(streamclass ification based on assoc iation ru les)。该模型随着数据流的到达,从动态维护的规则知识库中挑选适应当前数据概念的规则,构建单个分类器。与目前流行的数据流分类模型相比,SCBA具有如下特点:与层次结构的决策树相比,分类器的更新更为灵活并易于实现;与倾向“平均”的组合分类器相比,单个的分类器有利于规避“小模式问题”,并能加快对数据流概念变化的调整速度和对应用的响应速度。
多元自相关过程不满足现行多元质量控制理论的前提假设。该文探讨了两个随机变量相互独立,其中一个随机变量的观测值相互独立、另一随机变量服从一阶自回归模型的二元自相关过程。在参数已知的条件下,提出了二元自相关过程的残差T2控制图。通过M on te C arlo模拟,得到了一族该二元自相关过程在不同偏移量下的平均链长。分析结果表明残差T2控制图的适用范围由自相关的强弱和偏移量的大小决定,可以有效监控大部分该类二元自相关过程。
为了满足传统的统计过程控制理论中统计量彼此独立的基本假设,研究了多元自相关过程的残差T2控制图的控制方法及其控制性能。针对一般多元自相关过程,在参数已知的条件下,讨论了多元自相关过程的残差T2控制图,给出多元自相关过程偏移量的定义。通过M on te C arlo模拟,得出该控制图在不同偏移量时的平均链长,在残差T2控制图的适用范围内给出平均链长与偏移量之间的经验公式。结果表明,残差T2控制图可以有效控制出现大偏移的多元自相关过程。
暂无评论