部分有序数据是同时包含有序特征与无序特征的一类数据,其广泛存在于现实生活中。传统的有序分类方法或者将所有特征都视为有序特征,或者对有序与无序特征分别进行处理,忽略了二者之间的关系,这些方法难以有效解决部分有序数据上的分类问题。针对该问题,提出一种基于特征融合的部分有序深度森林模型,称为FFDF(feature fusion-based deep forest)。利用典型相关分析的思想,设计特征融合的贡献度计算方法,将有序特征和无序特征融合到同一特征空间,统一度量二者之间的关系。对融合的特征空间进行数据粒化,降低模型处理连续变量时的复杂性。设计融合空间下的特征矩阵输入级联森林,构建部分有序的深度森林模型。在来自UCI和WEKA的13个公共数据集上与部分单调决策树、有序分类模型、深度森林模型等六种方法进行比较实验,结果表明所提方法在准确性和平均绝对误差方面均优于对比方法;与集成模型深度森林gcForest和DF21进行了时间性能上的对比实验,结果表明所提方法在时间性能上优于对比方法。
针对流数据中概念漂移发生后,在线学习模型不能对分布变化后的数据做出及时响应且难以提取数据分布的最新信息,导致学习模型收敛较慢的问题,提出一种基于在线集成的概念漂移自适应分类方法(adaptive classification method for concept ...
详细信息
针对流数据中概念漂移发生后,在线学习模型不能对分布变化后的数据做出及时响应且难以提取数据分布的最新信息,导致学习模型收敛较慢的问题,提出一种基于在线集成的概念漂移自适应分类方法(adaptive classification method for concept drift based on online ensemble,AC_OE).一方面,该方法利用在线集成策略构建在线集成学习器,对数据块中的训练样本进行局部预测以动态调整学习器权重,有助于深入提取漂移位点附近流数据的演化信息,对数据分布变化进行精准响应,提升在线学习模型对概念漂移发生后新数据分布的适应能力,提高学习模型的实时泛化性能;另一方面,利用增量学习策略构建增量学习器,并随新样本的进入进行增量式的训练更新,提取流数据的全局分布信息,使模型在平稳的流数据状态下保持较好的鲁棒性.实验结果表明,该方法能够对概念漂移做出及时响应并加速在线学习模型的收敛速度,同时有效提高学习器的整体泛化性能.
暂无评论