概念漂移处理大多采用集成学习策略,然而这些方法多数不能及时提取漂移发生后新分布数据的关键信息,导致模型性能较差。针对这个问题,本文提出一种基于串行交叉混合集成的概念漂移检测及收敛方法(Concept drift detection and convergen...
详细信息
概念漂移处理大多采用集成学习策略,然而这些方法多数不能及时提取漂移发生后新分布数据的关键信息,导致模型性能较差。针对这个问题,本文提出一种基于串行交叉混合集成的概念漂移检测及收敛方法(Concept drift detection and convergence method based on hybrid ensemble of serial and cross,SC_ensemble)。在流数据处于平稳状态下,该方法通过构建串行基分类器进行集成,以提取代表数据整体分布的有效信息。概念漂移发生后,在漂移节点附近构建并行的交叉基分类器进行集成,提取代表最新分布数据的局部有效信息。通过串行基分类器和交叉基分类器的混合集成,该方法兼顾了流数据包含的整体分布信息,又强化了概念漂移发生时的重要局部信息,使集成模型中包含了较多“好而不同”的基学习器,实现了漂移发生后学习模型的高效融合。实验结果表明,该方法可使在线学习模型在漂移发生后快速收敛,提高了模型的泛化性能。
边缘服务器放置问题是边缘计算环境建设的基础,高效的边缘服务器放置策略要求不仅为用户提供低延迟服务,而且要平衡边缘服务器之间的负载,同时降低边缘服务器的部署成本。现有的方法常面临着时间复杂度太高、只能得到局部最优解等问题,不适应大中城市的边缘服务器部署。提出了一种两阶段边缘服务器放置TSESP(two-stage edge server placement)策略,第一阶段针对小规模基站网络建立边缘服务器放置优化模型,以降低服务延迟、平衡负载和降低成本,并且在几个小型区域内对优化模型进行精确求解。第二阶段提出了基于机器学习的边缘服务器放置模型ESPML(edge server placement based on machine learning),利用第一阶段优化模型得到的最优解集进行训练,然后在大规模基站网络中进行测试,ESPML模型的时间复杂度远小于指数级时间复杂度同时可以得到与最优解相似的结果。最后在上海电信基站数据集上的实验表明,与现有三种典型的边缘服务器放置方法相比,所提出的方法在访问延迟、负载平衡和成本等方面都具有良好的性能。
暂无评论