概念漂移是动态流数据挖掘中一类常见的问题,但混杂噪声或训练样本规模过小而产生的伪概念漂移会引起与真实概念漂移相似的结果,即模型在线测试性能的不稳定波动,导致二者容易混淆,发生概念漂移的误报.针对流数据中真伪概念漂移的混淆问题,提出一种基于在线性能测试的概念漂移检测方法(concept drift detection method based on online performance test,简称CDPT).该方法将最新获得的数据集进行均匀分组,在每组子数据集上分别进行在线学习,同时记录每组子数据集训练测试得到的分类精度向量,并计算相邻学习时间单元之间的精度落差,依据测试精度下降阈值得到有效波动位点.然后采用交叉检验的方式整合不同分组中的有效波动位点,以消除流数据在线学习过程中由于训练样本过小导致模型不稳定造成的检测干扰,根据精度波动一致性得到一致波动位点.最后,通过跟踪在线学习分类准确率,得到一致波动位点邻域参照点的测试精度变化,比较一致波动位点邻域参照点对应的模型测试精度下降幅度及收敛情况,以有效检测一致波动位点当中真实的概念漂移位点.实验结果表明,该方法能够有效辨识流数据在线学习过程中发生的真实概念漂移,并能有效避免训练样本过小或者流数据中噪声对检测结果的负面影响,同时提高模型的泛化性能.
为了在移动环境中找到响应时间最短的组合服务,设计了一种可计算的移动模型,根据此模型过滤掉响应时间较长的组合服务,提出了移动组合服务中组件服务的选择方法。通过前馈神经网络建立组合服务与其响应时间之间的回归模型,利用基于神经网络的服务组合(neural network-based service composition,NNSC)算法选择出响应时间最短的组合服务。仿真实验结果表明,与一些启发式算法相比,NNSC算法可以找到响应时间更短的组合服务。
多模态讽刺检测是在多模态场景下识别用户的讽刺言语。现有的多模态讽刺识别方法大多对编码之后的特征直接融合,并未关注图像和文本的深层特征以及图像和文本之间的交互。针对上述问题,本文提出基于图文交互和深层特征融合的多模态讽刺检测框架。首先,使用具有长文本能力的对比语言-图像预训练模型(Contrastive Language-Image Pre-training model with Long text capability,Long-CLIP),对图像和文本进行编码,获得图像和文本的特征表示,进一步引入跨模态注意力机制,建立图像和文本特征之间的交互表示;其次,利用多个卷积神经网络从不同角度分别获得图像和文本的深层特征表示,并利用Key_less Attention机制融合图像和文本的深层特征;最后,通过多层感知机实现多模态讽刺检测。在公开的数据集MMSD2.0上进行实验,实验结果表明所提出的方法与现有的最先进的基线模型相比,Acc和F1分别提升0.33%和0.15%,表明了图文交互及深层特征可以提升多模态讽刺检测的性能。
随着电力系统、交通系统、通信系统等基础设施网络的广泛使用,提高复杂网络的鲁棒性具有重要意义。重连机制是一种高效且简洁的方法,常用于提高网络的鲁棒性。基于0阶零模型的重连机制通过对边的随机删除和创建操作来提高网络的鲁棒性,其尽管保持了网络的边数,但会引起节点的度值发生变化,如基于香农熵的重连算法;基于1阶零模型的重连机制通过随机选择两条边进行换边操作来提高网络的鲁棒性,其尽管保持了网络的度分布,但随机选边难以准确找到合适的节点,增加了算法的时间成本,如基于最大连通分支的重连算法。因此,为了保持网络的度分布且快速提高网络的鲁棒性,提出了一种基于1阶零模型的快速重连算法(Fast Rewiring Mechanism based on 1-order Null Model,FRM)。FRM算法通过比较每条边的两个端点度值的差异为边加权,根据边的权重优先选择权重较大的两条边,并创建度值相似节点之间的连边来提高网络的鲁棒性。在3个真实网络数据上与4种代表性重连算法相比,对比实验结果表明,FRM算法在度中心性、介数中心性和Page-Rank中心性攻击下最大连通分支中的节点比例s(Q)、基于最大连通分支的鲁棒性指标R和基于香农熵的鲁棒性指标I(G)的表现都更好。
暂无评论