区间分析法是处理非线性最优最劣法(BWM)存在多解问题的有效方法。本文基于权重区间中心点的大小关系,提出了一种无需计算区间优先度即可获得优先度矩阵的全新便捷算法;然后,在此基础之上,利用“尺度变换”的思想,给出了几类求解权重区间中心点的估计方法,并探讨了这些方法的计算偏差;最后,利用本文所提方法研究了一类电网关键物资的选取问题。本研究简化了已有文献中的区间分析法,规避了求解非线性优化模型的复杂计算过程,推广了非线性BWM的应用范围。Interval analysis is an effective method for dealing with the existence of multiple solutions in nonlinear Best-Worst Methods (BWM). This article proposes a convenient algorithm for obtaining the priority matrix without calculating the interval priority based on the size relationship of the center points of the weight interval. Then, based on this, several methods for estimating the center point of the weight interval were proposed using the idea of “scale transformation”, and the calculation bias of these methods was discussed. Finally, the method proposed in this article was used to study the selection of key materials for a class of power grid enterprises. This study greatly simplifies the interval analysis method in existing literature, and avoids the complex calculation process of solving nonlinear optimization models, and extends the application scope of nonlinear BWM.
数据流分类是数据挖掘中重要的研究内容,但是数据流中的概念漂移和标记成本昂贵的问题给分类带来了巨大的挑战。现有的研究工作大多采用基于主动学习的在线分类技术,一定程度上缓解了概念漂移和有限标签的问题,但是这些方法的分类效率较低,并且忽略了内存开销的问题。针对这些问题提出了一种结合微聚类和主动学习的流分类方法(a data stream classification method combining micro-clustering and active learning,CALC)。提出一种新的主动学习混合查询策略,将其与基于错误的表示学习相结合,从而在维护过程中衡量每个微聚类的重要性,通过动态维护一组微聚类以适应数据流中产生的概念漂移。采用基于微聚类的惰性学习方法,实现对数据流的分类,并完成对缓存微聚类的在线更新。使用三个真实数据集和三个人工合成数据集进行实验,结果显示CALC在分类准确率和内存开销方面优于现有的数据流分类算法。与基准模型(online reliable semi-supervised learning on evolving data streams,ORSL)相比,CALC的分类准确率有一定的提升,在六个数据集上的平均准确率分别提高了5.07、2.41、1.04、1.03、3.47、0.64个百分点。
离线到在线强化学习中,虽然智能体能够通过预先收集的离线数据进行初步策略学习,但在线微调阶段,早期过程常常表现出不稳定性,且微调结束后,性能提升幅度较小.针对这一问题,提出了两种关键设计:1)模拟退火的动态离线-在线缓冲池; 2)模拟退火的行为约束衰减.第1种设计在训练过程中利用模拟退火思想动态选择离线数据或者在线交互经验,获得优化的更新策略,动态平衡在线训练的稳定性和微调性能;第2种设计通过带降温机制的行为克隆约束,改善微调早期使用在线经验更新导致的性能突降,在微调后期逐渐放松约束,促进模型性能提升.实验结果表明,所提出的结合动态缓冲池和时间递减约束的离线到在线强化学习(dynamic replay buffer and time decaying constraints, DRB-TDC)算法在Halfcheetah、Hopper、Walker2d这3个经典MuJoCo测试任务中,在线微调训练后性能分别提升45%、65%、21%,所有任务的平均归一化得分比最优基线算法提升10%.
解决约束超多目标优化问题的关键在于约束处理和均衡收敛性与多样性,搜索空间中的约束阻碍种群寻找Pareto前沿面,容易使种群陷入局部最优,而离散的可行域则使种群的多样性较差。提出组合算子型双阶段搜索策略(two-stagesearch strategy with combined operator,TSCO)。TSCO分两阶段处理约束:一阶段算法仅优化目标函数,种群不受约束制约快速向Pareto前沿面方向接近;二阶段通过目标转换将约束违反度视作一个新目标函数以解决原始约束问题。在搜索过程中使用模拟二进制交叉算子和DE/current-to-pbest/1算子构成的组合算子生成收敛性和多样性优秀的个体。为验证策略有效性,结合TSCO策略的AGE-MOEA(TSCOEA)在C_DTLZ、DC_DTLZ和MW测试集上同4种性能优异的约束超多目标进化算法进行对比。实验表明,在大多数问题上,TSCOEA获得的种群收敛性和多样性更好。
暂无评论