针对滚动轴承故障诊断中样本分布不均衡引起的模型泛化能力差、诊断精度低的问题,从两个方面展开研究:(1)故障样本增广,提出结合变分自编码器(VAE)和生成对抗网络(GAN)的VAE-GAN样本增广模型;(2)改进分类算法,提出基于焦点损失(FL)和卷积神经网络(CNN)的FLCNN(focal loss and convolutional neural network)样本分类模型。在此基础上,将VAE-GAN和FLCNN融合,构建VAE-GAN+FLCNN轴承故障诊断模型。首先,将样本量少的故障类输入VAE-GAN模型,通过交替训练编码网络、生成网络和判别网络,学习出真实故障样本的数据分布,从而实现故障样本的增广;然后用增广后的数据样本训练FLCNN分类模型,完成轴承故障识别。试验对比结果表明,所提方法能够有效提升样本不均衡条件下的轴承故障诊断效果,拥有更高的Recall值和F1-score值。
具有自进化能力的自动驾驶换道策略有望在复杂开放的交通环境中提升性能,以应对更多的未知场景。时序差分学习模型预测控制(Temporal difference learning for model predictive control,TD-MPC)结合有模型和无模型强化学习方法的优势,...
详细信息
具有自进化能力的自动驾驶换道策略有望在复杂开放的交通环境中提升性能,以应对更多的未知场景。时序差分学习模型预测控制(Temporal difference learning for model predictive control,TD-MPC)结合有模型和无模型强化学习方法的优势,具有学习效率高、性能优异的特点。基于此,为了提高自动驾驶换道策略的整体性能,提出基于TD-MPC的自动驾驶一体化换道策略。具体来说,针对自动换道问题,提出基于驾驶倾向网络的一体化自动驾驶换道策略架构,构建强化学习问题并设计完备的奖励函数,对决策规划优化问题进行统一求解。应用TD-MPC算法设计内部模型来预测未来状态和奖励,实现短时域内的局部轨迹优化,同时使用时序差分学习实现对长期汇报的估计,以得到驾驶倾向网络参数。所提出方法在高保真仿真环境中被验证,结果表明,所提出方法相比规则方案保证行驶效率,并且提高安全性和舒适性。同时与软演员-评论家算法(Soft actor critic,SAC)相比,实现了7~9倍的学习效率提升。
暂无评论