关键词:
制动能量回收
电动汽车
制动策略
深度强化学习
策略梯度
经验回放
摘要:
双电机驱动电动汽车能够实现前后独立转矩分配,进而可以获得更高的能量回收效率.本文针对双电机驱动电动汽车,提出一种基于双延迟深度确定性策略梯度算法(Twin Delayed Deep Deterministic policy gradient algorithm, TD3)进行改进优化的制动能量回收策略.该策略能在保障制动安全性和舒适性的同时,实现制动能量回收的最大化.首先,构建了基于深度强化学习(Deep Reinforcement Learning, DRL)的能量回收决策框架,并设计了一个综合考虑能量回收效果、安全性和舒适性的奖励函数.然后,采用TD3算法求解该决策过程,并提出了改进的优先经验回放机制,以加速策略的收敛速度.最后,本文引入了平衡探索的噪声策略,增强算法探索与利用的能力.通过Matlab/Simulink平台验证,所提出的算法在满足制动安全性和舒适性的前提下,能够更高效地分配制动力,有效地提高了制动能量回收效率.