关键词:
横纵向耦合跟车
多智能体深度强化学习
混合动力车队
协同能量管理
摘要:
为了探索多智能体深度强化学习算法在混合动力汽车多目标协同控制中的应用,提出了一种基于多智能体深度确定性策略梯度算法的混合动力车队协同能量管理策略。首先,利用交通仿真软件搭建横纵向耦合跟车场景,以模拟车联网环境实现对车辆信息的准确获取。其次,设计了包含横向变道及纵向跟车的基于规则及网格搜索的横纵向耦合跟车策略,以实现更高的通行效率。最后,利用多智能体深度确定性策略梯度算法设计混合动力车队自适应协同能量管理策略,实现车队整体效益最大化,并通过随机车流初始位置获取随机车队需求功率序列,从而增加策略训练的随机性,提高策略对不同工况的适应性。结果表明,多智能体的车队协同能量管理策略与单智能体相比拥有更好的整体优化效果,并且经随机工况训练后,其工况适应性得到了一定的提升。