关键词:
港口自动驾驶
仿真环境构建
大语言模型
强化学习
对抗场景生成
摘要:
与常规驾驶环境相比,港口环境具有车辆作业繁忙、道路定制化以及人机车辆混行等特点。为了解决港口自动驾驶数据缺乏和算法泛化性问题,缩短算法开发周期和降低开发成本,以具身智能设计理念为依托,以提供逼真可控环境、车辆交互过程为目标,提出了DK-Port港口自动驾驶仿真环境的构建与验证方法。首先,基于调查问卷和专家经验,采用零次提示和思路链等技术,使通用大语言模型参与奖励函数的设计过程;然后,基于复杂道路上车辆的行驶数据,构建丰富且逼真的人机混行仿真交互场景,并利用PPO深度强化学习算法训练对抗驾驶员模型,以揭示自动驾驶算法的安全隐患;最后在直道和交叉路口等4种典型场景下进行了对比实验。结果表明DK-Port能够有效生成更符合港口实际特性的多类型对抗驾驶行为,如危险超车、紧急切入、抢占路口交汇点等。在保证关键指标分布合理的前提下,直道场景下的变道次数是基准方法的2.9倍,交叉路口场景下的紧急制动率提升了46.7%。