版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:太原工业学院自动化系山西太原030008 西安交通大学自动化科学与工程学院机械制造系统工程国家重点实验室陕西西安710049
出 版 物:《控制理论与应用》 (Control Theory & Applications)
年 卷 期:2025年第42卷第1期
页 面:76-86页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0838[工学-公安技术] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:山西省教育厅高等学校科技创新项目(2022L523) 国家自然科学基金项目(61973244,72001214) 山西省基础研究计划资助项目(202303021222300) 第五届太原工业学院学科带头人资助项目资助
摘 要:当前广泛应用的基于车流动力学建模的交通信号优化模型精确度较高,但迁移能力稍弱,针对该问题,本文提出了一种基于深度强化学习的单智能体交通信号控制方法.该方法首次在考虑交叉口有行人穿越干扰的情况下定义了动作空间,从3个不同的角度定义了3种奖励函数,并提出了一种累积延迟近似方法.在算法方面,提出了一种基于动态权重的SoftActor-Critic算法,该算法可以动态调整Actor网络和Critic网络的更新幅度,显著地提高了传统SoftActor-Critic算法的收敛效率和收敛性能.仿真结果表明,本文提出的模型和算法在降低车辆延迟时间、减少车辆停车次数以及减少车辆队列长度等交通性能指标方面是有效的.