文献详情 >基于深度强化学习的交通信号控制收藏

基于深度强化学习的交通信号控制

Traffic signal control based on deep reinforcement learning

作者：乔志敏柯良军 QIAO Zhi-min;KE Liang-jun

作者机构：太原工业学院自动化系山西太原030008 西安交通大学自动化科学与工程学院机械制造系统工程国家重点实验室陕西西安710049

出版物：《控制理论与应用》 (Control Theory & Applications)

年卷期：2025年第42卷第1期

页面：76-86页

核心收录：

学科分类：12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 081104[工学-模式识别与智能系统] 08[工学] 0838[工学-公安技术] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0812[工学-计算机科学与技术（可授工学、理学学位）]

基　　金：山西省教育厅高等学校科技创新项目(2022L523) 国家自然科学基金项目(61973244,72001214) 山西省基础研究计划资助项目(202303021222300) 第五届太原工业学院学科带头人资助项目资助

主　　题：交通信号强化学习动态权重延迟时间

摘要：当前广泛应用的基于车流动力学建模的交通信号优化模型精确度较高,但迁移能力稍弱,针对该问题,本文提出了一种基于深度强化学习的单智能体交通信号控制方法.该方法首次在考虑交叉口有行人穿越干扰的情况下定义了动作空间,从3个不同的角度定义了3种奖励函数,并提出了一种累积延迟近似方法.在算法方面,提出了一种基于动态权重的SoftActor-Critic算法,该算法可以动态调整Actor网络和Critic网络的更新幅度,显著地提高了传统SoftActor-Critic算法的收敛效率和收敛性能.仿真结果表明,本文提出的模型和算法在降低车辆延迟时间、减少车辆停车次数以及减少车辆队列长度等交通性能指标方面是有效的.

本地馆藏 | 借阅须知 | 我要预约

已订购，未入库

sda

目录详情 | 试阅读 |

读者评论与其他读者分享你的观点

学校读者

用户名:未登录

我的评分

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

基于深度强化学习的交通信号控制

读者评论与其他读者分享你的观点

请选择收藏分类：

建议与咨询 留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

时间限定

文献类型

馆藏选择

核心期刊

语言

文献类型

帮助

文字说明：

检索规则说明：

检索范例：

分类表

所选分类

看过本文的还看了

相关文献

该作者的其他文献

CADAL相关文献

基于深度强化学习的交通信号控制

读者评论 与其他读者分享你的观点

请选择收藏分类： 新增自定义分类 确定 取消

建议与咨询留下您的常用邮箱和电话号码，以便我们向您反馈解决方案和替代方法

读者评论与其他读者分享你的观点

请选择收藏分类：