版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:国防科技大学系统工程学院长沙410073 多能源系统智慧互联技术湖南省重点实验室长沙410073
出 版 物:《自动化学报》 (Acta Automatica Sinica)
年 卷 期:2021年第47卷第11期
页 面:2521-2537页
核心收录:
学科分类:12[管理学] 1201[管理学-管理科学与工程(可授管理学、工学学位)] 07[理学] 081104[工学-模式识别与智能系统] 08[工学] 070105[理学-运筹学与控制论] 0835[工学-软件工程] 0811[工学-控制科学与工程] 0701[理学-数学] 0812[工学-计算机科学与技术(可授工学、理学学位)]
基 金:国家自然科学基金面上项目(61773390) 湖湘青年英才计划(2018RS3081) 科技委国防创新特区项目(193-A11-101-03-01) 国防科技大学自主科研计划(ZZKY-ZX-11-04)资助
主 题:深度强化学习 组合优化问题 深度神经网络 图神经网络 指针网络
摘 要:组合优化问题广泛存在于国防、交通、工业、生活等各个领域,几十年来,传统运筹优化方法是解决组合优化问题的主要手段,但随着实际应用中问题规模的不断扩大、求解实时性的要求越来越高,传统运筹优化算法面临着很大的计算压力,很难实现组合优化问题的在线求解.近年来随着深度学习技术的迅猛发展,深度强化学习在围棋、机器人等领域的瞩目成果显示了其强大的学习能力与序贯决策能力.鉴于此,近年来涌现出了多个利用深度强化学习方法解决组合优化问题的新方法,具有求解速度快、模型泛化能力强的优势,为组合优化问题的求解提供了一种全新的思路.因此本文总结回顾近些年利用深度强化学习方法解决组合优化问题的相关理论方法与应用研究,对其基本原理、相关方法、应用研究进行总结和综述,并指出未来该方向亟待解决的若干问题.