版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:西北工业大学航天学院陕西省空天飞行器设计重点实验室陕西西安710072 北京宇航系统工程研究所北京100076
出 版 物:《系统工程与电子技术》 (Systems Engineering and Electronics)
年 卷 期:2025年第47卷第1期
页 面:268-279页
核心收录:
学科分类:08[工学] 0825[工学-航空宇航科学与技术]
基 金:国家自然科学基金(11602296) 陕西省自然科学基础研究计划(2019JM-434) 智控实验室开放基金(2023-ZKSYS-KF04-02)资助课题
主 题:再入滑翔制导 强化学习 深度确定性策略梯度 长短期记忆网络
摘 要:针对现有基于深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法的再入制导方法计算精度较差,对强扰动条件适应性不足等问题,在DDPG算法训练框架的基础上,提出一种基于长短期记忆-DDPG(long short term memory-DDPG,LSTM-DDPG)的再入制导方法。该方法采用纵、侧向制导解耦设计思想,在纵向制导方面,首先针对再入制导问题构建强化学习所需的状态、动作空间;其次,确定决策点和制导周期内的指令计算策略,并设计考虑综合性能的奖励函数;然后,引入LSTM网络构建强化学习训练网络,进而通过在线更新策略提升算法的多任务适用性;侧向制导则采用基于横程误差的动态倾侧反转方法,获得倾侧角符号。以美国超音速通用飞行器(common aero vehicle-hypersonic,CAV-H)再入滑翔为例进行仿真,结果表明:与传统数值预测-校正方法相比,所提制导方法具有相当的终端精度和更高的计算效率优势;与现有基于DDPG算法的再入制导方法相比,所提制导方法具有相当的计算效率以及更高的终端精度和鲁棒性。