咨询与建议

看过本文的还看了

相关文献

该作者的其他文献

文献详情 >基于LSTM-DDPG的再入制导方法 收藏

基于LSTM-DDPG的再入制导方法

Reentry guidance method based on LSTM-DDPG

作     者:闫循良 王宽 张子剑 王培臣 YAN Xunliang;WANG Kuan;ZHANG Zijian;WANG Peichen

作者机构:西北工业大学航天学院陕西省空天飞行器设计重点实验室陕西西安710072 北京宇航系统工程研究所北京100076 

出 版 物:《系统工程与电子技术》 (Systems Engineering and Electronics)

年 卷 期:2025年第47卷第1期

页      面:268-279页

核心收录:

学科分类:08[工学] 0825[工学-航空宇航科学与技术] 

基  金:国家自然科学基金(11602296) 陕西省自然科学基础研究计划(2019JM-434) 智控实验室开放基金(2023-ZKSYS-KF04-02)资助课题 

主  题:再入滑翔制导 强化学习 深度确定性策略梯度 长短期记忆网络 

摘      要:针对现有基于深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法的再入制导方法计算精度较差,对强扰动条件适应性不足等问题,在DDPG算法训练框架的基础上,提出一种基于长短期记忆-DDPG(long short term memory-DDPG,LSTM-DDPG)的再入制导方法。该方法采用纵、侧向制导解耦设计思想,在纵向制导方面,首先针对再入制导问题构建强化学习所需的状态、动作空间;其次,确定决策点和制导周期内的指令计算策略,并设计考虑综合性能的奖励函数;然后,引入LSTM网络构建强化学习训练网络,进而通过在线更新策略提升算法的多任务适用性;侧向制导则采用基于横程误差的动态倾侧反转方法,获得倾侧角符号。以美国超音速通用飞行器(common aero vehicle-hypersonic,CAV-H)再入滑翔为例进行仿真,结果表明:与传统数值预测-校正方法相比,所提制导方法具有相当的终端精度和更高的计算效率优势;与现有基于DDPG算法的再入制导方法相比,所提制导方法具有相当的计算效率以及更高的终端精度和鲁棒性。

读者评论 与其他读者分享你的观点

用户名:未登录
我的评分