关键词:
控制方向未知
最优输出调节
强化学习
有限时间
摘要:
针对一类由线性中性稳定的外系统驱动的带有未知非线性函数和外界扰动的控制方向未知非线性系统,研究基于强化学习的有限时间最优输出调节问题.首先,根据调节器方程可解条件和坐标变换,将控制方向未知非线性系统的输出调节问题转化为控制增益已知的增广系统的镇定问题.接着利用径向基神经网络去逼近未知非线性函数,设计具有内模的高增益神经网络自适应观测器去估计不可测的状态,引入Nussbaum函数来解决控制方向未知问题.然后,设计基于神经网络观测器和Nussbaum函数的新的自适应内模,提出与内模相关的代价函数,并且在反步法中运用基于强化学习中的执行—评价网络的近似最优算法,保证了虚拟控制器为最优,同时结合动态面技术避免反步法中的“复杂度爆炸”问题.最后,通过所设计的最优自适应有限时间输出反馈控制器,不仅使得提出的价值函数达到最优,而且还确保闭环系统的信号半全局实际有限时间稳定,且跟踪误差在期望的任意精度内.数值仿真验证所提方法的有效性.