关键词:
矿井通风
深度强化学习
通风阻力系数反演
摘要:
矿井通风阻力系数对矿井通风系统安全管理、诊断和智能化发展至关重要,气流通常作为通风阻力系数反演的基础,但常规的非线性优化方法存在非唯一性的问题,影响了反演的精度。为此,基于深度强化学习(DRL)的新型优化方法来反演阻力系数,反演被视为1个马尔可夫决策过程,通风网络求解模型(VNSM)被嵌入到DRL环境中,采用近端策略优化对代理人的策略进行优化。现场试验表明,计算气流与实测气流的MAE为0.354,MSE为0.287,RMSE为0.536,MRE为0.013。与标准遗传算法、差分进化算法和进化策略算法相比,DRL方法的MRE、MAE、RMSE和MSE值分别降低了23.5%、15.3%、14.1%和26.4%,与其他算法相比,DRL方法对不同巷道的敏感性差异较小。