本文针对MIMO场景下增强型移动宽带(Enhanced Mobile Broadband,eMBB)、超可靠低时延通信(Ultra-Reliable Low-Latency Communications,URLLC)和大规模机器类通信(Massive Machine Type Communications,mMTC)三类业务共存时的...
详细信息
本文针对MIMO场景下增强型移动宽带(Enhanced Mobile Broadband,eMBB)、超可靠低时延通信(Ultra-Reliable Low-Latency Communications,URLLC)和大规模机器类通信(Massive Machine Type Communications,mMTC)三类业务共存时的无线资源分配问题,提出将波束的正交空间方向视为带宽资源,并构建了混合整数非线性规划(Mixed-integer Nonlinear Programming,MINLP)资源分配模型。该模型利用现有eMBB业务的空间波束,在不降低eMBB业务性能的情况下为额外的URLLC/mMTC用户提供服务。为解决MINLP问题的非凸性挑战,本文分别从传统数学优化角度采用big-M方法和连续凸逼近(Successive Convex Approximation,SCA)方法,以及从深度强化学习(Deep Reinforcement Learning,DRL)角度引入近端策略优化(Proximal Policy Optimization,PPO)算法进行求解。仿真实验结果表明,基于PPO的叠加方法和基于SCA的叠加方法在多项关键性能指标上均显著优于基线算法,且DRL算法在保持较低复杂度的同时,其性能已接近SCA,进一步证明了DRL在未来有可能取代传统数学算法,成为解决复杂资源分配问题的有力工具。
暂无评论