版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
作者机构:重庆邮电大学通信与信息工程学院重庆400065 先进网络与智能互联技术重庆市高校重点实验室重庆400065 泛在感知与互联重庆市重点实验室重庆400065
出 版 物:《通信学报》 (Journal on Communications)
年 卷 期:2023年第44卷第9期
页 面:104-114页
核心收录:
学科分类:080904[工学-电磁场与微波技术] 0810[工学-信息与通信工程] 0809[工学-电子科学与技术(可授工学、理学学位)] 08[工学] 080402[工学-测试计量技术及仪器] 0804[工学-仪器科学与技术] 081001[工学-通信与信息系统]
基 金:国家自然科学基金资助项目(No.61901075) 重庆市教委科学技术基金资助项目(No.KJZDK202200604)
主 题:正交频分复用 深度强化学习 马尔可夫决策过程 多径信道
摘 要:针对正交频分复用系统,提出了一种基于深度强化学习的自适应导频设计算法。将导频设计问题映射为马尔可夫决策过程,导频位置的索引定义为动作,用基于减少均方误差的策略定义奖励函数,使用深度强化学习来更新导频位置。根据信道条件自适应地动态分配导频,从而利用信道特性对抗信道衰落。仿真结果表明,所提算法在3GPP的3种典型多径信道下相较于传统导频均匀分配方案信道估计性能有显著的提升。