关键词:
组播路由
强化学习
多目标优化
能耗
延迟
摘要:
当前网络中存在过度供应、冗余和拥塞等问题,导致能耗过高和用户满意度下降。联合优化能耗和延迟的组播路由问题是一个NP完全问题。在软件定义网络(SDN)架构下,提出一种基于多步Q-Learning的多目标组播路由算法,以解决延迟和能耗的组播路由问题。该算法旨在降低网络能耗和延迟,同时满足网络性能和服务质量(QoS)的要求。基于多步Q-Learning,准确估计每条路径的长期奖励,通过在每个步骤中更新Q值,为节点选择最优的动作,并最终找到最佳路径。通过将多个时间步的奖励和价值函数相结合,更快地收敛到最优策略。此外,在设置奖励值时,为每一个目标赋予不同的权重,用来平衡目标所占的比重。仿真结果表明,与现有的代表性算法相比,该算法能够有效降低网络能耗和延迟,提高网络性能。