关键词:
分层强化学习
三维装箱
图注意力网络
启发式空间拓展
深度强化学习
摘要:
在过去的一些研究中,人工智能如何以一种分层的方式在多个抽象级别和多个时间尺度上表示感知和行动规划逐渐成为一个研究热点。受限于技术手段,多数工作都局限在人工分解任务阶段,如在三维装箱问题(3D-BPP)中,通过启发式规则指导神经网络解析打包点帮助智能体分解状态空间,将原本庞大、复杂的空间转换为一个个子空间,为神经网络提供更好的备选解决方案。然而这种方式受限于规则本身,若规则不能完美地拆解问题,则这种固定规则的辅助会限制神经网络的性能,使得更好的解决方案被规则本身忽略。针对这种情况,提出一种基于启发式规则融合策略的改进装箱配置树(PCT)模型,通过分层强化学习的思想将问题分层,引入图注意力分类模型来判断在当前情况下最优的空间点拓展方案,由此为拆解箱体内部空间点与探寻可行性位置提供更多的排列组合方式。实验结果表明,基于启发式规则融合策略的改进模型在多个数据集上表现优于原始模型,在包含额外密度信息的数据集中平均装箱利用率高达77.2%,较原始模型提升1.7百分点,能够在合理的时间内给出性能更优的解决方案。