关键词:
多目标优化
深度强化学习
裁剪分床计划
多色服装
TD3
摘要:
针对大规模、不规则的多色服装裁剪分床计划(Multi-color Cut Order Planning,MCOP)问题,提出了基于深度强化学习和多目标粒子群的复合优化算法.首先,以生产误差和生产成本为优化目标,结合设备数量、铺布层数等约束条件,建立了MCOP多目标优化模型.其次,设计了基于双延迟深度确定性策略梯度(Twin Delayed Deep Deterministic Policy Gradient,TD3)的裁剪分床全局优化求解策略,构建了TD3算法的马尔可夫决策过程,并设计了基于误差和成本的奖励函数求解得到全局解.再者,提出了基于线性解耦的多目标粒子群裁剪分床局部优化算法,设计线性规划解耦策略实现尺码组合矩阵与铺布层数矩阵的快速解耦计算,有效提高求解精度和速度;同时,通过精英档案策略得到MCOP问题的Pareto最优解.最后,通过实际案例和算法对比实验验证了所提方法的可行性和优越性,可为服装企业提供良好的参考价值.