解决约束超多目标优化问题的关键在于约束处理和均衡收敛性与多样性,搜索空间中的约束阻碍种群寻找Pareto前沿面,容易使种群陷入局部最优,而离散的可行域则使种群的多样性较差。提出组合算子型双阶段搜索策略(two-stagesearch strategy with combined operator,TSCO)。TSCO分两阶段处理约束:一阶段算法仅优化目标函数,种群不受约束制约快速向Pareto前沿面方向接近;二阶段通过目标转换将约束违反度视作一个新目标函数以解决原始约束问题。在搜索过程中使用模拟二进制交叉算子和DE/current-to-pbest/1算子构成的组合算子生成收敛性和多样性优秀的个体。为验证策略有效性,结合TSCO策略的AGE-MOEA(TSCOEA)在C_DTLZ、DC_DTLZ和MW测试集上同4种性能优异的约束超多目标进化算法进行对比。实验表明,在大多数问题上,TSCOEA获得的种群收敛性和多样性更好。
基于角色协同(Role-Based Collaboration,RBC)的软件工程与协同计算方法以角色为基础进行研究,能有效促进信息系统的抽象与分类,有利于单元协作与协同计算.为支撑RBC及其角色引擎,本文从元理论角度出发,运用子结构逻辑对RBC的关键元素:群组、角色和代理进行了考量与印证,并提出了系列多项式时间复杂度的角色扮演逻辑系统(Role Playing Logic,RPL)及相关代数模型.通过逻辑强刻画与形式化方法对RBC系统基本关联性和层次结构的剖析,系列角色扮演逻辑可因不同的设计需求做扩充与变化,以支撑RBC做各类工程应用与研发.
多臂赌博机问题是强化学习中研究探索和利用两者平衡的经典问题,其中,随机多臂赌博机问题是最经典的一类多臂赌博机问题,是众多新型多臂赌博机问题的基础.针对现有多臂赌博机算法未能充分使用环境反馈信息以及泛化能力较弱的问题,提出一种自适应的多臂赌博机算法.该算法利用当前估计值最小的动作被选择的次数来调整探索和利用的概率(chosen number of arm with minimal estimation, CNAME),有效缓解了探索和利用不平衡的问题.同时,该算法不依赖于上下文信息,在不同场景的多臂赌博机问题中有更好的泛化能力.通过理论分析给出了该算法的悔值(regret)上界,并通过不同场景的实验结果表明:CNAME算法可以高效地获得较高的奖赏和较低的悔值,并且具有更好的泛化能力.
暂无评论