版权所有:内蒙古大学图书馆 技术提供:维普资讯• 智图
内蒙古自治区呼和浩特市赛罕区大学西街235号 邮编: 010021
专利申请号:CN202211305262.X
公 开 号:CN115630285A
代 理 人:周局
代理机构:南京禹为知识产权代理事务所(特殊普通合伙)
专利类型:发明专利
申 请 日:20230120
公 开 日:20221024
专利主分类号:G06F18/213
关 键 词:迭代 学习算法 知识融合 消歧 算法 动态控制模型 特征子空间 分布参数 函数建立 均值差异 算法计算 算法思想 配套的 求解 方差 高斯 消岐 伽玛 收敛 学习 更新 全局 应用
摘 要:本发明公开了一套知识融合消歧算法以及配套的策略迭代方法,包括建立特征子空间表示和标记全局消岐策略的偏标记学习算法,基于偏标记学习算法对动作值函数建立学习模型,利用方差阈值动态控制模型学习次数,通过高斯伽玛分布均值差异变化进行分布参数更新实现策略迭代,利用Myopic‑VPI求解最优动作。将知识融合消歧算法思想应用于策略迭代方法中,降低算法计算量,提高算法的收敛速度。