咨询与建议

限定检索结果

文献类型

  • 5 篇 期刊文献
  • 4 篇 学位论文

馆藏范围

  • 9 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 8 篇 管理学
    • 8 篇 管理科学与工程(可...
  • 7 篇 理学
    • 7 篇 数学
    • 1 篇 系统科学
  • 3 篇 工学
    • 3 篇 控制科学与工程
    • 2 篇 计算机科学与技术...
    • 2 篇 软件工程
    • 1 篇 网络空间安全

主题

  • 9 篇 bandit反馈
  • 5 篇 分布式优化
  • 4 篇 多智能体系统
  • 2 篇 量化
  • 2 篇 镜面下降算法
  • 2 篇 对偶平均算法
  • 2 篇 复合优化
  • 2 篇 regret界
  • 1 篇 在线分布式优化
  • 1 篇 在线学习
  • 1 篇 多智能网络
  • 1 篇 差分隐私
  • 1 篇 反馈延迟
  • 1 篇 在线优化
  • 1 篇 在线凸优化
  • 1 篇 优化
  • 1 篇 分布式在线凸优化
  • 1 篇 在线鞍点问题
  • 1 篇 动态鞍点遗憾
  • 1 篇 事件触发

机构

  • 3 篇 重庆师范大学
  • 2 篇 华南理工大学
  • 2 篇 南京理工大学
  • 1 篇 南京信息工程大学
  • 1 篇 同济大学
  • 1 篇 重庆两江新区博雅...
  • 1 篇 自主智能无人系统...
  • 1 篇 麻省理工学院
  • 1 篇 南洋理工大学

作者

  • 3 篇 朱小梅
  • 2 篇 谢俊如
  • 2 篇 zhu xiaomei
  • 1 篇 洪奕光
  • 1 篇 张文韬
  • 1 篇 李修贤
  • 1 篇 李觉友
  • 1 篇 侯瑞捷
  • 1 篇 xie jun-ru
  • 1 篇 杨志强
  • 1 篇 谢奕彬
  • 1 篇 谢立华
  • 1 篇 gao wen-hua
  • 1 篇 王聪
  • 1 篇 易新蕾
  • 1 篇 徐胜元
  • 1 篇 li jueyou
  • 1 篇 袁德明
  • 1 篇 高文华
  • 1 篇 xie yi-bin

语言

  • 9 篇 中文
检索条件"主题词=Bandit反馈"
9 条 记 录,以下是1-10 订阅
排序:
分布式在线鞍点问题的bandit反馈优化算法
收藏 引用
自动化学报 2025年 第4期51卷 857-874页
作者: 张文韬 张保勇 袁德明 徐胜元 南京理工大学自动化学院
本文研究了多智能体时变网络上基于bandit反馈的分布式在线鞍点问题,其中每个智能体通过本地计算和局部信息交流去协作最小化全局损失函数.在bandit反馈下,包括梯度在内的损失函数信息是不可用的,每个智能体仅能获得和使用在某决策或其... 详细信息
来源: 评论
基于bandit反馈的自适应量化分布式在线镜像下降算法
收藏 引用
控制理论与应用 2023年 第10期40卷 1774-1782页
作者: 谢俊如 高文华 谢奕彬 华南理工大学数学学院 广东广州510640
多智能体系统的在线分布式优化常用于处理动态环境下的优化问题,节点间需要实时传输数据流.在很多情况下,各节点无法获取个体目标函数的全部信息(包括梯度信息),并且节点间信息传输存在一定的通信约束.考虑到非欧投影意义下的镜像下降... 详细信息
来源: 评论
基于bandit反馈的在线分布式镜面下降算法
收藏 引用
西南大学学报(自然科学版) 2022年 第1期44卷 99-107页
作者: 朱小梅 李觉友 重庆师范大学数学科学学院 重庆401331 重庆两江新区博雅小学校 重庆401121
针对在线分布式优化中一类损失函数梯度信息获取困难的问题,提出一种基于bandit反馈的在线分布式镜面下降(ODMD-B)算法.首先,推广在线分布式镜面梯度下降(ODMD)算法到免梯度的情形,提出了一种新的仅利用函数值信息来对梯度进行估计的方... 详细信息
来源: 评论
基于bandit反馈的多智能体系统在线分布式优化问题研究
基于Bandit反馈的多智能体系统在线分布式优化问题研究
收藏 引用
作者: 王聪 南京理工大学
学位级别:博士
近年来,随着由多个智能体组成的大型系统在现实中越来越常见,与多智能体系统相关的问题在实际中得到了广泛的运用,例如传感器网络、机器学习和博弈论等。其中,在线分布式优化是与多智能体系统相关的一个重要问题。利用分布式策略处理在... 详细信息
来源: 评论
基于bandit反馈的分布式在线算法研究
基于Bandit反馈的分布式在线算法研究
收藏 引用
作者: 朱小梅 重庆师范大学
学位级别:硕士
近年来,随着数据规模的增大及其高速流式产生方式的普及,分布式优化算法在理论和应用上都取得了很大的发展。许多基于此框架的算法被设计出来并在实践中成功应用。随着数据规模的爆炸式增长,集中式优化算法因受限于单机的计算瓶颈而难... 详细信息
来源: 评论
基于bandit反馈和镜像下降算法的分布式在线优化研究
基于Bandit反馈和镜像下降算法的分布式在线优化研究
收藏 引用
作者: 谢俊如 华南理工大学
学位级别:硕士
基于多智能体系统的分布式优化可以有效地解决资源配置、多目标追踪等大规模优化问题.“去中心化”的设定能提高传递信息的效率并增强网络的鲁棒性.很多实际优化问题通常面临动态环境,因此,近几年分布式在线优化成为一个热门的研究方向... 详细信息
来源: 评论
基于bandit反馈的分布式在线对偶平均算法
收藏 引用
四川轻化工大学学报(自然科学版) 2020年 第3期33卷 87-93页
作者: 朱小梅 重庆师范大学数学科学学院 重庆401331
为解决梯度信息难以获取的分布式在线优化问题,提出了一种基于bandit反馈的分布式在线对偶平均(DODA-B)算法。首先,该算法对原始梯度信息反馈进行了改进,提出了一种新的梯度估计,即bandit反馈,利用函数值信息去近似原损失函数的梯度信息... 详细信息
来源: 评论
具有反馈延迟分布式在线复合优化的动态遗憾性能
收藏 引用
自动化学报 2025年 第4期51卷 835-856页
作者: 侯瑞捷 李修贤 易新蕾 洪奕光 谢立华 同济大学电子与信息工程学院控制科学与工程系 自主智能无人系统全国重点实验室 教育部自主智能无人系统前沿科学中心上海自主智能无人系统科学中心上海智能科学与技术中心同济大学 麻省理工学院信息与决策系统实验室 南洋理工大学电气与电子工程学院
研究分布式在线复合优化场景中的几种反馈延迟,包括梯度反馈、单点bandit反馈和两点bandit反馈.其中,每个智能体的局部目标函数由一个强凸光滑函数与一个凸的非光滑正则项组成.在分布式场景下,研究每个智能体具有不同时变延迟的场景.基... 详细信息
来源: 评论
基于差分隐私机制的分布式优化算法研究
基于差分隐私机制的分布式优化算法研究
收藏 引用
作者: 杨志强 南京信息工程大学
学位级别:硕士
近年来,随着计算机技术和通信技术的发展,多智能体系统已经广泛应用于微电网控制、医疗预测等领域。分布式优化问题作为多智能体系统基本问题之一成为当前的一个研究热点。在分布式优化框架下,每个智能体都与一个局部目标函数相对应,其... 详细信息
来源: 评论