咨询与建议

限定检索结果

文献类型

  • 1 篇 期刊文献

馆藏范围

  • 1 篇 电子文献
  • 0 种 纸本馆藏

日期分布

学科分类号

  • 1 篇 理学
    • 1 篇 数学
  • 1 篇 管理学
    • 1 篇 管理科学与工程(可...

主题

  • 1 篇 bandit反馈
  • 1 篇 在线鞍点问题
  • 1 篇 动态鞍点遗憾
  • 1 篇 镜面下降
  • 1 篇 分布式优化

机构

  • 1 篇 南京理工大学

作者

  • 1 篇 张文韬
  • 1 篇 徐胜元
  • 1 篇 袁德明
  • 1 篇 张保勇

语言

  • 1 篇 中文
检索条件"主题词=在线鞍点问题"
1 条 记 录,以下是1-10 订阅
排序:
分布式在线鞍点问题的Bandit反馈优化算法
收藏 引用
自动化学报 2025年 第4期51卷 857-874页
作者: 张文韬 张保勇 袁德明 徐胜元 南京理工大学自动化学院
本文研究了多智能体时变网络上基于Bandit反馈的分布式在线鞍点问题,其中每个智能体通过本地计算和局部信息交流去协作最小化全局损失函数.在Bandit反馈下,包括梯度在内的损失函数信息是不可用的,每个智能体仅能获得和使用在某决策或其... 详细信息
来源: 评论