Related papers: Diffusing to Coordinate: Efficient Online Multi-Ag…

Diffusion Models for Offline Multi-agent Reinforcement Learning with Safety Constraints

In recent advancements in Multi-agent Reinforcement Learning (MARL), its application has extended to various safety-critical scenarios. However, most methods focus on online learning, which presents substantial risks when deployed in…

Artificial Intelligence · Computer Science 2024-10-01 Jianuo Huang

CODA: Coordination via On-Policy Diffusion for Multi-Agent Offline Reinforcement Learning

Offline multi-agent reinforcement learning (MARL) enables policy learning from fixed datasets, but is prone to coordination failure: agents trained on static, off-policy data converge to suboptimal joint behaviours because they cannot…

Machine Learning · Computer Science 2026-04-28 Marcel Hedman , Kale-ab Abebe Tessera , Juan Claude Formanek , Anya Sims , Riccardo Zamboni , Trevor McInroe , John Torr , Elliot Fosong

Beyond Conservatism: Diffusion Policies in Offline Multi-agent Reinforcement Learning

We present a novel Diffusion Offline Multi-agent Model (DOM2) for offline Multi-Agent Reinforcement Learning (MARL). Different from existing algorithms that rely mainly on conservatism in policy design, DOM2 enhances policy expressiveness…

Artificial Intelligence · Computer Science 2023-07-06 Zhuoran Li , Ling Pan , Longbo Huang

Offline Multi-agent Reinforcement Learning via Sequential Score Decomposition

Offline cooperative multi-agent reinforcement learning (MARL) faces unique challenges due to distributional shifts, particularly stemming from the high dimensionality of joint action spaces and the presence of out-of-distribution joint…

Machine Learning · Computer Science 2026-05-29 Dan Qiao , Wenhao Li , Shanchao Yang , Hongyuan Zha , Baoxiang Wang

Revisiting Multi-Agent World Modeling from a Diffusion-Inspired Perspective

World models have recently attracted growing interest in Multi-Agent Reinforcement Learning (MARL) due to their ability to improve sample efficiency for policy learning. However, accurately modeling environments in MARL is challenging due…

Multiagent Systems · Computer Science 2025-10-27 Yang Zhang , Xinran Li , Jianing Ye , Shuang Qiu , Delin Qu , Xiu Li , Chongjie Zhang , Chenjia Bai

DiffusionOPD: A Unified Perspective of On-Policy Distillation in Diffusion Models

Reinforcement learning has emerged as a powerful tool for improving diffusion-based text-to-image models, but existing methods are largely limited to single-task optimization. Extending RL to multiple tasks is challenging: joint…

Machine Learning · Computer Science 2026-05-15 Quanhao Li , Junqiu Yu , Kaixun Jiang , Yujie Wei , Zhen Xing , Pandeng Li , Ruihang Chu , Shiwei Zhang , Yu Liu , Zuxuan Wu

Decentralized Diffusion Policy Learning for Enhanced Exploration in Cooperative Multi-agent Reinforcement Learning

Cooperative multi-agent reinforcement learning (MARL) involves complex agent interactions and requires effective exploration strategies. A prominent class of MARL algorithms, decentralized softmax policy gradient (DecSPG), addresses this…

Multiagent Systems · Computer Science 2026-05-11 Yuyang Zhang , Haldun Balim , Na Li

Offline Multi-Agent Reinforcement Learning via In-Sample Sequential Policy Optimization

Offline Multi-Agent Reinforcement Learning (MARL) is an emerging field that aims to learn optimal multi-agent policies from pre-collected datasets. Compared to single-agent case, multi-agent setting involves a large joint state-action space…

Artificial Intelligence · Computer Science 2024-12-19 Zongkai Liu , Qian Lin , Chao Yu , Xiawei Wu , Yile Liang , Donghui Li , Xuetao Ding

MADiff: Offline Multi-agent Learning with Diffusion Models

Offline reinforcement learning (RL) aims to learn policies from pre-existing datasets without further interactions, making it a challenging task. Q-learning algorithms struggle with extrapolation errors in offline settings, while supervised…

Artificial Intelligence · Computer Science 2025-01-03 Zhengbang Zhu , Minghuan Liu , Liyuan Mao , Bingyi Kang , Minkai Xu , Yong Yu , Stefano Ermon , Weinan Zhang

Explaining Decentralized Multi-Agent Reinforcement Learning Policies

Multi-Agent Reinforcement Learning (MARL) has gained significant interest in recent years, enabling sequential decision-making across multiple agents in various domains. However, most existing explanation methods focus on centralized MARL,…

Artificial Intelligence · Computer Science 2025-11-14 Kayla Boggess , Sarit Kraus , Lu Feng

Decentralized Multi-Agent Reinforcement Learning: An Off-Policy Method

We discuss the problem of decentralized multi-agent reinforcement learning (MARL) in this work. In our setting, the global state, action, and reward are assumed to be fully observable, while the local policy is protected as privacy by each…

Multiagent Systems · Computer Science 2021-11-02 Kuo Li , Qing-Shan Jia

OM2P: Offline Multi-Agent Mean-Flow Policy

Generative models, especially diffusion and flow-based models, have been promising in offline multi-agent reinforcement learning. However, integrating powerful generative models into this framework poses unique challenges. In particular,…

Machine Learning · Computer Science 2026-03-02 Zhuoran Li , Xun Wang , Hai Zhong , Qingxin Xia , Lihua Zhang , Longbo Huang

Enhancing Sample Efficiency in Multi-Agent RL with Uncertainty Quantification and Selective Exploration

Multi-agent reinforcement learning (MARL) methods have achieved state-of-the-art results on a range of multi-agent tasks. Yet, MARL algorithms typically require significantly more environment interactions than their single-agent…

Systems and Control · Electrical Eng. & Systems 2026-03-17 Tom Danino , Nahum Shimkin

NetWorld: Communication-Based Diffusion World Model for Multi-Agent Reinforcement Learning in Wireless Networks

As wireless communication networks grow in scale and complexity, diverse resource allocation tasks become increasingly critical. Multi-Agent Reinforcement Learning (MARL) provides a promising solution for distributed control, yet it often…

Networking and Internet Architecture · Computer Science 2026-02-03 Kechen Meng , Rongpeng Li , Yansha Deng , Zhifeng Zhao , Honggang Zhang

DiffPoGAN: Diffusion Policies with Generative Adversarial Networks for Offline Reinforcement Learning

Offline reinforcement learning (RL) can learn optimal policies from pre-collected offline datasets without interacting with the environment, but the sampled actions of the agent cannot often cover the action distribution under a given…

Machine Learning · Computer Science 2024-06-14 Xuemin Hu , Shen Li , Yingfen Xu , Bo Tang , Long Chen

Efficient Diffusion Policies for Offline Reinforcement Learning

Offline reinforcement learning (RL) aims to learn optimal policies from offline datasets, where the parameterization of policies is crucial but often overlooked. Recently, Diffsuion-QL significantly boosts the performance of offline RL by…

Machine Learning · Computer Science 2023-10-27 Bingyi Kang , Xiao Ma , Chao Du , Tianyu Pang , Shuicheng Yan

Reinforcement Learning with Discrete Diffusion Policies for Combinatorial Action Spaces

Reinforcement learning (RL) struggles to scale to large, combinatorial action spaces common in many real-world problems. This paper introduces a novel framework for training discrete diffusion models as highly effective policies in these…

Machine Learning · Computer Science 2026-05-21 Haitong Ma , Ofir Nabati , Aviv Rosenberg , Bo Dai , Oran Lang , Craig Boutilier , Na Li , Shie Mannor , Lior Shani , Guy Tenneholtz

Goal-Oriented Multi-Agent Reinforcement Learning for Decentralized Agent Teams

Connected and autonomous vehicles across land, water, and air must often operate in dynamic, unpredictable environments with limited communication, no centralized control, and partial observability. These real-world constraints pose…

Multiagent Systems · Computer Science 2025-11-18 Hung Du , Hy Nguyen , Srikanth Thudumu , Rajesh Vasa , Kon Mouzakis

Multi-agent Coordination via Flow Matching

This work presents MAC-Flow, a simple yet expressive framework for multi-agent coordination. We argue that requirements of effective coordination are twofold: (i) a rich representation of the diverse joint behaviors present in offline data…

Machine Learning · Computer Science 2026-02-02 Dongsu Lee , Daehee Lee , Amy Zhang

A Model-Based Solution to the Offline Multi-Agent Reinforcement Learning Coordination Problem

Training multiple agents to coordinate is an essential problem with applications in robotics, game theory, economics, and social sciences. However, most existing Multi-Agent Reinforcement Learning (MARL) methods are online and thus…

Machine Learning · Computer Science 2024-01-19 Paul Barde , Jakob Foerster , Derek Nowrouzezahrai , Amy Zhang