智能数据分析与系统实验室-理论组报告

赵宝林
中国海洋大学计算机系博士
日期:2025年4月21日(星期一) 时间:7:00pm - 10:00pm 地点:信息南楼-A421
汇报内容:
《Meta Learning Task Representation in Multiagent Reinforcement Learning: From Global Inference to Local Inference》。这篇论文提出了 MG2L,一种新型多智能体元强化学习算法,旨在解决部分可观测环境下智能体难以从局部经验推断任务的挑战。该算法基于全局到局部(G2L)训练框架,利用互信息优化(MIO)来协调集中训练与分散执行:首先通过最大化全局表征与任务上下文的互信息来学习集中式任务表示,再通过最小化条件互信息缩减来优化局部表征,缩小全局与局部推断的差距。此外,论文引入 排列不变注意力(PIA)模块以降低对行为策略变化的敏感性,并通过大量实验验证了 MG2L 在任务适应、鲁棒性和可扩展性上的优越性能。