相关文章推荐

满身肌肉的铁板烧 · System.setProperty ...· 1 年前 ·

暴走的长颈鹿 · Microsoft.Extensions.L ...· 1 年前 ·

不羁的生姜 · Tailwind 导致 antd 的 ...· 1 年前 ·

安静的领结 · nth child选择器的权重-掘金· 2 年前 ·

笔记索引（持续更新）

陈皓

强化学习方向，国科大读博，自动化所实习

这篇笔记分类汇总了我在知乎上分享过的有价值的资料，主要是关于多智能体（深度）强化学习的内容。欢迎大家私信交流！我的个人主页是： https://timebreaker.github.io

1.多智能体强化学习

多智能体强化学习资源分享 (GitHub持续更新)

对抗强化学习论文总结

方法简单但是理论很强的MARL文章（持续更新）

博弈、智能决策方向研究机构，青年学者整理（持续更新）（这个链接好像大家看不到，只有我自己能看）

MARL+变分推断

对比学习+多智能体强化学习

Coordination Graphs 相关工作总结

集成学习思想如何用于强化学习领域？

目前存在这样的多智能体强化学习算法吗，即区域里智能体的数量会发生变化？

MARL伪代码参考

Random Shuffle在多智能体强化学习中的应用

具有收敛性保证的多智能体强化学习算法

2.理论基础

2.1博弈论

组队零和博弈 Team-Maxmin Equilibria

Policy Space Response Oracle (PSRO)

Policy Space Response Oracle (PSRO)系列工作总结

2.2强化学习

强化学习算法总结

2019——2023 强化学习热点回顾

2.3数学工具

Hypergraph Neural Networks 超图

异构图神经网络

深度学习的理论解释

3.代码相关

记录碰到的bug以及解决方案（持续更新）

服务器常用命令总结

服务器配置以及安装星际争霸2实验环境的流程

星际争霸2地图编辑器使用指南

基于pymarl框架新增环境和地图的方法

PyCharm使用技巧

使用conda pack打包并迁移现有环境到新服务器上

pycharm和vscode远程连接服务器的步骤

4.科研心得

提高科研效率的软件和网站

科研技巧（持续更新）

论文写作（LaTeX）

快速比较两个工程的修改情况

联系IEEE修正作者信息错误的流程

IEEE account is temporarily unavailable 原因和解决办法

5.出国相关

雅思考试攻略（速成版）

英国ATAS申请攻略

6.其他

科研段子（持续更新）

编辑于 2023-06-16 17:23 ・IP 属地北京

多智能体强化学习

强化学习 (Reinforcement Learning)

推荐文章

满身肌肉的铁板烧 · System.setProperty 邮件超时 - CSDN文库

1 年前

暴走的长颈鹿 · Microsoft.Extensions.Logging の使用 - EF Core | Microsoft Learn

1 年前

不羁的生姜 · Tailwind 导致 antd 的 button icon svg 不居中的 bug_tailwind ant-design button-CSDN博客

1 年前

安静的领结 · nth child选择器的权重-掘金

2 年前

今天看啥 · Py中国 · codingpro · 小百科 · link之家 · 卧龙AI搜索

删除内容请联系邮箱 2879853325@qq.com

Code - 代码工具平台

© 2024 ~ 沪ICP备11025650号