もっと詳しく

3つの要点 ?? 環境内のエージェントの増減に対応可能なマルチエージェント強化学習アルゴリズム「MA-POCA」を提案 ?? Attention(注意)を用いることでCriticに対する可変長の入力に対応 ?? エピソード内でエージェントが生成・消滅するタスクや、標準的なマルチエージェント協調タスクにおいて、既存手…