本研究はP2P方式による分散型メタバースで、接続最適化を目指す研究である。P2P方式では、スケーラビリティの観点から接続先を選択する必要がある。先行研究でのヒューリスティック法では、Nodeの参加や離脱 (Churn) に対する耐性が考慮されていないため、実環境下での精度の低下が課題となっている。そこで本研究では、マルチエージェント深層強化学習の手法の一つであり、全体で最適化を行うMulti-Agent Proximal Policy Optimization (MAPPO) を接続最適化の際のアルゴリズムとして適用することを提案する。評価方法としては、理想的な接続形態との比較により、提案手法の有効性を検証するとともに、従来のヒューリスティック法との性能比較を行うことを提案する。