抄録
強化学習はシングルエージェントを対象に開発された手法であり、マルチエージェント環境での協調行動にそのまま適用すると、正しい学習を行なわせるためにはどのエージェントにどれだけの報酬量を分配すべきかという報酬分配の問題が発生する。そこで本研究では、個体行動評価とファジィルールを用いた協調行動評価により、個々のエージェントの行動による個体貢献度とシステム全体に対する協調貢献度を求めて、個々のエージェントに貢献度に応じた報酬分配を行うマルチエージェントProfit Sharing(MAPS)手法を提案する。個体と集団に対する協調貢献度を用いることで個々の行動をシステム全体から評価するため、協調行動を効率的に学習するマルチエージェントシステムを構築することができた。