抄録
強化学習はシングルエージェントを対象に開発された手法であり,マルチエージェント環境になると,個々のエージェントがどのように相互に影響を与えれば,全体の適切な協調行動を獲得できるかという問題における決定的な解決方法は示されていない.そこで本研究では,エージェント間の強化値インタラクションを通じて,優れた協調能力をもつインタラクティブ学習システムの構築手法を提案する.本手法では,個々のエージェントは環境との試行錯誤を繰り返しながら,エージェント間でも目標の達成度と協調度に応じて,相互信頼度を自律的に生成し,更新する.その信頼度の高さにより,各エージェントは他エージェントの強化値を利用するレベルを決める.強化値を相互に利用することで,エージェント間でインタラクティブ学習が可能なシステムを構築する.そのため,各エージェントは周囲のエージェントからも自身に有効な経験を学習することができる.環境や他エージェントとのインタラクションを通じて,マルチエージェントの協調行動と集団戦略を効率的に学習させる.