二人零和展開型ゲームにおける突然変異付き乗算型重み更新に関する研究

坂本 充生; 阿部 拳之; 蟻生 開人; 岩崎 敦

doi:10.11517/pjsai.JSAI2023.0_2T4GS502

抄録

本研究では，二人零和展開型ゲームにおける突然変異を利用した乗算型重み更新の帰結を吟味する．二人零和展開型ゲームは不完全情報下の意思決定における重要な問題である．このゲームの均衡は線形計画法で求められるが，ポーカーなど大きなサイズのゲームを扱うことは難しい．この問題に対して，均衡戦略を近似する学習アルゴリズムが提案されている．しかし，既存アルゴリズムの多くは学習のダイナミクスの時間平均をとって初めて均衡に収束する．一方，標準形ゲームでは，突然変異の導入によって時間平均を取らずに均衡戦略を学習できることが明らかになっている．そこで本研究では展開型ゲームにおいて突然変異を加えたDilated Mutant Multiplicative Weight Updateを提案する．シークエンス型で戦略を表現し，突然変異の付きの乗算型重み更新でその戦略を更新する．実験の結果，提案手法が複数のゲームおいて時間平均を取らずに均衡戦略を学習することがわかった．

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）