人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 2T4-GS-5-02
会議情報

二人零和展開型ゲームにおける突然変異付き乗算型重み更新に関する研究
*坂本 充生阿部 拳之蟻生 開人岩崎 敦
著者情報
会議録・要旨集 フリー

詳細
抄録

本研究では,二人零和展開型ゲームにおける突然変異を利用した乗算型重み更新の帰結を吟味する. 二人零和展開型ゲームは不完全情報下の意思決定における重要な問題である. このゲームの均衡は線形計画法で求められるが,ポーカーなど大きなサイズのゲームを扱うことは難しい. この問題に対して,均衡戦略を近似する学習アルゴリズムが提案されている. しかし,既存アルゴリズムの多くは学習のダイナミクスの時間平均をとって初めて均衡に収束する. 一方,標準形ゲームでは,突然変異の導入によって時間平均を取らずに均衡戦略を学習できることが明らかになっている. そこで本研究では展開型ゲームにおいて突然変異を加えたDilated Mutant Multiplicative Weight Updateを提案する.シークエンス型で戦略を表現し,突然変異の付きの乗算型重み更新でその戦略を更新する. 実験の結果,提案手法が複数のゲームおいて時間平均を取らずに均衡戦略を学習することがわかった.

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top