主催: 一般社団法人 人工知能学会
会議名: 2023年度人工知能学会全国大会(第37回)
回次: 37
開催地: 熊本城ホール+オンライン
開催日: 2023/06/06 - 2023/06/09
本研究では,二人零和展開型ゲームにおける突然変異を利用した乗算型重み更新の帰結を吟味する. 二人零和展開型ゲームは不完全情報下の意思決定における重要な問題である. このゲームの均衡は線形計画法で求められるが,ポーカーなど大きなサイズのゲームを扱うことは難しい. この問題に対して,均衡戦略を近似する学習アルゴリズムが提案されている. しかし,既存アルゴリズムの多くは学習のダイナミクスの時間平均をとって初めて均衡に収束する. 一方,標準形ゲームでは,突然変異の導入によって時間平均を取らずに均衡戦略を学習できることが明らかになっている. そこで本研究では展開型ゲームにおいて突然変異を加えたDilated Mutant Multiplicative Weight Updateを提案する.シークエンス型で戦略を表現し,突然変異の付きの乗算型重み更新でその戦略を更新する. 実験の結果,提案手法が複数のゲームおいて時間平均を取らずに均衡戦略を学習することがわかった.