人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 2B5-GS-2-02
会議情報

不完全情報ゲームにおける目的に特化した状態空間の縮約
*高橋 春輝深井 朋樹酒井 裕竹川 高志
著者情報
会議録・要旨集 フリー

詳細
抄録

不完全情報ゲームでは,対戦相手の行動戦略を予測することが困難であるため,相手の戦略に依存せずに勝ちやすい戦略であるナッシュ均衡を求める研究が盛んに行われている.1016に及ぶ膨大な観測空間をもつ Poker で は,Deep Neural Network(DNN)を用いてナッシュ均衡戦略を求め,人間を凌駕する性能が達成されている.DNNは課題に特化した状態空間をブラックボックス内で獲得することで状況に適した行動選択を可能とする一方,選択した行動の妥当性を複雑な状態空間の観点から説明するのは困難である.AIの行動原理を説明する方法として,状態空間を簡潔化し,選択した行動の将来の勝率への貢献度を提示するものが考えられる.そこで,本研究では,膨大な観測空間を簡潔な状態空間に縮約するベイズモデルを提案し,不完全情報ゲームである「ハゲタカの餌食」を題材に性能評価を行う.結果として,提案手法により104程の観測空間を最適に近い状態空間にまで縮約することができた.また,適切な状態空間の縮約は,対戦相手の戦略の予測を容易にし,最適戦略の学習速度が向上することも示された.

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top