不完全情報ゲームにおける目的に特化した状態空間の縮約

高橋 春輝; 深井 朋樹; 酒井 裕; 竹川 高志

doi:10.11517/pjsai.JSAI2024.0_2B5GS202

抄録

不完全情報ゲームでは,対戦相手の行動戦略を予測することが困難であるため,相手の戦略に依存せずに勝ちやすい戦略であるナッシュ均衡を求める研究が盛んに行われている.10¹⁶に及ぶ膨大な観測空間をもつ Poker では,Deep Neural Network(DNN)を用いてナッシュ均衡戦略を求め,人間を凌駕する性能が達成されている.DNNは課題に特化した状態空間をブラックボックス内で獲得することで状況に適した行動選択を可能とする一方,選択した行動の妥当性を複雑な状態空間の観点から説明するのは困難である．AIの行動原理を説明する方法として，状態空間を簡潔化し，選択した行動の将来の勝率への貢献度を提示するものが考えられる．そこで，本研究では,膨大な観測空間を簡潔な状態空間に縮約するベイズモデルを提案し,不完全情報ゲームである「ハゲタカの餌食」を題材に性能評価を行う.結果として，提案手法により10⁴程の観測空間を最適に近い状態空間にまで縮約することができた．また，適切な状態空間の縮約は，対戦相手の戦略の予測を容易にし，最適戦略の学習速度が向上することも示された．

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）