マルコフ決定過程で表現されたロールプレイングゲームにおける攻略法の能動学習

前田 康成; 後藤 文太朗; 升井 洋志; 桝井 文人; 鈴木 正清; 松嶋 敏泰

doi:10.24466/jbfsa.15.1_69

前田康成, 後藤文太朗, 升井洋志, 桝井文人, 鈴木正清, 松嶋敏泰

著者情報

キーワード: ロールプレイングゲーム, マルコフ決定過程, 能動学習

ジャーナルオープンアクセス

2013 年 15 巻 1 号 p. 69-81

DOI https://doi.org/10.24466/jbfsa.15.1_69

詳細

抄録

従来からマルコフ決定過程(MDP)を用いたロールプレイングゲーム(RPG)のモデル化が行われている.しかし,RPGの攻略法を能動的に学習する研究は行われていない.そこで,本研究では,真のパラメータが未知のMDPで表現されたRPGにおける期待総利得をベイズ基準のもとで最大にする攻略法を求める能動的な学習方法を提案する.シミュレーションをとおして,提案方法の有効性を確認する.

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）