北見工業大学・情報システム工学科
早稲田大学・応用数理学科
2013 年 15 巻 1 号 p. 69-81
(EndNote、Reference Manager、ProCite、RefWorksとの互換性あり)
(BibDesk、LaTeXとの互換性あり)
従来からマルコフ決定過程(MDP)を用いたロールプレイングゲーム(RPG)のモデル化が行われている.しかし,RPGの攻略法を能動的に学習する研究は行われていない.そこで,本研究では,真のパラメータが未知のMDPで表現されたRPGにおける期待総利得をベイズ基準のもとで最大にする攻略法を求める能動的な学習方法を提案する.シミュレーションをとおして,提案方法の有効性を確認する.
すでにアカウントをお持ちの場合 サインインはこちら