東京大学生産技術研究所 最先端数理モデル連携研究センター
東京大学大学院新領域創成科学研究科
東京大学生産技術研究所 情報・エレクトロニクス系部門
2013 年 65 巻 3 号 p. 315-318
(EndNote、Reference Manager、ProCite、RefWorksとの互換性あり)
(BibDesk、LaTeXとの互換性あり)
徒弟学習などの,部分観測マルコフ決定過程 (POMDP) 上でのモデル設計問題においては,多くのPOMDPに対する最適方策を計算する必要があり,計算コストが問題となっていた.本稿では,計算コストを下げる手法として,転移学習と劣勾配計算の2つの手法を提案する.また,これらの手法が,方策改善型のPOMDPソルバーの上で効率的に実装が可能であることを示す.
すでにアカウントをお持ちの場合 サインインはこちら