生産研究
Online ISSN : 1881-2058
Print ISSN : 0037-105X
ISSN-L : 0037-105X
研究速報
強化学習における部分観測問題のモデル設計に関する新しい最適解探索手法
牧野 貴樹小田 也寸志合原 一幸
著者情報
ジャーナル フリー

2013 年 65 巻 3 号 p. 315-318

詳細
抄録

徒弟学習などの,部分観測マルコフ決定過程 (POMDP) 上でのモデル設計問題においては,多くのPOMDPに対する最適方策を計算する必要があり,計算コストが問題となっていた.本稿では,計算コストを下げる手法として,転移学習と劣勾配計算の2つの手法を提案する.また,これらの手法が,方策改善型のPOMDPソルバーの上で効率的に実装が可能であることを示す.

著者関連情報
© 2013 東京大学生産技術研究所
前の記事 次の記事
feedback
Top