人工知能学会全国大会論文集
Online ISSN : 2758-7347
第22回 (2008)
セッションID: 3A2-2
会議情報

POMDP 環境中でのTD-Networkの自動獲得: 単純再帰構造による拡張
*牧野 貴樹
著者情報
会議録・要旨集 フリー

詳細
抄録
TD-Network は、強化学習において部分観測問題に対する適切な状態表現を生成する方式 Predictive State Representation を一般化した枠組みである。しかし、従来は、TD-Network の構造は研究者が明示的に与えなければならなかった。本発表では、TD-Network を自動的に獲得する方法を提案し、Ring-world における実験結果を示す。
著者関連情報
© 2008 社団法人 人工知能学会
前の記事 次の記事
feedback
Top