POMDP 環境中でのTD-Networkの自動獲得: 単純再帰構造による拡張

牧野 貴樹

doi:10.11517/pjsai.JSAI08.0.294.0

人工知能学会全国大会論文集

Online ISSN : 2758-7347

第22回 (2008)

セッションID: 3A2-2

DOI https://doi.org/10.11517/pjsai.JSAI08.0.294.0

会議情報

主催: 社団法人　人工知能学会

会議名: 2008年度人工知能学会全国大会（第22回）

回次: 22

開催地: 北海道旭川市ときわ市民ホール等

開催日: 2008/06/11 - 2008/06/13

POMDP 環境中でのTD-Networkの自動獲得: 単純再帰構造による拡張

*牧野貴樹

著者情報

会議録・要旨集フリー

詳細

抄録

TD-Network は、強化学習において部分観測問題に対する適切な状態表現を生成する方式 Predictive State Representation を一般化した枠組みである。しかし、従来は、TD-Network の構造は研究者が明示的に与えなければならなかった。本発表では、TD-Network を自動的に獲得する方法を提案し、Ring-world における実験結果を示す。

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）