深層学習ベースのロボット制御手法によって,人のように実環境で様々な目標を達成できることが期待されている.そのためには,目標指向の行動に加え,環境の不確実性を下げる探索指向の行動も可能なロボットの実現が課題となる.人の脳の計算原理に基づき,目標・探索指向の行動を説明可能な深層能動的推論によってこの課題の解決が期待されるが,計算量が多い・性能が環境のダイナミクスを学習する世界モデルの表現力に依存するという問題がある.本研究ではこれらの問題を解決するため,実ロボット制御のための新た な深層能動的推論フレームワークを提案する.このフレームワーク は環境のダイナミクスを学習する世界モデル,行動を抽象化する行動モデル,そして抽象的な行動表現と世界モデルの隠れ状態の関係を学習する抽象世界モデルで構成される.また,世界モデルに時間的階層性を導入することで,モデルの表現力を向上させるとともに計算量を低減する.不確実性のある実環境で複数の物体を操作するロボット実験を通して,提案手法によって従来手法と比較して計算量を削減しながら,様々な目標を達成し,環境の不確実性を下げる探索も可能であることが示された.