近年の人工ニューラルネットや機械学習の発展により, 学習能力を持った様々なロボットや人工エージェントなどが開発されている. しかしロボットに目的の行動をうまく学習させるためには (1) メタパラメータ, (2) 報酬関数, (3) 状態表現, (4) 学習アルゴリズムの選択, といった問題を注意深く設計しなければならない. 多くの人工システムでは, それらは設計者が試行錯誤を通して設定していたが, 人間やそれ以外の動物は多様に変化する環境下でも新しい行動を次々と学習している. このようなメタな学習を実現している計算理論とは何かを解明することがサイバーローデントプロジェクトの目的である. 本稿では我々の研究を中心として, 上記4つの問題を自律的に調整・獲得するための手法について概説する.
抄録全体を表示