2015 年 27 巻 5 号 p. 734-742
人間がロボットにタスクを与え学習を行わせるためには教師信号や評価関数,強化信号などタスク達成度を表す指標を設計する必要がある.通常このような指標はそれぞれのタスクやロボットが用いられる環境を考慮して設計され,タスクや環境が変わると再設計する必要がある.しかしタスク毎もしくは環境毎に学習のための指標を再設計することは設計者の負担となり,また専門知識を持たない一般的な使用者にとっても負担となる.そこで,我々は個別に学習のための評価を設計・実装するのではなく,インタラクションを通して人間の評価を読み取り学習するための手法を提案する.本稿では生物の感覚刺激に基づくセンサ情報の評価とそれによる強化学習のための報酬生成の手法を提案する.生物における感覚刺激をモデルにすることで,ロボットの刺激に対する評価を人間にとってイメージしやすいものとし,直感的なインタラクションの実現を試みる.実験では人間とのインタラクションのためのデバイスとしてタブレット端末を用い,タブレット端末より得られたタッチセンサの情報から報酬を生成させる.また複数の被験者に専門知識を与えずにインタラクションしてもらい,ロボットを学習させることができることを確認し,提案手法の妥当性を検証する.