知能ロボットなどに代表される自律エージェントの行動学習に関する研究において, 近年その重要性が広く認識されるようになった課題の一つとして「状態および行為の自律的
抽象化
問題」が挙げられる.これは, あるエージェントがいかにして, 過去の行動経験などに基づいてプリミティブなセンサー入力やモーター出力を分類・一般化し, そのエージェント自身の行動決定・行動獲得にとって最適な状態集合・行為集合を獲得すべきか, という問題である.本論文では, この問題において, 特に以下の2つのテーマに主眼を置く.(1)異種冗長なセンサー情報からの状態の一般化法と表現法に関する問題 (2)状態および行為の
抽象化
基準の統合と, 両者の同時
抽象化
に関する問題 前者については, エージェントの多種のセンサー入力から得られる異種冗長な情報を柔軟かつ効率的に統合し, 状態の一般化を行う方法として「単純ベイズ分類器に基づいた状態一般化・表現法」を提案している.そしてこの手法が従来の手法と比較して, センサーノイズやフォールトなど, 実環境における不確定性要因への頑強性を改善することを示している.後者については, 状態・行為一般化に関する従来の研究で用いられてきた
抽象化
基準を系統的に分類した上で, これらを統合する枠組として「複数行動結果のエントロピー最小化に基づく状態・行為の
抽象化
」を提案している.そして, これによって複数の
抽象化
基準の組み合わせや, 状態と行為の同時
抽象化
などが可能になることを示している.
抄録全体を表示