強化学習と汎用エージェント

相澤 彰子

doi:10.11517/jsaisigtwo.2017.AGI-006_05

抄録

近年の深層学習の発展と普及を受けて、エージェントと環境の相互作用に基づく強化学習(reinforcement learning)が脚光を浴びている。本講演では、Marcus Hutterによって提案された汎用的なエージェントのモデルであるAIXI(AI ξ, エーアイ，クシー)を紹介する。AIXIモデルは、Ray Solomonoffのアルゴリズム情報理論の考え方に基づき、ユニバーサルな事前分布をエージェントの最適化戦略に取り入れたものである。これによりAIXIは、いかなる環境のもとでも最適な戦略をとることができるエージェントモデルとして定式化される。万能エージェントの理論的な枠組みを提示することで、汎用的な知能とは何かの問題にアプローチするAIXIモデルは、強化学習の深化を考える上でも興味深い。

著者関連情報

お気に入り & アラート

閲覧履歴

発行機関からのお知らせ

第二種研究会の全記事は認証なしでアクセス可能です．また，各記事の著作権は原則として著者に帰属します．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）