人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 3D1-GS-2-02
会議情報

最適方策を学習可能なインタラクティブ模倣学習
*中口 悠輝窪田 大
著者情報
会議録・要旨集 フリー

詳細
抄録

模倣学習は強化学習の問題を何らかの教師の情報を参考に解く。典型手法の行動模倣では共変量シフトを生じて長期的な問題に適用できなかったが、インタラクティブ模倣学習は教師モデルからオンラインでフィードバックを得ることでこの課題を解決した。一方、インタラクティブ模倣学習の既存手法では、教師が生徒モデルの最適方策と異なる場合に生徒が最適方策を学習できなかった。本研究ではインタラクティブ模倣学習について整理したレビューを与えるとともに、その課題を解決する新規手法を提案する。

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top