システム制御情報学会 研究発表講演会講演論文集
第52回システム制御情報学会研究発表講演会
セッションID: 6U1-6
会議情報

追跡問題における状態数固定法とQ学習の有効性
安里 晋吾*村田 忠彦
著者情報
会議録・要旨集 フリー

詳細
抄録
 本論文では,追跡問題に特化した手法であるICOOP(Intelligent Co-operative Pursuit)にQ学習を組み込むICOOP-Qを提案する.ICOOPでは状態行動空間の重みが固定であったため環境が大きくなると性能が落ちるが,ICOOP-Qは状態行動空間を学習することで環境が大きくなった場合にも性能を落とさないことを数値実験により示す.また,完全知覚Q学習では状態数の増加により学習が困難である広い空間に対してもICOOP-Qは有効であることを実験により確認する.
著者関連情報
© 2008 システム制御情報学会
前の記事 次の記事
feedback
Top