電気関係学会九州支部連合大会講演論文集
平成27年度電気・情報関係学会九州支部連合大会(第68回連合大会)講演論文集
セッションID: 10-2A-04
会議情報

連続値入力空間における強化学習アルゴリズムに関する考察
*江口 敬大宮島 廣美重井 徳貴
著者情報
会議録・要旨集 フリー

詳細
抄録
 従来の制御システムでは事前に組み込まれたプログラムに従い行動を決定するため、想定外の問題が生じた時にシステム自身がその解決策を導くことは困難とされている。そこで、システム自体が試行錯誤を行うことで自律的に学習し行動決定を行う強化学習が注目されている。しかし、強化学習には実環境のような連続値入力空間に直接適用できないという問題がある。 本稿では、適用が困難とされていた実環境への適用に対応するために、システム自身が連続値入力空間における状態と出力を定義して学習する手法について考える。
著者関連情報
© 2015 電気・情報関係学会九州支部連合大会委員会
前の記事 次の記事
feedback
Top