電気関係学会九州支部連合大会講演論文集
平成25年度電気関係学会九州支部連合大会(第66回連合大会)講演論文集
セッションID: 10-2A-01
会議情報

Q学習の状態分割法
*市来 拓也渕田 孝康
著者情報
会議録・要旨集 フリー

詳細
抄録
エサ拾いマウスを問題として設定し、学習が進むにつれて、状態空間を分割していき、よりエージェントがエサにたどり着きやすくなるようにすることが目的である。そこで、状態空間の分割方法を研究対象として考える。考えられる分割方法は、木構造を用いて分割したり、ボロノイ図を用いて分割するなどがあり、分割の条件でも学習のパフォーマンスが変わるため、考える必要がある。しかし、これは問題設定によっても変わってくるため、1つの問題を研究対象として極めても、他の問題ではその最適だったパラメータや分割方法は使えない。そこで、エサ拾いマウス以外の新たな問題を作成し、2つの問題の状態空間の分割法を探ることで、共通点を探る。
著者関連情報
© 2013 電気関係学会九州支部連合大会委員会
前の記事 次の記事
feedback
Top