人工知能学会全国大会論文集
Online ISSN : 2758-7347
第32回 (2018)
セッションID: 1N3-04
会議情報

Profit Sharingと遺伝的アルゴリズムを用いたハイブリッド学習 -MDPs環境でのタスク分割性能-
*鈴木 晃平加藤 昇平
著者情報
会議録・要旨集 フリー

詳細
抄録

強化学習は,学習者であるエージェントが環境との相互作用から目標状態に達する方策の学習を行う手法である.強化学習では,観測情報が不十分で状態の混同を引き起こし,正しく学習できないことがある.これを不完全知覚問題という.この解決手法として,筆者らはProfit Sharingと遺伝的アルゴリズムを組み合わせ,タスクを分割することで不完全知覚問題を解決するHybrid learning using Profit sharing and Genetic algorithm (HPG)を提案した.しかし,実環境ではマルコフ決定過程(MDPs)であることが多いものの,HPGのMDPs環境下における有効性を検証していなかった.本稿では,MDPs環境にも効率よく対応できるようHPGを改良し,不完全知覚問題とMDPs環境下における実験により,タスク分割性能を検証する.

著者関連情報
© 2018 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top