Ｑ値累積型モンテカルロ法に関する一考察

人工知能学会全国大会論文集

Online ISSN : 2758-7347

第22回 (2008)

セッションID: 2A1-1

DOI https://doi.org/10.11517/pjsai.JSAI08.0.116.0

会議情報

主催: 社団法人　人工知能学会

会議名: 2008年度人工知能学会全国大会（第22回）

回次: 22

開催地: 北海道旭川市ときわ市民ホール等

開催日: 2008/06/11 - 2008/06/13

Ｑ値累積型モンテカルロ法に関する一考察

*植村渉

著者情報

会議録・要旨集フリー

詳細

抄録

経験強化型の強化学習法であるProfit Sharingが，マルコフ決定過程の確率的状態遷移に対して適切に学習を進めることができない場合があることを指摘し，モンテカルロ法の評価値の扱い方を基にした新しい学習方法を提案する．

著者関連情報

© 2008 社団法人人工知能学会

お気に入り & アラート

関連記事

閲覧履歴

関連ジャーナル

人工知能学会論文誌

SLUD研究会資料

KBS研究会資料

FPAI研究会資料

ALST研究会資料

第二種研究会資料

Top