人工知能学会全国大会論文集
Online ISSN : 2758-7347
第33回 (2019)
セッションID: 2H3-J-2-03
会議情報

非定常環境における認知的満足化価値関数の適応性能
*花安 勇人齋藤 建志吉井 佑輝甲野 佑高橋 達二
著者情報
会議録・要旨集 フリー

詳細
抄録

エージェントが試行錯誤を行う現実の環境は,観測できない情報や様々な揺らぎから,一般的に非定常であると言える.非定常環境での有効な意思決定のためには,新しい環境への適応のために,過去の情報をうまく捨てる必要がある.結果として,定常環境より少ない情報である程度良い選択肢を選び意思決定していく必要がでてくる.そのような少ない情報からの意思決定のため,我々は人間の満足化と呼ばれる選択傾向を有した満足化価値関数を用いたRSアルゴリズムに着目した.我々はRSアルゴリズムを過去の情報を捨てながら選択するメタバンディットアルゴリズムや,忘却率付き更新と組み合わせ,定常・非定常環境下の両方における多腕バンディット問題で,既存アルゴリズムと比較し,その有用性を示した.

著者関連情報
© 2019 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top