人工知能学会全国大会論文集
Online ISSN : 2758-7347
第33回 (2019)
セッションID: 3K3-J-2-04
会議情報

大局基準値共有による社会的強化学習
*其田 憲明神谷 匠高橋 達二
著者情報
キーワード: 強化学習, 社会学習, 満足化
会議録・要旨集 フリー

詳細
抄録

人間は個人での試行錯誤的な学習だけではなく,他者の成功情報を受け取ることで学習をより促進させている.ここには他者の行動の模倣や結果の再現といった社会的な戦略が存在する.強化学習における他エージェントとの情報共有法としてはしばしば行動価値の共有が行われているが,状態や状態行動対ごとの情報共有が必要であり,現実には難しいことが多々ある.少なくとも人間や動物の社会的学習のモデルとしては現実性に欠ける.我々は人間の満足化原理を強化学習に反映した,Risk-sensitive Satisficingと大局基準変換法を用いた大局的な基準値の共有によって,より少量の情報共有による効率的な社会的学習が可能であることを示す.

著者関連情報
© 2019 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top