主催: 一般社団法人 人工知能学会
会議名: 2023年度人工知能学会全国大会(第37回)
回次: 37
開催地: 熊本城ホール+オンライン
開催日: 2023/06/06 - 2023/06/09
ベイズ推定は観測データから, データの生成過程を確率的に推論することができる統計的推定方法である. 近年画像生成AIとして注目されている Stable Diffusion などにも活用されていることから, ベイズ推定は機械学習モデルにおいて重要な役割を持つ要素技術の一つであると言える. 一方で, ベイズ推定そのものの問題点として, 推定の間は過去の情報を現在の情報と同等に評価してしまうことが挙げられる. これは定常環境では問題はないが, 途中で対象の状態が変わるような非定常環境においては従来のベイズ推定では対応できないことが考えられる. 例えば強化学習のタスクであるバンディット問題において, ベイズ推定を基にした方策である Thompson sampling というアルゴリズムは, 定常環境では特に良い性能を示すが非定常環境では性能が極端に低下する. 先行研究ではベイズ推定に忘却率と学習率という概念を導入した拡張型ベイズ推定という手法が提案されている. 本研究ではバンディット問題において拡張型ベイズ推定を用いたアルゴリズムを使って定常・非定常環境への対応を検証し, 拡張型ベイズ推定の忘却率及び学習率の役割を考察する.