人工知能学会全国大会論文集
Online ISSN : 2758-7347
第36回 (2022)
セッションID: 2C5-GS-2-05
会議情報

目的関数値の悪化を抑制するベイズ最適化に基づくオンライン学習に関する一考察
*中村 友香良川 太河山極 綾子後藤 正幸
著者情報
会議録・要旨集 フリー

詳細
抄録

これまでの推薦システムでは,過去のログデータからユーザが好むアイテムを推定し,リスト化して提示するものが多く,その性能は推定された推薦リストが顧客の嗜好に合致しているかを測る損失によって評価される.しかし,推薦は一時点のみで単発的に実施されるものではなく,各ユーザに対して継続的に実施されるものであるため,推薦系列全体に対する累積損失によって性能を議論されるべきである. このような逐次的な推薦と評価を取り扱うことができる枠組みとしてオンライン学習があるが,その目的は学習の効率化にあり,推薦系列の累積損失を考慮しない手法がほとんどである.そこで本研究では,目的関数の悪化を抑制しながら探索を行う手法であるSafe Exploration for Optimizationをベースとし,推薦系列の累積損失の抑制と広く各ユーザの嗜好に合致したアイテムを探索することを両立した手法を提案する. 探索されたアイテムに対して逐次的にユーザの評価が得られることを想定した人工データを生成し実験を行い,提案手法の有効性を示す.

著者関連情報
© 2022 人工知能学会
前の記事 次の記事
feedback
Top