人工知能学会全国大会論文集
Online ISSN : 2758-7347
第39回 (2025)
セッションID: 3F4-OS-42a-05
会議情報

生成的推薦の人気バイアスの分析:暗記の観点から
*石原 祥太郎
著者情報
会議録・要旨集 フリー

詳細
抄録

大規模言語モデルの推薦への応用に注目が集まる中,公平性に関する議論は発展途上である.本研究では,大規模言語モデルの課題の一つとして指摘されている訓練データの暗記に着目し,生成的推薦システムを分析する.具体的に日本語ニュースメディアのログデータを用いて,ユーザが閲覧する記事タイトルの変遷を予測するように Llama 3 をファインチューニングし,訓練データの暗記を定量化した.実験の結果,人気記事が過度に推薦されるバイアスが存在し,その要因が訓練データの暗記の観点で解釈できると示唆された.解釈を活用し,暗記の対応策として知られる重複排除が,生成的推薦の人気バイアスの軽減に利用可能であることも実証した.

著者関連情報
© 2025 人工知能学会
前の記事 次の記事
feedback
Top