JUBAKU: 日本文化における偏見評価のための敵対的ベンチマーク

塩谷 泰平; 金子 正弘; 丹羽 彩奈; 丸山 裕生; 大葉 大輔; 大井 聖也; 岡崎 直観

doi:10.11517/pjsai.JSAI2025.0_3Win512

第39回 (2025)

セッションID: 3Win5-12

DOI https://doi.org/10.11517/pjsai.JSAI2025.0_3Win512

会議情報

主催: 一般社団法人人工知能学会

会議名: 2025年度人工知能学会全国大会（第39回）

回次: 39

開催地: 大阪国際会議場＋オンライン

開催日: 2025/05/27 - 2025/05/30

JUBAKU: 日本文化における偏見評価のための敵対的ベンチマーク

*塩谷泰平, 金子正弘, 丹羽彩奈, 丸山裕生, 大葉大輔, 大井聖也, 岡崎直観

著者情報

キーワード: 自然言語処理, 大規模言語モデル, 公平性

会議録・要旨集フリー

詳細

抄録

大規模言語モデル（LLM）に対する偏見評価において，非英語圏では英語データセットの翻訳に依存している現状がある．しかし，このような翻訳されたデータセットは西洋文化を基盤としており，異なる文化圏における倫理観や社会規範を十分に反映していない．本研究では，日本文化に対応した敵対的偏見評価ベンチマーク「JUBAKU」を構築し，LLMの偏見を誘発する対話データを人手で作成した．JUBAKUを用いて9種類の日本語LLMを評価した結果，全モデルがランダムベースラインを下回り，日本文化特有の偏見に対する脆弱性が明らかになった．

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）