生成AIは差別や偏見を強化するのか、それとも是正するのか？ 日本の文脈に即した人種・民族バイアスベンチマークの試み

明戸 隆浩; 有賀 ゆうアニース; 川口 泰司; 宮下 萌; 元山 仁士郎; 李 春熙; ウィンチェスター マーク

doi:10.11517/pjsai.JSAI2025.0_1P3OS1a03

第39回 (2025)

セッションID: 1P3-OS-1a-03

DOI https://doi.org/10.11517/pjsai.JSAI2025.0_1P3OS1a03

会議情報

主催: 一般社団法人人工知能学会

会議名: 2025年度人工知能学会全国大会（第39回）

回次: 39

開催地: 大阪国際会議場＋オンライン

開催日: 2025/05/27 - 2025/05/30

生成AIは差別や偏見を強化するのか、それとも是正するのか？

日本の文脈に即した人種・民族バイアスベンチマークの試み

*明戸隆浩, 有賀ゆうアニース, 川口泰司, 宮下萌, 元山仁士郎, 李春熙, ウィンチェスターマーク

著者情報

キーワード: 生成AI, 大規模言語モデル, ベンチマーク, 差別的バイアス, 日本の人種差別

会議録・要旨集フリー

詳細

抄録

生成AIブーム以降、一般ユーザーのAI利用可能性が飛躍的に拡大し、生成AIが生み出す社会的なリスクを社会科学的な観点もふまえて評価するベンチマークの必要性が高まっている。こうした中で本論文では、テキスト生成AIが生み出しうる差別的なバイアス、とりわけ人種・民族にかかわるバイアスに注目し、日本の文脈に即したベンチマークを提案する。こうしたベンチマークについては英語圏で多くのものが提案されており、その日本語版の作成も進められているが、人種・民族はとりわけ社会ごとの文脈が濃い。そのため本論文では既存のベンチマークの方法を引き継ぐ一方、在日コリアン、部落、アイヌ、沖縄、ミックスなどの専門家が協働し、日本の文脈に即した人種・民族ベンチマークの作成および各大規模言語モデルの試論的な評価を行った。その結果、全般的には各モデルとも予想以上に差別やバイアスについてトレーニングされており、バイアス回避にとどまらず積極的に差別を是正する機能も確認された。その一方で、差別の類型や質問の仕方によっては差別やバイアスの問題を生成AIが十分に認識できていないと思われる部分もみつかり、今後の課題も明らかとなった。

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）