人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 3Xin4-45
会議情報

日本語単語埋め込みモデルにおけるジェンダーバイアスの評価
*酒井 新太朗鈴木 泰博
著者情報
会議録・要旨集 フリー

詳細
抄録

自然言語処理の分野における発展により,単語埋め込みモデルは単語の意味を低次元のベクトル空間で表現することを可能にした.単語埋め込みモデルは様々なタスクで応用されているが,性別や人種に関するバイアスを含むことが過去の研究で報告されている.単語埋め込みモデルにおけるバイアスを検証する研究は年々増えているが,日本語のモデルにおけるバイアスを検証した研究はほとんどない.本研究では,日本語Wikipediaの全記事によって学習されたモデルを用いて,日本語における単語埋め込みモデルの職業におけるジェンダーバイアスを検証した.その結果,看護師や歯科衛生士などの一部の職業が,強い女性バイアスをもっていることがわかった.また,これらの女性バイアスの強さは,それぞれの職業における女性の割合と強い相関関係があることがわかった(ρ = 0.78 with p < .001).以上から,日本語の単語埋め込みモデルにおいても,職業におけるバイアスが存在し,それらのバイアスは職業内の性別の不均衡の度合いを反映していることがわかった.

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top