日本語単語埋め込みモデルにおけるジェンダーバイアスの評価

酒井 新太朗; 鈴木 泰博

doi:10.11517/pjsai.JSAI2023.0_3Xin445

抄録

自然言語処理の分野における発展により，単語埋め込みモデルは単語の意味を低次元のベクトル空間で表現することを可能にした．単語埋め込みモデルは様々なタスクで応用されているが，性別や人種に関するバイアスを含むことが過去の研究で報告されている．単語埋め込みモデルにおけるバイアスを検証する研究は年々増えているが，日本語のモデルにおけるバイアスを検証した研究はほとんどない．本研究では，日本語Wikipediaの全記事によって学習されたモデルを用いて，日本語における単語埋め込みモデルの職業におけるジェンダーバイアスを検証した．その結果，看護師や歯科衛生士などの一部の職業が，強い女性バイアスをもっていることがわかった．また，これらの女性バイアスの強さは，それぞれの職業における女性の割合と強い相関関係があることがわかった(ρ = 0.78 with p < .001)．以上から，日本語の単語埋め込みモデルにおいても，職業におけるバイアスが存在し，それらのバイアスは職業内の性別の不均衡の度合いを反映していることがわかった．

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）