人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 2T6-OS-5c-02
会議情報

ラベルの多様性を考慮したDawid-Skeneモデルの拡張
*新 恭兵荒井 ひろみ小山 聡波多野 大督
著者情報
会議録・要旨集 フリー

詳細
抄録

機械学習で利用するラベル付きのデータを集めるために、クラウドソーシングが利用されている。 クラウドソーシングのワーカーの能力や属性にはばらつき・偏りがあり、品質管理が問題となる。 ワーカーの能力を推定し、真のアノテーションを推定する方法が様々提案されているが、それらは真のラベルがただ一つ存在していると仮定している。 しかし、真のラベルがただ一つ存在するのではなく、ラベルはワーカーの属性・立場・コミュニティに強く依存すると仮定する方が自然なタスクも存在する。 そのようなタスクに既存法を適用した場合、少数派の属性のワーカーの意見が無視されてしまい、推定結果にバイアスが入ってしまう可能性がある。 本研究では、ワーカーの属性をベースに、多様性を考慮した能力・ラベル推定のためのモデルを提案する。 提案モデルは、ワーカーの属性の組合わせごとに真のラベルが存在していると仮定した、既存法のDawid-Skeneモデルの自然な拡張になっている。 人工データを用いた実験で、ラベルの傾向が属性によって大きく異なる場合、既存法は少数派の能力を低く推定してしまうが、提案法では適切に推定できることを示す。

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top