2024 年 31 巻 4 号 p. 1598-1634
デジタルプラットフォーム上の誹謗中傷に対する社会的関心が高まっており,その性質の理解と対策に向けたデータセットや自動検出の研究が進められている.既存のデータセットでは,誹謗中傷の主観的な性質とクラウドソーシングなど非専門家によるアノテーションを実現するために,タスクを単純化や主観的な判断に依存することで,実際問題との乖離や社会・文化的文脈の考慮不足といった課題があり,社会科学の専門知識を活用しながら,誹謗中傷問題を個々の社会に合わせて調整するアプローチが必要である.そこで本論文では,日本の裁判例を基に誹謗中傷検出に向けた日本語データセットを提案する.我々のデータセットは,オンライン上の発言に対して,名誉権や名誉感情といった法的権利と,その権利に対する裁判所の判断を誹謗中傷のラベルとして利用している.さらに,自動検出手法の検証によって,実際上の問題とのギャップを明らかにし,課題点に対する検討を行っている.この研究は,誹謗中傷の問題に実際の社会問題に即したデータセットの構築により,配慮されたコンテンツモデレーションの実践を目指すとともに,他のドメインからの専門知識の活用に関する議論の基盤を提供することを目指している.