主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
大規模言語モデルなどの一部のAIモデルは人間にとって有害な生成をすることで知られている。また将来のAIモデルが、我々の倫理を理解し、適切に振る舞うためのAIアライメント研究がなされている。しかしこれらの研究の多くは英語で行われており、日本語での研究は少ない。そこで本研究ではAIの安全性に対処するためのデータセットとして、規範倫理学の主要な立場である徳倫理を参照したデータセットを作成する。既存の英語の徳倫理データセットの作成方法と同様の構築方法によって新しく日本語のデータセットを作成する。作成されたデータセットは約2万件からなり、ある行為を表す文とその行為に対応する性格特性用語を正しく分類することが求められる。既存の日本語大規模言語モデルで実験したところ、正しく分類するのが困難であることがわかった。また既存の英語の徳倫理データセットとの比較も行った。