NICTにおける大規模言語モデルの研究開発

大竹 清敬

doi:10.11532/jsceiii.6.1_41

抄録

NICTでは，大規模言語モデル（LLM）やそれを用いたシステムの研究開発を進めている．海外製LLMの学習データに含まれる日本語データはわずかであり，そうしたLLMが広く用いられると，日本独自の文化が失われる等のリスクもあるため，大量の日本語データを用いた国産LLMの開発力を高める必要がある．日本語LLMの学習においては高品質な日本語データが重要である．NICTには，過去15年以上にわたって収集してきた大量のWeb データあり，これを用いた良質な学習データの構築を進めている．ハルシネーションやフェイクニュース等の対策の開発も進めており，現在我々が開発中の，多種のAIを組み合わせるプラットフォーム「WISDOM-LLM」を用いて，LLMが生成したテキストに対し裏を取ったり，根拠のある反論を生成する等が可能である．今後，増えるであろう「野良生成AI」による情報から日本社会を守るためには，複数の「正義を志向する生成AI」が互いに議論し，その結果を受けて人間が意思決定する「民主的AI」の世界の構築に向けた検討も進めている．

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）