2025 年 6 巻 1 号 p. 41-52
NICTでは,大規模言語モデル(LLM)やそれを用いたシステムの研究開発を進めている.海外製LLMの学習データに含まれる日本語データはわずかであり,そうしたLLMが広く用いられると,日本独自の文化が失われる等のリスクもあるため,大量の日本語データを用いた国産LLMの開発力を高める必要がある.日本語LLMの学習においては高品質な日本語データが重要である.NICTには,過去15年以上にわたって収集してきた大量のWeb データあり,これを用いた良質な学習データの構築を進めている.ハルシネーションやフェイクニュース等の対策の開発も進めており,現在我々が開発中の,多種のAIを組み合わせるプラットフォーム「WISDOM-LLM」を用いて,LLMが生成したテキストに対し裏を取ったり,根拠のある反論を生成する等が可能である.今後,増えるであろう「野良生成AI」による情報から日本社会を守るためには,複数の「正義を志向する生成AI」が互いに議論し,その結果を受けて人間が意思決定する「民主的AI」の世界の構築に向けた検討も進めている.