AI・データサイエンス論文集
Online ISSN : 2435-9262
NICTにおける大規模言語モデルの研究開発
大竹 清敬
著者情報
ジャーナル オープンアクセス

2025 年 6 巻 1 号 p. 41-52

詳細
抄録

NICTでは,大規模言語モデル(LLM)やそれを用いたシステムの研究開発を進めている.海外製LLMの学習データに含まれる日本語データはわずかであり,そうしたLLMが広く用いられると,日本独自の文化が失われる等のリスクもあるため,大量の日本語データを用いた国産LLMの開発力を高める必要がある.日本語LLMの学習においては高品質な日本語データが重要である.NICTには,過去15年以上にわたって収集してきた大量のWeb データあり,これを用いた良質な学習データの構築を進めている.ハルシネーションやフェイクニュース等の対策の開発も進めており,現在我々が開発中の,多種のAIを組み合わせるプラットフォーム「WISDOM-LLM」を用いて,LLMが生成したテキストに対し裏を取ったり,根拠のある反論を生成する等が可能である.今後,増えるであろう「野良生成AI」による情報から日本社会を守るためには,複数の「正義を志向する生成AI」が互いに議論し,その結果を受けて人間が意思決定する「民主的AI」の世界の構築に向けた検討も進めている.

著者関連情報
© 2025 公益社団法人 土木学会
前の記事 次の記事
feedback
Top