無機材料の合成プロセス予測のための大規模言語モデルの応用

鈴木 雄太; 栗田 修平

doi:10.11517/pjsai.JSAI2025.0_3Win575

抄録

材料研究において、所望の性質を持つ材料の合成には、適切な合成プロセスの設計が重要だが、その探索には膨大な時間と労力が必要となる。本研究では、所望の材料の組成を入力として、その材料の原料および合成プロセスを提案するAIシステムの開発を目指す。このために合成プロセスのデータセット構築および、大規模言語モデル（LLM）の学習・評価を行った。まずデータセット構築のため大規模論文コーパス（S2ORC）から100万件の論文を抽出し、TF-IDFベクトルを用いたクラスタリングにより材料科学論文をスクリーニングの後、LLM（Google Gemini 2.0 Flash）を用いて合成手順の抽出および構造化を行い、1.7万件の合成手順を抽出し学習用データセットとした。続いてこのデータをもとにLLM（Llama 3.1 8B）に追加学習を行い、新材料についても概ね妥当な合成プロセスを提案できることを明らかにした。

著者関連情報

お気に入り & アラート

閲覧履歴

責任著者(Corresponding author)

会議情報

J-STAGEへの登録はこちら（無料）