抄録
本研究では、Xie, Tianらによって提唱されたモデルであるCGCNNを用いて物性値予測におけるデータセットの選択重要性についての検証を行った。検証は入力するデータ構造、入力する材料の組成、データセットの数、教師データ分布の観点で行い、その結果、データセットの数よりも入力する構造、組成、教師データの分布がモデルの精度に多大な影響を及ぼすことが明らかとなった。しかし、本研究では構造、組成、教師データの分布に関する中間値を十分に検証できていないため、次回の研究ではさらに具体的なモデルに対する影響を考察することが必要であると考えられる。