科学的文書に記載の,物理量間の定量的関係を表す数式とその周辺の文章から,数式中の物理量を示す変数と,変数が何を示しているかを説明する文節を抽出する試みを行った.数式および変数の抽出後,数式の周辺の文章から変数を含む文をプログラムにより抽出し,変数を含む文から変数の説明文節を抽出(相当する文節が無い場合はnullを出力)する試みを,ルールベース,構文解析+ルールベース,深層学習,の3つの方法で行った.
構文解析の有無にかかわらずルールベースでは設定すべきルールが見かけから想像される数より非常に多く,かつ,ルールに合致しても各ルール毎にnullとnotnullの判別機械学習が必要になることが判明した.BERTのfine-tuningを利用した深層学習では,4000~4500個のラベル付き学習データを用意することで,7割を超える正答率で変数の説明文節を抽出することができた.