主催: 一般社団法人 人工知能学会
会議名: 2023年度人工知能学会全国大会(第37回)
回次: 37
開催地: 熊本城ホール+オンライン
開催日: 2023/06/06 - 2023/06/09
近年,言語モデルを知識ベースの代わりに使用することを目的とした研究が多く行われている.言語モデルは構造化された知識ベースと比較して,多くの利点がある.例えば,人手による情報の属性や関係の定義が必要なく,より柔軟かつ効率的に多くのデータを検索することができる.しかし,その性能は発展途上であり,また複合名詞の予測ができないなど,実用段階に至るまでには多くのハードルを残している.本研究では,特に化学に関する専門的な複合名詞の知識に焦点を当て,特定の領域の知識をどの程度正確に抽出することができるか調査を行なった.具体的には,T5を生医学分野の論文で追加学習したSciFiveを利用し,さらにScopusに含まれる抄録データで追加学習を行うことで,化学に関する専門知識の抽出精度向上を図った.追加学習に用いたデータ量によってどのように精度が変化するかを確認した結果,少ない学習データでは精度が低下した一方で、比較的多い学習データでは精度の向上が見られた.以上の結果は,言語モデルから知識を抽出する試みのさらなる可能性を示している.