2024 年 2023 巻 SWO-062 号 p. 12-
Wikipediaに代表される百科事典的な知識の解説文書が電子化され利用可能となっている。これらの知識の解説文書は、急速に普及した大規模言語モデルの学習データとしてもよく利用されている。解説文書中のテキストの内容から知識グラフを抽出・整理することは、自然言語処理ツールを効果的に利用することで効率化が期待できる。しかし、知識記述の対象領域には違いがあり、対象領域に応じて知識グラフ抽出のためのアルゴリズムを調整することは容易ではない。そこで本発表では、知識記述の対象領域に応じて、特定の要件や特性に合わせてカスタマイズ可能な、知識抽出のための汎用的な自然言語処理インタフェースを提案する。具体的には、Wikipediaの説明テキストを基準とし、独立行政法人労働政策研究・研修機構が整理する職業情報データベースの職務記述テキストを対象に、提案手法の有効性を検討する。