人工知能学会全国大会論文集
Online ISSN : 2758-7347
第38回 (2024)
セッションID: 1G5-OS-26b-03
会議情報

Wikidataを対象としたGPTに基づくエンティティリンキング
*三辻 史哉澤村 勇輝森田 武史
著者情報
会議録・要旨集 フリー

詳細
抄録

テキスト内の固有表現(エンティティ名)を知識ベース内のエンティティと関連付けるタスクであるエンティティリンキング(EL)は,質問応答などの基盤技術として注目されている.既存のEL手法の多くは英語を対象としており,他言語に対応していない場合やリソース不足により性能が低下することがある.本研究では,高度な言語理解と汎化能力を持つGPTに基づく日本語と英語を対象としたEL手法を提案する.提案手法はGPT-3.5-TurboおよびGPT-4にプロンプトを与えて,EL対象文からエンティティ名の抽出とそれに対応するWikipedia URLを生成する.次に,WikidataのSPARQLエンドポイントに問い合わせをして,Wikipedia URLからWikidata IDを取得し,エンティティ名とそのWikidata IDのセットを出力する.LC-QuAD2.0,SimpleQuestions,WebQSPの日本語と英語のデータセットを対象に,提案手法と先行研究手法(PNEL)を比較評価した.その結果,日本語SimpleQuestions以外のデータセットにおいて提案手法はPNELの精度を上回った.

著者関連情報
© 2024 人工知能学会
前の記事 次の記事
feedback
Top