主催: 一般社団法人 人工知能学会
会議名: 2024年度人工知能学会全国大会(第38回)
回次: 38
開催地: アクトシティ浜松+オンライン
開催日: 2024/05/28 - 2024/05/31
テキスト内の固有表現(エンティティ名)を知識ベース内のエンティティと関連付けるタスクであるエンティティリンキング(EL)は,質問応答などの基盤技術として注目されている.既存のEL手法の多くは英語を対象としており,他言語に対応していない場合やリソース不足により性能が低下することがある.本研究では,高度な言語理解と汎化能力を持つGPTに基づく日本語と英語を対象としたEL手法を提案する.提案手法はGPT-3.5-TurboおよびGPT-4にプロンプトを与えて,EL対象文からエンティティ名の抽出とそれに対応するWikipedia URLを生成する.次に,WikidataのSPARQLエンドポイントに問い合わせをして,Wikipedia URLからWikidata IDを取得し,エンティティ名とそのWikidata IDのセットを出力する.LC-QuAD2.0,SimpleQuestions,WebQSPの日本語と英語のデータセットを対象に,提案手法と先行研究手法(PNEL)を比較評価した.その結果,日本語SimpleQuestions以外のデータセットにおいて提案手法はPNELの精度を上回った.