主催: 一般社団法人 人工知能学会
会議名: 2023年度人工知能学会全国大会(第37回)
回次: 37
開催地: 熊本城ホール+オンライン
開催日: 2023/06/06 - 2023/06/09
自然言語文中のエンティティ名をWikidataなどの大規模知識グラフのリソースと対応づけるタスクであるエンティティリンキング(EL)は,質問応答などの基盤技術として注目されている.最先端のEL研究は英語を対象としており,日本語を対象としたEL研究は少ない.ELモデル構築には言語モデルや知識グラフ埋め込みを利用しており,日本語ELモデルを構築するにはこれらの日本語対応が必要となる.本研究では,英語ELモデルを日本語対応するための課題の分析を行う.まず,Wikidataを対象とした英語ELモデルであるPNEL(Pointer Network based Entity Linker) を再利用し,言語依存の埋め込みを変更することにより,日本語ELモデルを構築する.次に英語データセットであるwebQSP,SimpleQuestions,LC-QuAD2を日本語に翻訳し,日本語と英語ELモデルの比較評価を可能にする.最後に,埋め込み手法の観点からELモデルの言語間の精度差を分析し,日本語ELモデル構築の課題を考察するとともに,今後の展望について述べる.