主催: 一般社団法人 人工知能学会
会議名: 2022年度人工知能学会全国大会(第36回)
回次: 36
開催地: 京都国際会館+オンライン
開催日: 2022/06/14 - 2022/06/17
自然言語文中のエンティティ名を大規模知識グラフのリソースと対応づけるタスクであるエンティティリンキング(EL)は,質問応答や対話システムなどの基盤技術として注目されている.DBpediaを対象としたELツールとして,DBpedia Spotlight(DS)が提案されている.DSは多言語に対応しているが,特定の言語に特化したELを行うためには,自然言語処理ライブラリOpenNLPの対象言語モデルが必要となる.DSの多言語対応モデルを日本語ELに利用可能であるが,OpenNLPの対象言語モデルを用いる場合と比較して精度は低い.2022年1月現在,OpenNLPの日本語モデルは公開されておらず,DSの日本語対応モデルも公開されていない.本研究では,日本語形態素解析器SudachiをDSに導入し,DSの日本語対応モデルを開発することを目的とする.本研究で開発したDSの日本語対応モデルを用いて,日本語Wikipediaからランダムに抽出した記事の定義文に対して日本語ELを行い,DSの日本語対応モデルと多言語対応モデルの比較評価により,日本語対応モデルの有効性を示した.