2024 年 31 巻 3 号 p. 1330-1355
日本経済新聞社では,経済分野を中心とした新聞記事と日経企業 DB を保有している.エンティティリンキングを用いて,新聞記事に出現する企業名を日経企業 DB に結び付けることで,特定企業に関する高度な情報抽出への応用に期待ができる.そこで本論文では,新聞記事に出現する企業名と日経企業 ID のリンキングを目的とした,日経企業 ID リンキングシステムを構築する.具体的には,日本経済新聞の新聞記事に記述される企業名に日経企業 ID を付与したデータセットを作成し,企業名抽出モデルと類似度ベースエンティティリンキングモデルから成るパイプラインシステムを実装する.本データセットを用いた評価実験の結果,提案システムは既存システムを上回るリンキング性能を示すことを確認した.さらに,企業 ID リンキング特有の技術的困難性を整理し,提案システムの課題について議論する.