自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
応用システム論文(査読有)
企業名の類似度に基づく日経企業 ID リンキングシステムの構築と分析
澤田 悠冶安井 雄一郎大内 啓樹渡辺 太郎石井 昌之石原 祥太郎山田 剛進藤 裕之
著者情報
ジャーナル フリー

2024 年 31 巻 3 号 p. 1330-1355

詳細
抄録

日本経済新聞社では,経済分野を中心とした新聞記事と日経企業 DB を保有している.エンティティリンキングを用いて,新聞記事に出現する企業名を日経企業 DB に結び付けることで,特定企業に関する高度な情報抽出への応用に期待ができる.そこで本論文では,新聞記事に出現する企業名と日経企業 ID のリンキングを目的とした,日経企業 ID リンキングシステムを構築する.具体的には,日本経済新聞の新聞記事に記述される企業名に日経企業 ID を付与したデータセットを作成し,企業名抽出モデルと類似度ベースエンティティリンキングモデルから成るパイプラインシステムを実装する.本データセットを用いた評価実験の結果,提案システムは既存システムを上回るリンキング性能を示すことを確認した.さらに,企業 ID リンキング特有の技術的困難性を整理し,提案システムの課題について議論する.

著者関連情報
© 2024 一般社団法人 言語処理学会
前の記事 次の記事
feedback
Top