人工知能学会全国大会論文集
Online ISSN : 2758-7347
第37回 (2023)
セッションID: 4Xin1-03
会議情報

固有表現抽出によるニューステキスト内の企業名抽出
*田村 光太郎北内 啓高山 温
著者情報
会議録・要旨集 フリー

詳細
抄録

株式会社ユーザベースが提供する経済情報プラットフォーム「SPEEDA」保有のニューステキストデータを利用し、本文に含まれる企業情報を固有表現とみなし抽出を試みた。提案手法は固有表現として抽出された企業名は、抽出部分の周囲にある形態素の情報を利用し、また略称等の表記ゆれを自動生成した企業名辞書とのマッチングを行った。それにより、ニューステキスト情報から企業名とされる情報を抽出し、抽出されたさまざまな企業名を同一企業として特定する。この方法により、企業名の抽出タスクの精度を改善した。

著者関連情報
© 2023 人工知能学会
前の記事 次の記事
feedback
Top