人工知能学会全国大会論文集
Online ISSN : 2758-7347
第34回 (2020)
セッションID: 4Q3-GS-9-04
会議情報

構文解析と表解析による金融開示文書からの情報抽出
*十河 泰弘佐藤 美沙柳井 孝介
著者情報
会議録・要旨集 フリー

詳細
抄録

金融ドメインにおいて投資家は投資判断等を行うにあたり、株券や社債券の発行に伴って開示される文書から必要となる情報を読み取って、意思決定の材料としている。開示文書は、XBRL形式で公開されており、複数のテキストブロックおよび表から構成され、それらの中に自然言語の形で必要となる情報が散在している。開示文書から必要な情報のみを抽出してDB等で継続的に管理することが意思決定の材料として扱いやすく望ましいが、必要な項目だけでも約50から80項目にわたり、開示文書からそれらを人が読み取り、抽出するのは時間的コストが大きい。本発表では、この開示文書に対して自然言語処理技術を適用し、構文木の木構造に基づくパターンマッチと表解析によって必要情報を抽出した結果について報告する。

著者関連情報
© 2020 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top