主催: 一般社団法人 人工知能学会
会議名: 第34回全国大会(2020)
回次: 34
開催地: Online
開催日: 2020/06/09 - 2020/06/12
金融ドメインにおいて投資家は投資判断等を行うにあたり、株券や社債券の発行に伴って開示される文書から必要となる情報を読み取って、意思決定の材料としている。開示文書は、XBRL形式で公開されており、複数のテキストブロックおよび表から構成され、それらの中に自然言語の形で必要となる情報が散在している。開示文書から必要な情報のみを抽出してDB等で継続的に管理することが意思決定の材料として扱いやすく望ましいが、必要な項目だけでも約50から80項目にわたり、開示文書からそれらを人が読み取り、抽出するのは時間的コストが大きい。本発表では、この開示文書に対して自然言語処理技術を適用し、構文木の木構造に基づくパターンマッチと表解析によって必要情報を抽出した結果について報告する。