主催: 一般社団法人 人工知能学会
会議名: 第34回全国大会(2020)
回次: 34
開催地: Online
開催日: 2020/06/09 - 2020/06/12
市場取引等のために経済ニュースを分析する際,株価変動に影響があるイベントを抽出することは重要である。人が考えたルールでイベントを抽出する場合,ルールが増えるにつれて管理が難しくなるという課題がある。ルールの作成・修正・管理する能力は個人に依るところも大きく,継続的に品質を確保していくことも課題となる。本論文ではこれらの課題を解決するため, 実務に耐えうる機械学習を用いたイベント抽出手法を提案する。 ベースとなる自然言語処理モデルとしては ALBERT を採用した。文章のトークン化には未知語や入力トークン数の制限に起因した情報損失を減らすため,サブワード化の手法である BPE-dropout を採用した。ドメイン知識を本モデルに獲得させるため,分析対象と同じQuick社が提供するニュースを用いて事前学習をおこなった。効果的な事前学習およびファインチューニングを行うため,イベント判定に不要な定型文を削除し,考えらえるニュースとイベントの組み合わせを学習データに追加した。本モデルのイベント抽出精度はF値で0.95を超え,実務に十分に耐えうることを確認した。