主催: 一般社団法人 人工知能学会
会議名: 2023年度人工知能学会全国大会(第37回)
回次: 37
開催地: 熊本城ホール+オンライン
開催日: 2023/06/06 - 2023/06/09
投資や企業分析において,伝統的に用いられてきた財務情報や経済指標などのデータに対して,今まで利活用の少なかったテキストデータの利用が進んでいる.金融ドメインにおける自然言語処理の研究では,ある一時点の文書の分析や評価が多く,時系列にわたる分析は一時点の評価を並べたものが主になっている.決算短信や有価証券報告書など,金融ドメインでは定期的に様々な文書が発行・公開されている.投資家を始めとしたこれらの文書の読者は,企業について継続的に注目し,同じ企業の文書について前回発行時からの変化に着目することが多い.多くの銘柄を運用する投資家にとって,それぞれの企業について二時点に存在する文書を隅々まで読み込み,変化した点を見つけることは容易ではない.本研究では,時系列に並ぶ2つの文書に対し,前回発行時の文書との差分や変化を抽出するタスクを提案する.具体的には,同じ企業について書かれた2つの金融文書を用い,同じ項目について書かれた箇所を抽出する.抽出した箇所について,人手によって2文書間の差分を抽出する.また提案したタスクに対し,事前学習言語モデルを実際に適用した評価実験を行う.