2023 年 2023 巻 FIN-030 号 p. 106-113
近年,投資や企業経営の分野でESG情報の重要性が増大している.ESG情報は,様々な評価会社によりスコア化されたものが比較され,投資判断に用いられるが,ESGスコアの根拠は不明瞭なものが多い.本研究では,ESG分類の他にESG極性分類の属性を文に自動で付与することで,ESGスコアの根拠として考えられるテキストを抽出する.具体的には,有価証券報告書に対しアノテーションを行ってESGラベル分類データセットを作成し,作成したデータセットに対しBERT, RoBERTa, ELECTRA 等の事前学習済み言語モデルをファインチューニングすることで各属性の分類モデルを構築する.その結果,BERT を利用したモデルの分類精度が最も高く,ESG分類についてはF値のマクロ平均で0.857,ESG極性分類については0.782となった.また,未知の企業の報告書を自動分類し,予測確率でフィルタリングすることで,ESGスコアの根拠となりうる文が一定の精度で抽出できることを確認した.