2024 年 21 巻 p. 107-125
2010年代以降、不正会計検知モデルの構築を目的として、財務指標を特徴量とする研究だけではなく、テキスト分析によって抽出されたテキストに関する要素を特徴量とする研究が進展している。このレビューでは、米国市場の上場企業のForm 10-Kのテキストを用いて不正会計検知モデルを構築した研究を対象として、特徴量の抽出過程や構築したモデルの検知精度などに焦点を当てながら、2010年から2020年までの8本の文献のサーベイを行う。レビューを通して先行研究の成果を整理した上で、次の5つの課題を提示した。1)“bag of words”アプローチによる研究は、抽出された特徴量(単語)がなぜ不正会計検知に寄与したのかについての解釈と理論化に課題がある。2)テキストに関する特徴量と、財務指標の特徴量の間には不正会計検知について補完関係がある。今後の研究では、どのような財務指標がテキストに関する特徴量と高い補完関係を有するのかを明らかにする必要がある。3)分析対象をForm 10-K全体とする場合と、MD&Aセクションなどの特定のセクションに限定する場合での不正会計検知モデルの精度比較がされていない。4)不正会計サンプルと非不正会計サンプルのサンプリングとしてマッチドサンプリング以外の方法を採用する研究蓄積と、5)時系列データによるモデリングを行う研究蓄積が必要である。