2025 年 2025 巻 FIN-034 号 p. 127-131
本研究では、金融商品取引法に基づいて提出される大量保有報告書における担保契約等重要な契約に関する情報の抽出・構造化手法を提案する。大量保有報告書では保有株券等に関する貸借契約、担保契約、売戻し契約、売り予約その他の重要な契約又は取決めについて記載することが株券等の大量保有の状況の開示に関する内閣府令(通称5%ルール)により義務付けられている。該当情報は自然言語の形式で提出されることから、データの収集・分析を行う過程で多くの時間が必要となる。そこで、本研究では大量保有報告書に記載される担保契約等重要な契約を種類ごとに抽出・構造化することを目的とする。具体的には、EDINETを用いて取得した大量保有報告書より抽出した契約に関する文章をBERT/大規模言語モデル(LLM)の2種類を用いて構造化を行い、その精度を評価する。