ジャフィー・ジャーナル
Online ISSN : 2434-4702
機械学習による企業財務指標に基づく自社株買い行動の予測と資産運用への応用可能性
望月 孝太郎田村 空生加唐 丈裕鈴木 智也
著者情報
ジャーナル フリー HTML

2026 年 24 巻 p. 58-78

詳細
概要

上場企業の財務指標を機械学習することで,今後1年間における自社株買い行動の予測可能性を検証した.近年,自社株買いは企業価値の向上策として注目されている.その背景には,東京証券取引所による資本効率の改善要請や上場基準の見直しがある.そこで本研究では,東京証券取引所上場企業を対象に,過去の自社株買い実績と当該時点の財務指標を説明変数とし,ロジスティック回帰やXGBoost等の機械学習モデルを適用した.その結果,自社株買い行動は0.7以上のAUC値で予測可能であり,その発生メカニズムは機械学習できるほど定型的な要素を多く含むと示唆される.

次に,この知見を株式ポートフォリオの銘柄選択に活用することで,資産運用における応用可能性を検証した.機械学習によって自社株買いの発生確率が高いと判断された銘柄群をロング,低いと判断された銘柄群をショートすることで分位ポートフォリオを構築したところ,比較的良好なパフォーマンスが得られ,伝統的なリスクファクターではモデル化できない追加的な収益機会を獲得できる可能性を確認した.

1 はじめに

近年,上場企業に対して資本効率の改善が強く求められている.実際,2023年末時点において,東証プライム市場上場企業の約半数がROE(自己資本利益率)8%未満またはPBR(株価純資産倍率)1倍未満という低水準にとどまっており,企業価値の向上や株主への還元という観点から深刻な課題が存在する.こうした状況を受けて,2023年3月に東京証券取引所はPBRが1倍未満の企業に対して資本効率の改善を求める方針を公表し,企業行動に変化を促している.

資本効率の改善策として注目されるのが,配当政策や自社株買いである.中でも自社株買いは,企業が市場から自己株式を買い戻すことで,EPS(1株当たり利益)の向上や資本構成の最適化を図る施策であり,配当と並ぶ株主還元の手段として世界的にその存在感を高めている.特にアメリカなどの先進国では,Brav et al.(2005)が示すように,自社株買いが配当よりも柔軟性に優れた還元手段として広く活用されており,企業の戦略的な意思決定と深く関わっている.

自社株買いは単なる株主還元の手段にとどまらず,企業の余剰資金の活用,資本構成の調整,市場へのシグナル発信といった多面的な役割を果たす.理論的には,Jensen(1986)が指摘するように,企業内に過剰なフリーキャッシュフローが存在すると,経営者による非効率な再投資が行われることで株主価値を毀損する可能性がある.このようなエージェンシー問題を回避する手段として,自社株買いによる資金の株主還元は有効である.また,Myers and Majluf(1984)の情報の非対称性モデルでは,企業が自社株の過小評価を認識している場合に,その情報を間接的に市場へ伝達するシグナリング手段として自社株買いが機能することを示している.

さらに,自社株買いは株価への影響という観点からも注目されてきた.Vermaelen(1981)は,自社株買いが市場に対する正のシグナルとして機能することを理論的・実証的に示しており,Ikenberry et al.(1995)は自社株買いの発表後も中長期的に市場を上回るパフォーマンスが観測されることから,発表直後の株価上昇は「アンダーリアクション」であることを報告している.これらの知見は,自社株買いが投資家の期待や企業価値の評価に影響を与える重要な経営行動であることを示唆している.

日本企業においても,2000年代以降,自社株買いの活用が徐々に顕著になっており,配当と補完的あるいは代替的な関係にあるとされている.花枝・芹田(2008)によるサーベイ調査では,日本企業が財務の柔軟性維持,株主構成の変化対応,資本効率の向上といった多様な目的で自社株買いを活用していることが明らかにされている.また,上野・馬場(2005)は,自社株買いが単なる利益還元手段にとどまらず,企業のガバナンスや資本政策の文脈で捉えられるべきことを実証的に示しており,その戦略的な重要性を裏付けている.

このように,自社株買いは企業の資本効率改善,エージェンシー問題の緩和,株主構成の調整,さらには市場への情報発信といった複合的な意味合いを持ち,経営戦略の一環として位置づけられている.特に,情報の非対称性が存在する現実の資本市場においては,経営者の将来に対する自信や株価の割安さに対する認識が市場に伝播することにより,株価上昇が観測されるケースも多く,投資家にとっても重要なシグナルと認識されている.

そこで本研究では,こうした理論的・実証的背景を踏まえ,東京証券取引所上場企業を対象に,どのような財務的・属性的特徴を持つ企業が自社株買いを実施するのか,その決定要因を機械学習の手法を用いて分析することを目的とする.具体的には,企業の財務指標(ROE,PBR,配当性向など)と業種や企業規模といった属性情報を用い,自社株買いがどのような状況で実施されるのかを,機械学習により帰納的に抽出する.その際に,ロジスティック回帰やXGBoostなど多様な機械学習モデルを適用し,予測精度に優れた機械学習モデルの観点から,自社株買い行動の発生メカニズムを考察する.

2 先行研究

本研究は,自社株買い行動の発生要因と株価への影響に関する既存研究の知見を踏まえ,機械学習を用いた自社株買い行動の予測および株式ポートフォリオへの応用を試みる.本章では,これまでに蓄積されてきた先行研究において,特に本研究と関連性が高いものを「自社株買い行動の発生要因」と「自社株買い行動の株価上昇効果」に分けて概観する.

2.1 自社株買い行動の発生要因

自社株買いの意思決定には,企業の財務特性や外部環境など多様な要因が考えられている.上野・馬場(2005)は,東証一部上場企業の財務指標と自社株買い行動の関連性を分析したところ,企業規模が大きく,有利子負債比率が低く,相対株価変化率が低い企業ほど自社株買いを行う傾向が強いことを示した.これは,自社株買いが財務の健全性と株式市場での過小評価の認識に基づく行動であることを示唆している.

ガバナンスの観点では,北村・小島(2019)は,外国機関投資家の保有比率が上昇することが地域銀行の自社株買い実施確率を高めることを報告している.これは,株主の圧力が経営行動に影響を与える一例であり,アクティビスト投資家やガバナンス改革との関係も視野に入れる必要がある.

Easterbrook(1984)は,余剰資金を効率的に活用する手段としての自社株買いに注目し,キャッシュリッチな企業ほど株主還元を行いやすい傾向を確認した.これは,エージェンシーコストの削減や投資機会の不足を背景にした行動として解釈できる.

企業のライフサイクルとの関連では,Julio and Ikenberry(2004)は,成熟企業ほど自社株買いを実施する傾向が強く,過去に自社株買いを実施した経験のある企業の方が,再度の実施に対する障壁が低いという傾向を確認した.これは,企業文化や社内の意思決定プロセスが株主還元行動に影響を与えることを示唆している.

自社株買いと配当政策の使い分けに関しては,Jagannathan et al.(2000)が営業外利益率と営業利益率の違いに注目し,米国企業においては,収益の安定性に応じて配当と自社株買いが選好されていることを示した.特に一過性の利益を背景とした自社株買いは,柔軟性を持つ手段として選択される傾向がある.

2.2 自社株買い行動の株価上昇効果

自社株買いには,シグナリング仮説に基づく株価へのポジティブな影響が多数の実証研究によって確認されている.Isa et al.(2011)によると,マレーシアの上場企業において自社株買い実施当日から2営業日後までに平均1.18%の統計的に有意な異常リターンが発生しており,特に小型株においてこの効果が大きいことが示された.

Lin et al.(2011)は台湾市場を対象に,自社株買いアナウンス日からの短期リターンを分析し,特に金融業においてシグナリング効果が顕著であることを報告している.このように,業種特性も株価反応に影響を及ぼす可能性がある.

より長期的な株価効果に関しては,Ikenberry et al.(1995)が米国企業を対象に調査を行い,自社株買いアナウンス後の4年間で平均12.1%,特にバリュー株では平均45.3%という異常リターンが確認された.この知見は,株式のバリュエーションと自社株買いの有効性との関連を示唆するものである.

一方,Ikenberry et al.(2000)によるカナダ市場の分析では,アナウンス後1カ月間の異常リターンは1%以下と小さいが,3年間では年率7%の超過リターンが観測され,やはりバリュー株での効果がより顕著であることが示された.これらの結果は,短期的なシグナル効果と中長期的な収益性の双方から,自社株買いが株式リターンに影響を与えることを示している.

3 自社株買い行動の傾向分析

3.1 分析対象とデータの概要

本研究では上場基準および情報開示水準が高い企業群に注目するため,東証一部上場企業(約2,000社)および2022年4月の市場再編以降は東証プライム上場企業(約1,600社)を分析対象とする.さらに情報開示タイミングをできるだけ揃えるため,3月決算企業に限定する.ただし決算情報が公表されて利用可能となるのは5月頃であるため,この情報遅延を考慮して毎年度5月末時点で入手可能な最新の財務情報を記録する.また,銀行業およびその他の金融業に属する企業は,会計基準や財務構造が他業種と大きく異なるため,分析対象から除外した.分析対象期間は2011年5月末から2024年5月末迄とし,各年5月末時点の財務情報を収集し,全対象企業の年次パネルデータを構築した.

本研究における自社株買いの定義は,公開市場における「市場からの買付」に限定する.ToSTNeT等を通じた相対取引,公開買付(TOB),M&Aの一環として実施されるものは含まない.さらに,従業員への譲渡やストック・オプション付与を目的とした軽微な自社株買いも除外している.株価等の市場データおよび各企業の財務や大株主情報などは日経NEEDS-FinancialQUESTより取得し,企業業績予想に関するデータは東洋経済データサービスを用いた.株価および自社株買い実施の有無は毎月末,財務等の決算情報は5月末時点で統一して記録した.

図1に,分析対象期間における対象企業数(3月末時点)の推移を示す.全体的に増加傾向であり,東証一部上場企業数の増加を反映していると考えられる.2020年度に一時的に対象企業数が減少しているのは,新型感染症の影響によって3月期の決算発表を延期した企業が発生したためである.また,2023年度には東証市場再編により分析対象がプライム上場企業に限定されたことにより,分析対象企業数が減少している.

図1 分析対象企業数の年次推移

3.2 自社株買いの発生割合

自社株買いは企業の資本政策の一部として行われるが,その発生頻度や傾向には企業の属性やマクロ環境が影響すると考えられる.予測モデルの構築に先立ち,発生傾向を事前に把握することは,分析対象となる現象の特徴を理解する上で有益である.本章では,自社株買い行動の年次推移について可視化し,全体傾向の把握を試みる.

図2に自社株買い行動の発生割合を年度毎に集計した結果を示す.各年度において自社株買いを行った企業数を全対象企業数で除算することで発生割合を算出している.例えば2011年度の値は2011年6月1日から2012年5月末日までに発生した自社株買いを基に計算している.2010年代初頭では20%未満の水準にあったが,その後は徐々に上昇を続けており,2021年以降は概ね30%前後の高水準で推移しており,特に2023年度には約40%に迫る水準まで上昇している.この背景には,東京証券取引所による資本効率の改善要請(2023年3月)や,上場基準の見直しを通じた企業改革の影響だと考えられる.これにより自社株買いが企業の資本政策として普及しつつある.

図2 自社株買い行動の年度別発生割合[%](発生企業数/全対象企業数)

3.3 自社株買い後の株価変化率

本節では,自社株買いの実施が株価に与える影響を検証する.2.2章の先行研究では,自社株買いのアナウンスが市場に対してポジティブなシグナルとして機能し,株価を押し上げる効果を持つことが示されている.この効果を本研究のデータセットで確認するため,イベントスタディの手法を用いて,自社株買い実施の前後における株価の推移を分析する.

図3は,自社株買いを実施した全企業を対象に実施年度を基準(相対年数=0)とし,その前後3年間の年次株価変化率を示したものである.ただし市場平均(TOPIXの変化率)を控除することで,市場全体の変動と分離している.具体的な算出方法は以下の通りである.

ある年度tにおいて自社株買いを実施した企業群を集合Ctとし,その企業数をNtとする.各企業kCtの年次リターンをRk,tとし,同年度初日の株価から同年度末日の株価への変化率により算出する.なお同期間のTOPIXの変化率をRM,tとし,これを控除した

  
R k , t = R k , t R M , t # ( 1 ) (1)

を分析対象とする.なお,相対年数をi{3,2,1,0,1,2,3}とし,Rk,tiの時系列変化を分析する.ここでRk,tiは, (ti)年度初日から(ti)年度末日の株価変化率を意味する.ただし企業群Ctにおける平均的な傾向を捉えるために,

  
E [ R t , i ] = 1 N t k C t R k , t i # ( 2 ) (2)

を計算し,図3における細線を描画した.なお凡例に示す年次は,t{2013,2014,,2023}を意味する.一方,太線は横軸iにおけるE[Rt,i]の平均値,帯はE[Rt,i]の±1標準偏差を表す.結果として,自社株買いの発生年度(i=0)において正の株価変化(E[Rt,0]>0)の傾向を目視できる.この傾向が統計的に有意であるかを確認するため,各iにおけるE[Rt,i]の母平均をμとして,片側t検定を実施した.以下にその詳細を示す.

ここで,が標本,が標本数,が標本平均,が標本標準偏差であり,統計検定量は自由度の分布に従うものとする.

  
{ H 0 : μ = 0 H 1 : μ > 0 , T = x ¯ 0 s n # ( 3 ) (3)

表1に検定結果を示す.基準(i=0)においてE[Rt,i]は5%水準で統計的に有意に正であり(t値は2.06),Vermaelen(1981)Ikenberryetal.(1995)が示した「自社株買いは正の情報シグナルとして市場に解釈される」という先行研究と整合的である.

次に,Grullon and Ikenberry(2000)が指摘するように,連続的な自社株買いは初回の実施に比べて株価への影響が弱まる可能性を検証する.そこで,分析対象を「直近1年間に自社株買いを実施していない企業」に限定して,同様に分析した結果を図4および表1に示す.この場合,自社株買いの発生年度(i=0)においてE[Rt,i]の平均値は1.88%,t値は3.10に拡大しており,E[Rt,i]は1%水準で統計的に有意に正である.なお,翌年度(i=1)もt値は2.30に低下するものの5%水準で有意性を持続している.これらの結果は,市場参加者が特に新規の自社株買いをより強いポジティブなシグナルとして解釈する傾向を示唆しており,自社株買いを実施した企業の株価を上昇させる効果が期待される.特に自社株買いの実施前(i<0)において株価変化率の振動を観測できるが,2年前(i=2)に好調だった企業が1年前(i=1)に不調になり,その回復策として自社株買いを選択するのかもしれない.しかし表1においては,いずれも統計的な有意性は確認できない.

図3 自社株買い前後の株価変化率(市場平均を控除)の様子.横軸は相対年数iを示し,自社株買いの発生年度tを基準(i=0)としている.縦軸は式(1)に示すTOPIX控除後の株価変化率[%]であり,凡例に示す細線は各t におけるE[Rt,i] を意味し,太線は E[Rt,i]の平均値,帯は E[Rt,i]の標準偏差を表す.
図4 図3と同様.ただし,直近1年間に自社株買いを実施していない企業に限定した場合.
表1 図3(限定前)および図4(限定後)において,株価変化率E[Rt,i]が有意に正であるかを片側t検定した結果.t値に付与された*と**はそれぞれp<0.05とp<0.01を意味する.

相対年数
i
平均値[%]
(限定前)
標準偏差[%]
(限定前)
t値
(限定前)
平均値[%]
(限定後)
標準偏差[%]
(限定後)
t値
(限定後)
-3 0.73 2.48 0.98 0.30 2.00 0.51
-2 1.29 2.71 1.57 1.35 3.69 1.22
-1 -0.34 2.46 -0.46 -1.22 3.00 -1.35
0 1.23 1.98 2.06* 1.88 2.00 3.10**
1 0.62 1.16 1.70 0.70 0.96 2.30*
2 0.32 1.76 0.55 0.76 1.91 1.19
3 -0.71 2.29 -0.87 -0.01 2.73 -0.10

4 機械学習による自社株買いの予測可能性

本章では,自社株買い行動の予測に機械学習を使用する.自社株買いの発生を予測するために構築した機械学習モデルについて,使用データの設計,モデルの選定と最適化,評価指標および結果を解釈するための可視化について述べる.

4.1 機械学習

予測対象の目的変数は「今後1年間における自社株買いの有無」とし,2値分類問題とする.予測対象企業はこれまでと同様に,東証一部・プライム市場に上場する3月決算企業に限定する.説明変数は,前述の先行研究等を踏まえて選出した.理由については,本節の分析結果を踏まえて後述する.説明変数の詳細を表2に示す.財務指標は,収益性や成長性,財務健全性,市場評価,株主構成など,企業特性を幅広く捉える項目で構成されている.さらに,業種や過去の自社株買い実績に関するフラグを加えた.また,自社株買い利回りとは,企業が実施した自社株買いの総額を該当年度の5月末時点の時価総額で除した指標であり,株主還元の規模を定量的に示す変数として採用した.

表2 機械学習モデルで使用する目的変数(1行目)と説明変数(1行目以外のすべて).標準化得点とは,クロスセクションデータ(同時刻における全銘柄の情報)で標準化した連続値を意味する.

意味 種類
自社株買いの有無(今後1年間) 0(無し)or 1(有り)
配当予想値(公開情報) 連続値
log(時価総額) 標準化得点
予想配当利回り[%] 標準化得点
予想キャッシュフロー/株価 標準化得点
キャッシュリッチレシオ 標準化得点
予想総資産税引利益率[%] 標準化得点
予想自己資本税引利益率(ROE)[%] 標準化得点
予想売上高営業利益率[%] 標準化得点
予想ROA成長率[%] 標準化得点
予想ROE成長率[%] 標準化得点
予想経常利益成長率(5年)[%] 標準化得点
流動比率[%] 標準化得点
固定長期適合率[%] 標準化得点
自己資本比率[%] 標準化得点
有利子負債依存度[%] 標準化得点
総キャピタリゼーション比率[%] 標準化得点
有利子負債/売上高[%]( 標準化得点
60日リターン(3か月リターン) 標準化得点
240日リターン(1年) 標準化得点
240日ボラティリティ(1年) 標準化得点
240日分散(1年) 標準化得点
出来高回転率(1年) 標準化得点
外国人保有率 標準化得点
個人保有率 標準化得点
TOPIX 17業種フラグ
(ただし銀行業と金融業は除く)
0(非該当)or 1(該当)
ROE 標準化得点
PBR 標準化得点
配当性向 標準化得点
自社株買いの有無(直近1年間) 0(無し)or 1(有り)
自社株買いの有無(直近1~2年前) 0(無し)or 1(有り)
自社株買いの有無(直近2~3年前) 0(無し)or 1(有り)
自社株買い利回り(直近1年間) 連続値
自社株買い利回り(直近1~2年前) 連続値
自社株買い利回り(直近2~3年前) 連続値

2値分類問題の機械学習モデルには,k近傍法(k-Nearest Neighbors),サポートベクターマシン(Support Vector Machine),ロジスティック回帰(Logistic Regression),ランダムフォレスト(Random Forest),およびXGBoost(Extreme Gradient Boosting)を採用した.

各モデルの学習および性能評価は,未来情報のリークに注意しつつ,スライディングウィンドウ方式で逐次的に実施した.その様子を図5に示す.毎年5月末時点の企業情報(説明変数)をモデルに入力し,翌年5月末までにおける各企業の自社株買い行動の有無(目的変数)を予測対象とする.例として2013年を予測対象期間とすると,まず機械学習モデルのハイパーパラメータを適当に設定し,2010年の説明変数と2011年の目的変数に基づいてモデルパラメータを学習する.この汎化性能を確認すべく,2011年の説明変数と2012年の目的変数に対して学習済みモデルを適用し,目的変数の判別性能(AUC値)を算出する.この判別性能を最大化するように冒頭のハイパーパラメータを最適化する.本研究ではベイズ最適化(Optuna)により最適なハイパーパラメータを探索した.その後,機械学習モデルのハイパーパラメータを最適値に固定し,再び2011年の説明変数と2012年の目的変数に基づいてモデルパラメータを再学習し,最終的な学習済みモデルを得る.ここまでがインサンプルデータによる機械学習に相当するが,新規のアウトオブサンプルデータ(2013年〜)により学習済みモデルの性能評価をするために,2012年の説明変数を学習済みモデルに入力して2013年の予測結果を得る.これを年毎にスライドさせながら繰り返すことで,2013年5月末から2024年5月末までの予測値を得る.

図5  年毎に学習データをスライドさせながら機械学習および性能評価する様子.

表3に,アウトオブサンプルデータ(2013年5月末から2024年5月末)における各機械学習モデルの分類性能を示す.なお,年度毎で性能を評価し,全期間の平均値を表中に記載した.分類性能の評価指標として,ROC曲線の下面積(AUC),正解率(Accuracy),適合率(Precision),再現率(Recall),F1値を採用した.結果として,ランダムフォレストとXGBoostの評価指標が比較的優れているが,ランダムフォレストは再現率が乏しいため,自社株買い行動の見逃しを防ぐにはXGBoostの方が適している.そこで以降の分析では,主にXGBoostによる結果を示す.

表3 機械学習モデルの分類性能(各年度の平均値).太字は各指標の最大値を示す.

機械学習モデル AUC 正解率 適合率 再現率 F1値
k近傍法 0.63 0.75 0.37 0.06 0.11
サポートベクターマシン 0.69 0.75 0.26 0.11 0.14
ロジスティック回帰 0.71 0.71 0.46 0.43 0.39
ランダムフォレスト 0.72 0.76 0.54 0.28 0.32
XGBoost 0.72 0.68 0.42 0.58 0.47

図6および図7に,XGBoostによる分類の詳細を示す.図5は ROC曲線であり,真陽性率(True Positive Rate)と偽陽性率(False Positive Rate)の関係から,分類閾値によらない全体的な傾向を視覚的に把握できる.結果より,ROC曲線は左上に歪曲しており,AUCは0.7程度であることから,予測モデルは自社株買い行動の判別能力を有していることが確認できる.

図6は,教師ラベル毎にXGBoostからの出力値を集計した頻度分布である.これより,モデル出力値が大きい企業ほど実際に自社株買いを行う傾向が高く,予測モデルの妥当性を視覚的に確認できる.

図6  XGBoostから得られた年度毎のROC曲線およびAUC
図7  教師ラベル(今後1年間の自社株買いの有無)毎にXGBoostからの出力値を集計した頻度分布

4.2 説明変数の解釈と可視化

前節のモデル比較において,XGBoostが高精度かつバランスに優れていたため,XGBoostの学習結果に基づいて説明変数の重要度や目的変数への寄与の仕方を可視化する.

まず図8図9に,各説明変数のFeature Importance(木の分岐に利用された度合い)を示す.図8から明らかなように,最も重要な変数は「自社株買い利回り(直近1年間)」であり,次いで「自社株買い利回り(直近1~2年前)」や「自社株買いの有無(直近1年間)」といった過去の自社株買い実績に関する変数が上位を占めている.これは,企業の自社株買い行動が強い継続性を持つことを示唆している.これらに加え,「外国人保有率」や「log(時価総額)」,「自己資本比率」,「PBR」といった市場評価や財務健全性を示す指標も比較的高い重要度を示している.一方で図9に示すように,「業種フラグ」の重要度はほぼゼロに近く,非常に低いことが確認できる.これらの結果から,自社株買いの意思決定メカニズムは,企業が属する業種といった外的要因よりも,その企業自身の過去の資本政策や現在の財務状況,株主構成といった内的要因に強く依存していることが示唆される.

図8  XGBoostにおけるFeature Importanceが上位の説明変数
図9  XGBoostにおけるFeature Importanceが下位の説明変数

次に,各説明変数のモデル出力に対する寄与の仕方を符号付きで解釈するため,SHAP(Shapley Additive Planations)値を算出した.SHAP値は,個々の予測対象において各説明変数がモデル出力をどの程度押し上げたか(正の寄与),または押し下げたか(負の寄与)を可視化する手法である.つまり全ての予測対象を総合的に解釈するFeature Importanceと異なり,個々の予測対象(企業および年次)に特定して分析できる.そこで「直近1年間に自社株買いを実施していない企業」に限定した場合を図10の左図に示す.これによりFeature Importanceでは支配的であった「自社株買い利回り(直近1年間)」や「自社株買いの有無(直近1年間)」の影響を排除でき,これら以外にも「外国人保有率」や「自己資本比率」などの説明変数も値が高いほど正の寄与が大きく,企業の財務健全性やアクティブな株主構成が自社株買いの実施を後押しする様子を確認できる.これは各説明変数の値が高い(図中の赤い点)ほど,SHAP値も正に大きくなる傾向から読み取れる.なお,各説明変数は寄与度(SHAP値の絶対値の平均値)が大きい順に上から下に配置されている.

一方,Feature Importanceと同様に,企業や年次を特定せずに全ての予測対象におけるSHAP値を図10の右図に示す.やはりFeature Importanceの結果と同様に「自社株買い利回り(直近1年間)」や「自社株買いの有無(直近1年間)」の影響が強く,自社株買い行動の継続性を再確認できる.しかし,他の説明変数については先述の左図と同様の傾向を示しており,直近の自社株買い実績以外の情報もXGBoostの判断根拠になっている.なお,可視化対象の限定の有無によらず,Feature Importanceで重要度が低いとされた「業種フラグ」のSHAP値はゼロ近辺に集中しているため,業種の区別は予測モデルにおいてほとんど影響力を持たないことを再確認できる.

なお,「240日リターン(1年)」や「PBR」においては,Vermaelen(1981)Ikenberry et al.(1995)のシグナリング仮説と整合しておらず,特に新規の自社株買いにおいては株価が好調時に発生確率が高くなっている.この原因として,SHAP値およびFeature Importanceはあくまで学習済みモデルの解釈に過ぎず,必ずしも真の因果関係を表すものではない点について注意を要する.したがって,他の分析方法も併用しつつ,総合的に検討する必要がある.

図10  XGBoostにおけるSHAP値の分布.各点は1企業におけるSHAP値を示している.左図は直近1年間に自社株買いを実施していていない企業に限定した場合,右図は限定せずに全予測対象を表示した場合である.各図の横軸はモデル出力への寄与度,色は説明変数の値の大小を示す.

さらに,各説明変数が自社株買いの発生確率に与える影響を詳細に把握するため,図11および図12に各説明変数と目的変数の関係を可視化した.具体的には説明変数の値に応じて全データを等頻度に80分位した.説明変数は分位毎に平均化し,目的変数は説明変数の分位毎に教師ラベルが1(自社株買い:有り)の割合(発生確率)とモデル出力値(予測確率)の平均値を算出した.両者が重なるほどXGBoostは正しく学習できていると言える.結果として,モデルの予測(赤点)が実際の発生傾向(青点)を概ね正確に捉えられており,特に一部の説明変数において非線形関係を確認できるため,非線形な機械学習モデルであるXGBoostの有用性を裏付けている.その他,可視化から得られる主な考察を以下に列挙する.

・モデル出力値

 モデル出力値(予測確率)は実測値(発生確率)と一致しており,XGBoostは正しく学習できている.

・過去の自社株買い行動と企業規模

「自社株買いの有無(直近1年間)」は,直近1年間に自社株買いの実績があれば将来も自社株買いが発生しやすい.つまり自社株買いは連続して起こりやすい.これは,Julio and Ikenberry(2004)が指摘したように,過去の実施経験が将来の実施障壁を引き下げるという,企業の資本政策における強い継続性を示唆している.一方で,「自社株買い利回り(直近1年間)」については,利回りが高くなるほど翌年の発生確率が低下するという負の相関が見られる.これは,比較的小規模な自社株買いは継続的なプログラムの一環として翌年も実施されやすいのに対し,利回りが高い大規模な自社株買いは一時的な大規模還元策であり,連続して実施されにくい行動パターンを示唆している.

・企業規模

「log(時価総額)」と発生確率の間には,明確な単調増加の関係が確認できる.これは,上野・馬場(2005)の指摘とも整合的であり,事業が成熟し安定的なキャッシュフローを持つ大型企業の方が,成長投資の機会が相対的に少なく,余剰資金を株主に還元しやすいという構造を反映している.

・収益性と成長性

「予想自己資本税引利益率(ROE)」,「予想ROE成長率」,「予想ROA成長率」,「予想経常利益成長率(5年)」といった収益性および成長性に関する変数は,いずれも共通して,標準化得点が平均である0付近で自社株買いの発生確率が最も高くなり,値が0から離れるにつれて発生確率が低下する上に凸の非線形な関係を示している.この傾向は,企業のライフサイクル理論(DeAngelo et al.(2006))と整合的である.すなわち,成長期待が極端に高い「成長期」の企業は,内部資金を事業へ再投資することを優先するため株主還元が抑制される(Myers and Majluf(1984)).一方で,収益性や成長期待が低い企業は,還元の原資となる財務的余力に乏しい(Easterbrook(1984)).結果として,高い収益性を維持しつつも大規模な投資機会が減少した「成熟期」の企業が,最も自社株買いを行いやすい層であると考えられ,これは成熟企業が自社株買いを積極的に活用するというJulio and Ikenberry(2004)の指摘とも一致する.

・財務健全性と資金余力

「自己資本比率」が高い,あるいは「有利子負債依存度」が低いといった財務的に健全な企業ほど,自社株買いの発生確率が高い.これは,安定した財務基盤が株主還元策の前提条件であることを示している.「流動比率」も同様に,低すぎると資金不足,高すぎると非効率な資金管理を示唆するためか,中程度の水準で自社株買いの発生確率が最も高くなる傾向が見られる.これは,企業の財務的余力が,還元行動において重要な役割を果たすというEasterbrook(1984)の議論と整合的である.

・市場評価と還元方針

企業の市場評価が,自社株買いの意思決定に重要な影響を与えていることが複数の指標から示唆される.まず,「PBR」と自社株買いの発生確率の間には負の相関が見られる.同様に「60日リターン」や「240日リターン」も,株価パフォーマンスが市場平均並み(標準化得点0付近)で発生確率が最も高くなる傾向を示している.経営陣が自社の株価を割安,あるいは少なくとも過熱していないと判断した場合に自社株買いを実施するという,Vermaelen(1981)Ikenberry et al.(1995)のシグナリング仮説と整合的である.しかし先述のSHAP分析の結果(図10)と一致しないため,これらの解釈は可能性の一つと捉え,更なる解明については今後の課題とする.なお,「配当性向」は上に凸の関係を示しており,自社株買いが配当政策とのバランスによって決定されていることが示唆される.

・株主構成と資本構成

「外国人保有率」が高い企業ほど自社株買いの発生確率が上昇する傾向は,北村・小島(2019)の分析結果とも一致し,資本効率を重視する株主からのプレッシャーが影響している可能性を示唆する.一方で,「個人保有比率」が高いほど自社株買いの発生確率は低下する傾向が見られ,経営陣が短期的な株価対策よりも長期的な事業投資を優先する可能性を示唆している.また,「総キャピタリゼーション比率」は自社株買いの発生確率と負の相関を示しており,資本構成に占める負債の割合が比較的小さい(自己資本の割合が大きい)企業の方が,株主還元策としての自社株買いを選好する傾向があると考えられる.

図11 各説明変数(x軸)と自社株買いの発生確率(y軸)の相関図

図12 図11の続き

5 株式ポートフォリオ運用への応用可能性

5.1 株式ポートフォリオの構築

第4章にて,自社株買い行動の予測可能性を確認した.本章ではこの知見の応用例として資産運用業務に着目し,自社株買い発生の予測確率(モデル出力値)を用いた株式ポートフォリオを構築し,その運用成績を検証する.第3章にて確認されたように,自社株買い行動には株価を上昇させる傾向がみられることから,自社株買い行動が予想される企業を優先的にポートフォリオに組み入れることで,運用成績の改善が期待される.

本節では,各企業(銘柄)に対して自社株買い実施の予測確率を算出し,その値に基づいて株式ポートフォリオを構築する.具体的には前章の図5と同様に,スライディングウィンドウ方式によりハイパーパラメータの最適化およびモデルパラメータの再学習を経て,新規のアウトオブサンプルデータを予測対象とした.これを年毎にスライドさせながら繰り返し,2013年5月末から2024年5月末までの予測結果(自社株買い実施の予測確率)を得た.

なお前章と同様に,説明変数には毎年5月末時点の公開情報を用いる.理由として,3月期決算の情報が市場で広く利用可能になるのは同年5月頃であるためである.この情報遅延を考慮し,毎年5月末に機械学習モデルを更新し,その予測値(自社株買い実施の予測確率)に基づいて株式ポートフォリオをリバランスする.新たなポートフォリオは翌6月初日から運用を開始し,翌年5月末まで1年間保有することとした.各銘柄の予測確率に基づき,全銘柄を3分位化し,等金額ウェイトで各分位に対応するロング(購入)ポートフォリオを構築した.また,参考比較として,予測対象期間において実際に自社株買いを実施した銘柄群のロング(購入)ポートフォリオも構築した.ただし予測時においてはこれらの銘柄群は未知であるため,現実的には売買できない理想状態である.このロング(購入)ポートフォリオを,本稿では「完全予見」と呼ぶことにする.さらに,モデル出力値が下位分位の銘柄をショート(空売り)かつ上位分位の銘柄をロング(購入)することで構築したロングショートポートフォリオのリターンも算出し,銘柄選択における予測確率の有用性を検証した.

運用成績の評価では,市場全体の変動による影響を排除するため,ロングポートフォリオのリターンからTOPIXのリターンを控除した超過リターンを算出した.具体的には,第m月におけるポートフォリオpのリターンをRp,m,TOPIX(配当込み)のリターンをRM,mとすると,ロングポートフォリオの超過リターンRp,mは,

  
R p , m = R p , m R M , m # ( 4 ) (4)

となり,これを m=1Rp,m のように月毎に累和したものを「累和超過リターン」と称し,図13および図14の時系列推移を描画した.なお,ロングショートポートフォリオにおいては,上位分位のロングポートフォリオをp1,下位分位のロングポートフォリオをp2と書くと,

  
R p , m = ( R p 1 , m R M , m ) ( R p 2 , m R M , m ) = R p 1 , m R p 2 , m # ( 5 ) (5)

となるため,超過リターンRp,mの算出においてTOPIXの控除は不要である.

各ポートフォリオの累和超過リターンを図13に示し,超過リターンの統計的評価を表4に示す.図13によれば,運用成績は概ね分位順(完全予見>予測確率上位>予測確率中位>予測確率下位)に並んでおり,予測確率の有用性を確認できる.表4においては,予測確率上位のロングポートフォリオの年率シャープレシオは1.11と良好な超過リターンを示している一方,予測確率下位のロングポートフォリオの年率シャープレシオは-1.22と負の超過リターンを示した.これらを組み合わせることで,ロングショートポートフォリオ(SP)の年率シャープレシオは1.22となった.

3.3章の分析で確認したように,新規の自社株買いによるアナウンスメント効果の観点から運用対象を「直近1年間に自社株買いを実施していない企業」に限定した場合を図13および表4に示す.これらから明らかなように,予測確率上位のロングポートフォリオおよびロングショートポートフォリオの運用パフォーマンスは改善されており,特に年率シャープレシオは1.28や1.40に向上しており,3.3章と整合する結果が得られた.なお予測確率下位のロングポートフォリオにおいては,自社株買いをしないことが相対的に市場評価を下げるためか,運用成績はマイナスになっている.

さらに,図13図14における時系列推移をみると,特に2020年中頃から2023年にかけて運用成績が停滞する傾向にある.この背景には,新型感染症の拡大に伴う経済の先行き不透明感の高まりが影響していると推察される.このような環境下では,企業が手元資金を将来の不確実性に備えて内部留保せず,自社株買い行動に投じることが,必ずしも市場からポジティブに評価されなかった可能性が考えられる.その結果,自社株買い行動のシグナル効果が一時的に減衰したと解釈できる.一方で,経済活動が正常化に向かった2023年後半以降においては,特にロングショートポートフォリオ(SP)に改善の兆しが見えており,平時における本予測モデルの有用性が回復している様子を確認できる.

図13 自社株買いの予測確率に基づくポートフォリオの累和超過リターンの推移(全銘柄を運用対象とした場合)
図14 図13と同様.ただし,直近1年間に自社株買いを実施していない企業を運用対象とした場合.
表4 分位ポートフォリオのパフォーマンス

運用対象銘柄 ポートフォリオ 年率リターン[%] 年率リスク[%] 年率シャープレシオ
全銘柄
図13
予測確率上位 1.21 1.09 1.11
予測確率下位 -1.96 1.60 -1.22
SP(上位-下位) 3.19 2.60 1.22
直近1年間に自社株買い
を実施していない企業
図14
予測確率上位 2.11 1.64 1.28
予測確率下位 -1.97 1.51 -1.30
SP(上位-下位) 4.11 2.92 1.40

5.2 アルファの有意性検定

5.1章で構築したポートフォリオの超過リターンRp,mが,既存の伝統的なリスクファクター以外の収益機会(アルファ)を有しているかを検証する. そこで次式の重回帰式において,伝統的なFama-Frenchの3ファクターをコントロール変数とし,切片αの有意性を検定する.

  
R p , m r f , m = α + β M k t f m M k t R F + β S M B f m S M B + β H M L f m H M L + e m # ( 6 )

ここでrf,mは無リスク金利,fmMktRFは市場ファクターリターンから無リスク金利を控除したもの,fmSMBはサイズファクターリターン,fmHMLはバリューファクターリターンであり,それぞれKenneth R. French - Data LibraryにあるFama/French Japanese 3 Factorsを用いた.この重回帰分析の結果を表5および表6に示す.

表5の全銘柄を運用対象とした場合では,予測確率上位のロングポートフォリオのαは統計的に有意でないが,予測確率下位のロングポートフォリオでは0.1%の有意水準でαは負,ロングショートポートフォリオでは1%の有意水準でαは正となった.これらの符号は図12と整合的である.

次に,表6に運用対象銘柄を限定した場合では,予測確率上位のロングポートフォリオおよびロングショートポートフォリオにおいてαの有意性が強化されている.このことから新規の自社株買いによる株価上昇には,既存の伝統的なリスクファクターでは表現できない固有の収益機会が含まれていると示唆される.

次にFama-Frenchの3ファクターの係数βに着目する.予測確率上位のロングポートフォリオでは,いずれのβも統計的に有意な水準で負の値を示している.まず,βMktが負であることは,ロングポートフォリオが市場全体の上昇局面では相対的に低迷し,下落局面では相対的に堅調に推移するディフェンシブな特性を持つことを意味する.上昇局面では自社株買いの動機が縮小し,下落局面では自社株買いの動機が高まるといった背景が考えられる.次に,βSMBが負であることは,ロングポートフォリオが大型銘柄にウエイトを置いた構成であり,時価総額が大きい企業ほど自社株買いを実施しやすい傾向(図11)と整合的である.最後に,βHMLが負であることは,ロングポートフォリオが簿価時価比率(1/PBR)の高いバリュー銘柄と逆の特性を持ち,予測確率上位の企業ほど自社株買いによって資本効率を改善する企業行動と整合的である.なお,予測確率中位のロングポートフォリオでは,ほぼ全てのβにおいて有意性は消滅する.さらに,予測確率下位のロングポートフォリオでは,全てのβにおいて符号が反転し,予測確率上位と真逆の傾向を確認できる.

表5 Fama-Frenchの3ファクターによるアルファの有意性検定(全銘柄を運用対象).

t値に付与した*,**,***はそれぞれp<0.05, p<0.01, p<0.001を意味する.

予測確率上位 予測確率中位 予測確率下位 SP(上位-下位)
係数 t値 係数 t値 係数 t値 係数 t値
α 0.034 0.79 -0.027 -0.84 -0.316 -6.32*** 0.247 3.01**
βMkt -0.047 -4.08*** -0.016 -1.83 0.059 4.40*** -0.107 -4.88***
βSMB -0.081 -3.6*** 0.001 0.08 0.010 3.90*** -0.174 -4.14***
βHML -0.066 -4.52*** -0.036 -3.33*** 0.086 5.07*** -0.157 -5.66***
表6 表5と同様.ただし,直近1年間に自社株買いを実施していない企業を運用対象とした場合.

予測確率上位 予測確率中位 予測確率下位 SP(上位-下位)
係数 t値 係数 t値 係数 t値 係数 t値
α 0.100 2.25* -0.154 -3.46*** -0.265 -5.50*** 0.318 3.37***
α -0.032 -2.67** -0.012 0.97 0.059 4.62*** -0.090 -3.58***
βSMB -0.056 -2.50* 0.018 0.78 0.096 3.19** -0.162 -3.36***
βHML -0.082 5.47*** 0.015 1.02 0.089 5.44*** -0.173 -5.4***

6 まとめ

本研究では,東京証券取引所上場企業を対象に,企業の財務指標を用いて自社株買い行動の発生を予測する機械学習モデルを構築し,その応用可能性について検討した.XGBoostをはじめとする複数のモデルを比較検証した結果,自社株買い行動の発生メカニズムには一定のパターンが存在し,F1値やAUC等の評価指標において良好な予測性能を確認した.さらに特徴量重要度やSHAP分析により,過去の自社株買い実績や自社株買い利回りが重要な予測因子であるものの,新規に自社株買いを実施する企業においては,PBR等による市場評価や,自己資本比率といった財務健全性,外国人保有率などの株主構成も寄与度が高く,XGBoostの判断根拠に用いられることを確認した.しかしPBRに関する影響など,各分析で結論が一致しない因果については,更なる検証を要する.なお,業種による影響はいずれの分析においても限定的であった.

さらに,自社株買いのアナウンスメント効果の観点により,連続的な自社株買いよりも,新規の自社株買いの方が,より強い株価上昇効果を有することを確認し,これを株式ポートフォリオの組入れ条件に加えることで運用パフォーマンスを改善できた.この株式ポートフォリオの超過リターンに対してFama-Frenchの3ファクターをコントロール変数として重回帰分析した結果,統計的に有意な正の切片(アルファ)を確認でき,伝統的なリスクファクター以外の追加的な収益機会の存在が示唆された.

以上の結果から,自社株買い行動は機械学習によって高い精度で予測可能であり,得られた予測モデルに基づいて上場企業の資本政策に関する決定メカニズムの理解を深めるだけでなく,資産運用における株式ポートフォリオの銘柄選択にも応用できる可能性がある.

謝辞

本稿の内容は筆者個人の見解であり,所属組織の公式見解ではありません.本研究はJSPS科研費(20K11969)の助成により行われました.ここに記して感謝の意を7表します.

〔参考文献〕
 
© 2026 一般社団法人日本金融・証券計量・工学学会(ジャフィー)
feedback
Top