ジャフィー・ジャーナル
Online ISSN : 2434-4702
日中ボラティリティの超短期予測とゼロ約定間隔の関係
高 英模
著者情報
ジャーナル フリー HTML

2022 年 20 巻 p. 41-54

詳細
概要

ティックデータを使ったボラティリティの超短期の予測方法について新たな提案と考察を行うのが本稿の目的である. ティックデータから日中ボラティリティを求める代表的な方法としてEngle (2000)のACD-GARCHモデルがある. このモデルの最大の特徴は日中ボラティリティと約定間隔をはじめとするマーケットマイクロストラクチャ要因間の仮説検定を可能にしたところにある. Théoret and Coën [2008]はACD-GARCHモデルを使った日中ボラティリティの超短期予測(3日分)を行う方法を提案した. ただし, 彼らの先行研究ではゼロ約定間隔と日中ボラティリティの関係についての言及はなかった. そこで本稿ではゼロ約定間隔を調整するための高 (2016)によるパラメータ修正を適用した上で, 日中ボラティリティの超短期予測にゼロ約定間隔が与える影響についた考察を行った.

1 はじめに

大山ら(2021)によれば, 2019年11月から2021年3月末までの間に実行された東証全体のIOC(Immediate or Cancel order)の注文件数に占める高速取引行為の割合は実に約8割超に達すると報告されている. 高頻度取引業者にとっては取引スピードこそ重要であり, 高速処理を実現する高性能なハードウェアと, 膨大なデータを処理するソフトウェアを組み合わせて利益の獲得を目指している. 今回の研究では高頻度取引におけるボラティリティの超短期予測に焦点を当てた. ボラティリティの変化は約定価格やリスクに連動する貴重なシグナルと考えることができるので, その予測方法を探求することの意味は大きい.

高頻度取引ではコンピュータの高速性能を活用して小口の分割発注が多用される傾向が強い. これにより, 約定の時系列データには同じタイムスタンプのついたデータが大量に発生する. 約定間隔から投資家行動の分析を行うACDモデルの利用において単純にゼロ約定間隔を削除してしまうと, 実際の市場の密な動き(連続約定)を無視することになってしまう. このことは, ACDモデルのパラメータにバイアスをもたらし, 推定したモデルを利用した仮説検定において誤った結果を導いてしまう可能性をいたずらに増やしてしまう.

高(2020)ではミリ秒単位の約定データ(日経平均先物)を入手し, 分析を行った. ただし, そこでもゼロ約定間隔が一定程度(約20%)ほど存在したが, この場合はトービット型ACDモデルの利用によりバイアスの影響を最小限に押さえたモデルの推定を実現した. 今回利用するデータは後述するように金先物のデータで, 計測単位は秒単位である. この場合, トービット型のモデル推定ではバイアスを解消できないので, 高(2016)による, やや粗い近似であるパラメータ修正という方法を用い, それが超短期のボラティリティ予測に与える影響を考察する. 秒単位のデータでトービット型ACDモデルの優位性が失われる理由は簡単に言えば, 秒単位のデータ(タイムスタンプ)の切り上げ処理にある. 高(2020)に示したように秒単位での切り上げによるバイアスはACDモデルのパラメータ推定にバイアスを生じさせ, その程度はゼロ削除よりもむしろ大きい.

本論文の構成をここで紹介する. 第2節では分析に利用するACDモデルとACD-GARCHモデルの推定手法について述べる. 第3節では解析に利用した東京商品取引所の金先物データの統計量について詳しく確認する. 第4節では約定間隔のACDモデルと, 日中ボラティリティを推定するACD-GARCHモデルによる推定結果を説明し, 続く第5節でティックベースのボラティリティ予測力の比較を行い, 最後に結論と課題を示す.

2 ACD-GARCHモデル

高頻度取引において観測される日中ボラティリティを推定する場合は秒単位やミリ秒単で計測した不等間隔の約定情報を利用する. GARCHモデルのフレームワークを約定間隔に応用したのがEngle and Russell (1998)の提案したAutoregressive Conditional Duration (ACD)モデルである. これは約定間隔が価格変化に及ぼす影響を実証分析可能にした最初のモデルである. また, Andersen and Bollerslev (1997)によれば, 高流動性銘柄の場合, 日中のボラティリティには一日の取引時間の中で, 取引が活発になったり, 逆に落ち着いたりする確定的な時間帯が存在することが示されており, ボラティリティのダイナミクスを表現するモデルを構築する場合, この確定的なトレンドの影響を取り除くことを提案している.

約定間の間隔自体が, 投資家にとって意味のある情報を有しているとした初期の理論研究にDiamond and Verrecchia (1987)やEasley and O'Hara (1992)がある. 彼らは株価の動くメカニズムに焦点を当てたマーケットマイクロストラチャの視点から, 約定間隔の持つ意味を理論モデルを使って提案した. Easley and O'Hara (1992) の主張は結果として非常に分かりやすいもので, 約定間隔が長い場合, そこには有益な情報がなく, 逆に短い場合は情報投資家が有利な情報を持っているというものである. Engle (2000)はこの約定間隔をACD-GARCHモデルに導入して, 瞬間収益率のボラティリティと約定間隔の間に関係性が存在することを示した.

一方, ノンパラメトリックにボラティリティを推定する方法として代表的なものに, Andersen et al. (2001)の提案した実現ボラティリティがある. これはティックデータから日次のボラティリティを求める手法である. ただし, Hansen and Lunde (2006)が示すように単純にすべてのティックデータを用いて実現ボラティリティを計算すると, マーケットマイクロストラクチャノイズの影響を受けてボラティリティを過大評価してしまうことが分かっている. Andersen et al. (2003)が示したボラティリティシグネチャプロットを用いて適切なサンプリング間隔を見つけて, ノイズの影響をできるだけ減らす工夫が必要になる. 一般的にサンプリング間隔は5分から20分位の間になることが多い.

Racicot, Théoret and Coën (2008)はACD-GARCHモデルと, 実現ボラティリティを使った自己回帰モデルよるティックベースの日中ボラティリティ超短期予測の方法をそれぞれ提案した. ただし, 彼らはACD-GARCHモデルの前段で利用するACDモデルの推定において, ゼロ約定間隔を単純に削除している. というのもデータとしてEngle (2000)で利用した1990年のIBM株式のデータを利用したので、同じ要領で処理したにすぎないと思われる. 1990年のIBMデータは僅か10% 程度しかゼロ約定間隔は含んでいなかった.

Engle (2000)よりも, より高速な高頻度取引の実現した今日の取引市場では秒単位のタイムスタンプのついたデータを用いると, 取引の活発な時間帯では多くのゼロ約定間隔が発生してしまう. これは小口連続発注の存在による所が大きい. Pacurar (2006) でも触れているようにゼロ約定間隔の処理方法には確立した対応方法がなく, 多くの先行研究ではEngle and Russell (1998)の方法に倣って, 単純にそれらをデータセットから除外している. しかし, より一層高速化した現在の取引システム下では, 場合によっては半数以上の約定間隔がゼロになってしまい, これを単純に削除することは難しい状況となっている.

本稿では高(2016)で提案したパラメータ修正を利用してゼロ約定間隔の問題に対応し, その結果として秒単位のボラティリティの超短期予測にどのような影響が生じるかを考察することを目標とする.

2.1 約定間隔のACDモデル

本節では約定間隔をモデル化するACDモデルと, そこで得られた調整済み約定間隔$x_{i}$と期待約定間隔$\Psi_{i}$を使って日中ボラティリティを推定するACD-GARCHモデルの概略を紹介する. そして, 約定間隔データの中に存在する膨大なゼロ約定間隔の存在に対応するための対応策としてのACDモデルに対するパラメータ修正(高(2016))の方法について述べる.

Engle and Russell (1998)の提案したACDモデルは不均一な間隔で発生する約定間隔をモデル化したものである. 彼らはGARCHモデルのフレームワークを利用して約定間隔の条件付き期待値として$\Psi_{i}$(期待約定間隔)の存在を仮定した. ここで利用する$x_{i}$は約定間隔の日中トレンドを調整した, 時間変形(time deformation)後における約定間隔である. 実時間における約定間隔は$\tau_{i}\left( =t_{i}-t_{t-1}\right)$と表記してこれと区別する.   

$$E\left( x_{i}|x_{i-1},\ldots,x_{1}\right) =\Psi\left( x_{i-1},\ldots,x_{1};\psi\right) \equiv\Psi_{i}$$ (1)
  
$$x_{i}=\Psi_{i}\epsilon_{i} \label{errterm}$$ (2)
$\epsilon_{i}$は非負の撹乱項である. また, 調整済み約定間隔$x_{i}$と実時間における約定間隔$\tau_{i}$の関係は次の通りである.   
$$x_{i}=\frac{\tau_{i}}{\phi\left( t_{i-1}\right) } \label{detrend}$$ (3)
ここで$\phi\left( t_{i-1}\right) $は日中トレンドを示す関数である. 約定間隔をトレンド関数で除すことで, 調整済み約定間隔$x_{i}$の無条件期待値は$1$となる. Engle and Russell (1998)ではこの処理を時間変形と呼んでいる. 以上の設定の下, $\operatorname*{ACD}\left( 1,1\right) $モデルは次のように定義される.   
$$\text{ }\Psi_{i}=\omega_{1}+\alpha_{1}x_{i-1}+\beta_{1}\Psi_{i-1}\text{ }$$ (4)
本研究ではこのモデルを利用してパラメータ$\omega_{1},\alpha_{1},\beta_{1}$を推定し, 期待約定間隔$\Psi_{i}$を得る.

ここでACDモデルの推定上の課題点と, 高 (2016)の提案した対応方法を簡単に述べる. ACDモデルで流動性の高い金融商品の約定情報(秒単位)を利用すると, 大量のゼロ約定間隔が発生してしまう. 高 (2016)はゼロ約定間隔を削除した場合, (4)式における3つのパラメータのうち, 最も大きなバイアスが生じるのが$\omega_{1}$であることを示し, これを修正してパラメータ全体のバイアスを低減する方法を提案した.

今, 真のモデルがACD$\left( 1,1\right) $モデルに従うとする. ゼロ約定間隔を削除した時の調整済みデータセットを$\left\{ x_{i}^{z}\right\} $とし, その時のサンプルサイズを$N_{z}$とする. この時のパラメータと無条件期待値の関係は次のようになる.   

$$\operatorname*{E}\left( x_{i}^{z}\right) =\frac{\hat{\omega}_{z}}{1-\hat{\alpha}_{z}-\hat{\beta}_{z}}=\frac{\sum_{i=1}^{N_{z}}x_{i}^{z}}{N_{z}}$$ (5)
真の約定間隔がすべてわかっている場合のデータセットを$\left\{ x_{i}^{F}\right\} ,$データの個数を$N_{F}$とすると, これについては次式が成り立つ.   
$$\operatorname*{E}\left( x_{i}^{F}\right) =\frac{\tilde{\omega}_{F}}{1-\tilde{\alpha}_{F}-\tilde{\beta}_{F}}=\frac{\sum_{i=1}^{N_{F}}x_{i}^{F}}{N_{F}}$$

いま, 2つの式を割ることを考える. このステップでは高(2016)の数値実験から得た, やや粗い近似関係として$\hat{\alpha}_{z}\simeq\tilde{\alpha}_{F},\hat{\beta}_{z}\simeq\tilde{\beta}_{F}$を利用する. さらに, ゼロ約定間隔の有無に関係なく, 一日の取引時間は一定なので, $\sum_{i=1}^{N_{z}}x_{i}^{z}=\sum_{i=1}^{N_{F}}x_{i}^{F}$が成り立つことを考えると, 次のような関係を得る.   

$$\frac{\hat{\omega}_{z}}{\tilde{\omega}_{F}}\simeq\frac{\sum_{i=1}^{N_{z}}x_{i}^{z}}{N_{z}}/\frac{\sum_{i=1}^{N_{F}}x_{i}^{F}}{N_{F}}$$
  
$$\tilde{\omega}_{F}\simeq\hat{\omega}_{z}\cdot\frac{N_{z}}{N_{F}} \label{wrev}$$ (6)
このようにしてパラメータを修正することによって, 期待約定間隔$\Psi_{i}$も修正される. ただし, このパラメータ修正には一つの大切な仮定がある. それは, (2)式で示した撹乱項$\epsilon_{i}$の確率過程は, 不変であるというものである. つまり, 取引が疎であったり, 1秒未満の単位で集中しているような密の状態でも撹乱項は同一の確率過程に従うとするものである.

ACDモデルの確率過程を支配する撹乱項$\epsilon_{i}$は非負の確率分布であり, 指数関数など複数のものが考えられるが, ここでは擬似最尤法を利用して指数関数のみのACDモデルを利用することにした.

日中トレンド関数

次に約定間隔の日中トレンドを除去するためのトレンド関数について説明する. ACDモデルの推定では線形スプラインやダミー変数を用いるものが多いが, これではノット点で不連続な状態が生じ, 現実的ではない. そこで高 (2020)では二次関数によるスプライン曲線を利用した. つまり, $\phi\left(t_{i}\right) $を次のように設定する.   

$$\phi\left( t_{i}\right) =p_{m}\left( t_{i}\right) +\sum_{i=1}^{n}c_{i}\left( t_{i}-k_{i}\right) _{+}^{2} \label{trendfunc}$$ (7)
この式で推定するのは$p_{m}\left( t_{i}\right) $のパラメータと$c_{i}$である. 本研究の場合, $p_{m}\left( t_{i}\right)$は9時から9時半までの区間にフィットさせる二次関数である. ノット$k_{i}$は9:30から30分間隔(ノット数11個)で設定する。最後のノットは14:30とする. そして, $t_{i}$は秒単位の約定時刻で, 例えば取引開始の午前9は32400秒とする. 最初に約定データに対してこのスプライン関数によるパラメータ推定を行い, そこで約定間隔の理論値を求め, 最後に(3)式の定義に従って除す.

2.2 日中ボラティリティのACD-GARCHモデル

Engle (2000)はティックベースの約定情報に対応した収益率の条件付き分散を次のように定義した.   

$$V_{i-1}\left( r_{i}|\tau_{i}\right) =h_{i}$$
さらに収益率を未調整の約定間隔$\tau_{i}$で除すことによって瞬間収益率のボラティリティを次のように定義した.   
$$V_{i-1}\left( \frac{r_{i}}{\sqrt{\tau_{i}}}|\tau_{i}\right) =q_{i}^{2}$$
ACDモデルと同じく瞬間収益率についても日中トレンドは存在する. この瞬間収益率のトレンドを除去して調整済みの瞬間収益率を求めたのち, 時間変形後の状態でGARCHモデルを推定する. 調整済み瞬間収益率のボラティリティは$\eta_{i}^{2}$と表記して調整前ボラティリティ$q_{i}^{2}$と区別する. また, トレンドを調整した瞬間収益率を$r_{i}^{a}$という記号を使って表現すると, 時間変形後の平均方程式と分散方程式は次のように記述できる. ここで瞬間収益率$r_{i}^{a}$はEngle (2000)の定義に従って絶対値を利用する.   
$$r_{i}^{a} = c_{1}+c_{2}x_{i}+\varepsilon_{i}$$ (8)
  
$$\eta_{i+1}^{2} = \omega+\alpha\varepsilon_{i}^{2}+\beta\eta_{i}^{2}$$ (9)
上記のモデルは調整済みの瞬間収益率に関する$\operatorname*{GARCH}\left(1,1\right) $モデルを示している. ここで分散方程式に調整済み約定間隔の逆数$x_{i}^{-1}$を導入したACD-GARCHモデルの具体例を示す. これを使ってパラメータの解釈を確認しておく.   
$$\begin{eqnarray}r_{i}^{a} \ &=&c_{1}+c_{2}x_{i}+\varepsilon_{i}\\\nonumber \eta_{i+1}^{2} \ &=&\omega+\alpha\varepsilon_{i}^{2}+\beta\eta_{i}^{2}+\gamma x_{i}^{-1} \label{uhfgarch01}\end{eqnarray}$$ (10)
平均方程式において$c_{2}<0$だとすれば, 調整済み約定間隔が長くなるほど, 収益率は小さくなり, 約定間隔の長さがBad Newsの存在を示していると解釈できる. 一方, 分散方程式(10)では調整済み約定間隔が長くなるほど, ボラティリティは小さくなることが分かる. Engle (2000)ではこのACD-GARCHモデルに, さらにいくつかの変数を追加して日中ボラティリティの推定を行っている.

3 データ

本論文で利用したデータは2014年7月21日から2015年9月7日までの約14カ月分の東京商品取引所の金先物価格のティックデータであり, タイムスタンプは秒単位である. ただし, 最後の3日分は予測力評価の外挿テストに利用した.1 すなわち, ACDモデルとACD-GARCHモデルの推定には2015年9月2日までのデータを用いた. 商品先物の取引システムは株式市場のそれとほぼ同じで, 価格形成メカニズムについてもいくつかの研究がなされてきた. マーケットマイクロストラクチャーの観点から行われた芹田ら (2007) の報告はガソリン市場に関するものであるが, 情報が日中の取引時間にどのように反映されるのか, 4時点(前場と後場の始値と終値)のデータを使ってリターンの分散に関する考察を行い, 前場の取引開始直後の分散が後場のそれよりも大きなるという結論を得た. また, 森保 (2008)は Engle and Russell (2005)の提案したACM-ACD(Autoregressive Conditional Multinomial-Autoregressive Conditional Duration)モデルを使って, 本論文と同じく金先物市場に関する分析を行った. その結果, 価格変化と取引時間間隔には日中季節性が存在すること, さらに取引時間間隔が長くなると, 価格変化が起きる確率が低くなることを報告している. オーダードリブンで取引が行われる仕組みは株式市場と同じである. 金先物の限月は1から6限月までが存在する. つまり, 一日の取引時間の中で, 限月の異なるものが同時に取引されることになる. 本研究では森保 (2006)と同じく, 一日の中で最も取引の多かった限月の価格を接続して長期の時系列データを作成した.

東京商品取引所の取引時間は日中と夜間の2つに分かれている. 2つの取引時間では市場参加者に違いが生じすることを考えて, 本研究では日中立合い(取引時間: 9時から午後3時15分)に絞って分析を行った. 取引数や約定間隔の基本的な統計量を表1に示す. 予測力評価のための最後3日分のデータはこの表には含まない. また, 2015年7月21日の3連休明けのデータも第1回の約定までに5分間も要したので分析対象から除外した.

表1 約定価格と約定間隔の分布(日中立合)
2014年 2015年 全期間
四半期 7-9月 10-12月 1-3月 4-6月 7-9月
金先物の約定%価格(円)
平均 $4281.0$ $4415.4$ $4678.0$ $4649.2$ $4437.6$ $4505.7$
標準偏差 $20.8$ $162.8$ $125.8$ $59.5$ $93.6$ $184.4$
最大値 $4335.0$ $4728.0$ $4957.0$ $4762.0$ $4628.0$ $4957.0$
最小値 $4229.0$ $4176.0$ $4471.0$ $4501.0$ $4285.0$ $4176.0$
約定間隔(秒)
平均 $13.7$ $9.4$ $10.1$ $13.7$ $10.8$ $11.2$
標準偏差 $6.0$ $14.8$ $14.0$ $20.6$ $17.9$ $17.6$
最大値 $363$ $497$ $279$ $411$ $575$ $575$
最小値 $1$ $1$ $1$ $1$ $1$ $1$
約定間隔の個数(個)
全約定間隔 $148,172$ $315,965$ $282,135$ $203,171$ $221,649$ $1,185,616$
ゼロ約定間隔 $69,249$ $176,218$ $152,402$ $103,184$ $127,996$ $643,903$
非ゼロ約定間隔 $78,923$ $139,417$ $129,733$ $99,987$ $93,653$ $541,713$
残存率(%) $53.5$ $44.1$ $46.0$ $49.2$ $42.2$ $45.7$

表1の最下段にある残存率の数値からゼロ約定間隔は, 全約定データの半数以上に達することが分かる. ここで言う残存率とは全約定間隔からゼロ約定間隔を除いた, 間隔が1秒以上の値を取るデータの割合を指す.

筆者の過去のACDモデルの研究においては, 表1に示すようにゼロ約定間隔の存在(多さ)に注目してACD-GARCHモデルの推定とボラティリティに影響を与える変数の関連性について分析を行ってきた. 今回は従来の分析の流れに加えて, 収益率のボラティリティの予測力評価を最終目標とする分析を行うので, 表1に示した多くのゼロ約定間隔の中に価格変化, つまり, ボラティリティの源泉となる情報がどの程度含まれているのか, これも重要なポイントであると考えるに至った. そこで表2として削除されるゼロ約定間隔に含まれる, 価格変化(差分)の情報をまとめてみた. 最初の1週間は日ごとにそして最下段に推定期間全体(2014年7月21日-2015年9月2日)の情報を載せた. 仮に連続したゼロ約定間隔の中で大量の価格変化が発生しているとすれば, 我々は日中ボラティリティを過小評価することになってしまう.

表2 ゼロ約定間隔と一緒に削除される価格変化のティック
曜日 OBS. ゼロ約定間隔の個数 価格差が1以上の個数(絶対値)
$a$ $b$ $b/a\times100$
1,887 788 52 6.60%
4,857 2348 196 8.46%
2,378 1002 82 8.18%
4,532 2036 163 8.01%
2,105 895 62 6.39%
推定期間全体 1,185.616 636,769 37,131 5.83%

*水-火は推定期間の最初の1週間

表2の第1週間目を詳しく見ると, 6% から9\の割合で価格変化の情報が失われているが, 最下段の期間全体の数値を見ると, 約定間隔のゼロ削除によって, 失われる価格変化の情報(表2の右端)は6% に満たない. 単純に考えれば, 高頻度取引を利用する投資家は小口の連続取引により\textquotedblleft 薄利\textquotedblrightを狙うため, 連続約定間にほとんど価格変化が生じないという考えと合致しているようにも考えられる.

話を少し整理しよう. 約半数のゼロ約定間隔のデータを削除したのち, 活発な取引の様子をACDモデルのパラメータに反映するためにパラメータの修正を行い, さらに系列$\left\{x_{i}\right\}$と$\left\{ \Psi_{i}\right\}$を短くなるように修正した. 一方, ボラティリティの源泉となる価格変化については, このゼロ約定間隔とともに削除されたのは6% 程度とごく僅かである. つまり, 今回のデータでは, ゼロ間隔削除の影響をほとんど受けるとなく, 日中のボラティリティをほぼ正確に推定していると考えられる.

ここで念のために今回の研究とRacicot, Théoret and Coën (2008)のフレームワークの違いについて補足しておく. 彼らの研究では日中ボラティリティの推定においてマーケットマイクロストラクチャノイズの影響を無視して, ゼロ約定間隔を削除した後で残っているすべての約定データを利用して実現ボラティリティを推定し, そこから日中ボラティリティを推定する方法を提案している. Hansen and Lunde (2006)はボラティリティシグネチャプロットを作図して, ボラティリティが安定した大きさを示す時間間隔でデータをサンプリングすることを推奨している. そこで, 実際に今回のデータで同プロットを作成したところ図1のようなプロットになり, 5分程度のサンプリング間隔が必要であることが分かった. 従って, ゼロ約定間隔を除くすべてのティックデータを利用するRacicot, Théoret and Coën (2008)のアプローチに従って実現ボラティリティのモデルを利用すると, マーケットマイクロストラクチャノイズの影響で過大評価していまうことが予想できたので, 今回の研究のフレームワークに実現ボラティリティの予測モデルを含めることは避けた.

図1 ボラティリティシグネチャプロット

図2 約定間隔の日中トレンド

4 分析

ACD-GARCHモデルのボラティリティ予測を行う場合, その前段としてACDモデルを推定する. そこで最初に行う処理はトレンド関数の推定である. そのフィット値を使って日中のトレンドを除去してACDモデルを推定し, 調整済み約定間隔を得る. 本節ではACDモデルの推定, それを受けてのACD-GARCHモデルの推定を行う.

4.1 ACDモデルの推定

推定期間における約定間隔のトレンド関数は(7)式を用いて推定する. トレンド関数の様子を図2に示す.

取引開始直後は活発な取引により約定間隔が短く, 昼間にかけて約定間隔が徐々に長くなっていくことが分かる. 午後1時頃に約定間隔は一番長くなり, その後, 徐々に短くなっていく様子が見て取れる. トレンド除去後の調整済み約定間隔$x_{i}$を用いて推定したACDモデルの推定結果を表3に示す.

表3 擬似最尤法を用いたACD モデルの推定結果
パラメータ 推定値 標準誤差$^{\ast}$ z値 p値
$\omega_{1}$ $0.003479$ $0.000109$ $31.89$ $0.0000$
$\alpha_{1}$ $0.064124$ $0.000549$ $116.74$ $0.0000$
$\beta_{1}$ $0.933643$ $0.000565$ $1653.88$ $0.0000$
obs. $541713$ AIC $2.707$

*Bollerslev-Wooldridgeの標準誤差

最初に除去した約半数に及ぶゼロ約定間隔の影響を考慮して, 表2に示した$\omega_{1}$を(6)式を用いて修正する.   

$$\omega_{1}^{\prime}=0.003479\times\frac{541,713}{1,185,616}\simeq0.001590$$

このようにしてパラメータ$\omega_{1}$を修正したら, それに合わせて(5)式から調整済み約定間隔$x$も平均的に小さくなるので, 同じく$0.4569\left( \simeq\frac{541,713}{1,185,616}\right) $を使って短くし, さらに(2)式から期待約定間隔$\hat{\Psi}_{i}$もそれぞれ更新する.

4.2 ACD-GARCHモデルの推定

瞬間収益率についても約定間隔と同じく, 日中トレンドの存在を考慮する必要がある. このトレンドを除去した上でACD-GARCHモデルを推定する.

瞬間収益率の日中トレンドを削除するために利用した2次スプライン関数の曲線を図3に示す.

図3 瞬間収益率のトレンド

先に示した約定間隔のトレンド曲線を上下反転させたような形になっていることが分かる. すなわち, 活発な取引の時間帯では瞬間収益率が大きく, 取引が落ち着いてくる時間帯では逆に小さくなっている.

4.3 パラメータ修正の有無によるモデルの定式化

ここからはパラメータ$\omega$の修正の有無による$x_{i}$と$\Psi_{i}$の違いにより超短期予測に利用するACD-GARCHモデルの定式化にどのような違いが生じるかを見てゆくことにする.

I.パラメータ修正なし(表4)

パラメータ修正の有無に関係なく平均方程式(8)式は変更せず, 一方の分散方程式(10)式に変数を追加していき, AICを比較する形でモデル選択を行っていく. 表4として無修正モデルの選択結果を示す. パラメータ修正を実行しない場合, 分散方程式に追加して有意な結果を得る変数は期待約定間隔のみであった. 約定間隔の期待値が長くなるほど, 日中ボラティリティは小さくなるという結論であり, 一方の平均方程式の調整済み約定間隔の係数は負になっており, 一見, 合理的な結論が得られているように見える. 表4から明らかなように, 分散方程式において期待約定間隔以外の変数を利用しても, AICをこれ以上,改善することはできなかった.

表4 修正前の$x_{i}$と$\Psi_{i}$を利用した時のACD-GARCHモデルの推定結果
方程式(9) 方程式(10)
推定値 標準誤差$^{\ast}$ z値 推定値 標準誤差$^{\ast}$ z値
平均方程式
$c_{1}$ $0.0068$ $2.24\times 10^{-5}$ $304.21$ $0.0067$ $2.25\times 10^{-5}$ $299.00$
$x_{i}$ $-0.0010$ $1.78\times 10^{-5}$ $-122.06$ $-0.0010$ $8.25\times 10^{-6}$ $-116.20$
$\operatorname*{AR}\left( 1\right) $ $0.2922$ $0.0108$ $26.97$ $0.3392$ $0.0083$ $41.01$
$\operatorname*{MA}\left( 1\right) $ $-0.1358$ $0.0114$ $-11.86$ $-0.1768$ $0.0087$ $-20.26$
分散方程式
$\omega$ $9.63\times 10^{-7}$ $4.61\times 10^{-8}$ $20.92$ $1.91\times 10^{-5}$ $1.44\times 10^{-6}$ $13.24$
$\alpha$ $0.0229$ $0.0012$ $19.68$ $0.1001$ $0.0036$ $27.63$
$\beta$ $0.9683$ $0.0012$ $803.68$ $0.3684$ $0.0286$ $12.90$
$1/\Psi_{i}$ $2.81\times 10^{-5}$ $1.13\times 10^{-6}$ $24.82$
$\operatorname*{AIC}$ $-6.3834$ $-6.401$

*Bollerslev-Wooldridgeの標準誤差(obs.:$541713$)

II.パラメータ修正あり(表5)

ここではパラメータ修正の結果, 次に示す4種類の分散方程式を推定することができた. $x_{i}^{\prime}$と$\Psi_{i}^{\prime}$は修正した期待約定間隔,$x_{i}^{\prime}/\Psi_{i}^{\prime}$はショック, $\xi_{i}$はEngle(2000)でも利用されているロングランボラティリティである. 表4のパラメータを修正しないモデルに比べると, 日中ボラティリティの推定にはより多くの変数が関係している可能性のあることが分かる. ここでも平均方程式は4つのACD-GARCHモデルですべて共通とする.   

$$r_{i}^{a}=c_{1}+c_{2}x_{i}^{\prime}+\varepsilon_{i} \label{acdmeaneq}$$ (11)

4種類の分散方程式は次の通りとする.   

$$\eta_{i+1}^{2}=\omega+\alpha\varepsilon_{i}^{2}+\beta\eta_{i}^{2}$$ (12)
  
$$\eta_{i+1}^{2}=\omega+\alpha\varepsilon_{i}^{2}+\beta\eta_{i}^{2}+\gamma_{1}\Psi_{i}^{\prime-1} \label{acdgarch1}$$ (13)
  
$$\eta_{i+1}^{2}=\omega+\alpha\varepsilon_{i}^{2}+\beta\eta_{i}^{2}+\gamma_{1}\Psi_{i}^{\prime-1}+\gamma_{2}x_{i}^{\prime}/\Psi_{i}^{\prime}$$ (14)
  
$$\eta_{i+1}^{2}=\omega+\alpha\varepsilon_{i}^{2}+\beta\eta_{i}^{2}+\gamma_{1}\Psi_{i}^{\prime-1}+\gamma_{2}x_{i}^{\prime}/\Psi_{i}^{\prime}+\gamma_{3}\xi_{i-1} \label{acdgarch3}$$ (15)

表4表5を比較すると明らかなようにパラメータ修正の有無によってAICで選択されるACD-GARCHモデルが, 今回のように異なる場合のあることが分かる. つまり, ゼロ約定間隔を無視すべきではないという立場に立つとパラメータを修正しないことは「定式化の誤り」に陥る可能性がある.

ここでは取引の活発さを示すパラメータ修正を支持する立場に立って, 以下の議論を行う. 平均方程式については4つのモデルでそれぞれ調整済み約定間隔の係数の符号が負になっており, 調整済み約定間隔が長いほど, 瞬間収益率を減少させることが分かる. つまり, Diamond and Verrecchia (1987)の提案した約定間隔が長さがBad Newsの存在を示すとした主張に一致する. 平均方程式の仕様においては, 残差の自己相関を排除すべく, Engle (2000)と同じくARMA$\left(1,1\right) $モデルを利用した. また, ACDモデルの場合と同じく誤差項の分布を考慮してBollerslev-Wooldridgeの標準誤差を求めた.

ACD-GARCHモデルの分散方程式に関する情報を下段に示した. 方程式(13)は分散方程式の説明変数に期待約定間隔の逆数を用いた. 約定間隔の期待値が長いほど, 瞬間収益率のボラティリティは小さくなることを示している. ニュースがなければ, 約定間隔が長くなるというEasley and O'Hara (1992) の提案に一致する. 推定式(14)で追加した$x_{i}^{\prime}/\Psi_{i}^{\prime}$はショックを示す. これもEngle (2000)で示された結果と同じく符号は負となっている. 本研究では統計的な有意性は示されなかったが, AICにおいて若干の改善が見られた.

推定式(15)ではEngle (2000)と同様, 分散方程式にロングランボラティリティのラグ項$\xi_{i-1}$を用いている. ロングランボラティリティとは簡単に言えば, ボラティリティの長期成分である. その計算にはEngle (2000)同様, ひとつのパラメータ$0.005$だけを利用する比較的簡単なSingle Smoothingという手法を利用した. その結果, Single Smoothingのパラメータとして$0.011$という値を得た.   

$$\xi_{i}=0.011\left( r_{i-1}^{2}/x_{i-1}^{\prime}\right) +0.089\xi_{i-1}$$
Engle (2000)ではこのパラメータ用いて計算したロングランボラティリティの半減期が138回と報告されているのに対して, 本研究で得られた半減期は, その約半分の63回となった.2 また, 単純な(12)式の分散方程式に変数を追加して行くと, 推定値$\hat{\beta}$の値が小さくなるというEngle (2000)Bauwens and Giot (2001)で指摘されている現象が今回の分析でも確認できた.

表5 修正した$x_{i}^{\prime}$と$\Psi_{i}^{\prime}$を利用した時のACD-GARCHモデルの推定結果
方程式(12) 方程式(13) 方程式(14) 方程式(15)
推定値 標準誤差$^{\ast}$ z値 推定値 標準誤差$^{\ast}$ z値 推定値 標準誤差$^{\ast}$ z値 推定値 標準誤差$^{\ast}$ z値
平均方程式
$c_{1}$ $0.0068$ $2.24\times 10^{-5}$ $304.22$ $0.0068$ $2.24\times 10^{-5}$ $304.22$ $0.0065$ $3.46\times 10^{-5}$ $188.60$ $0.0065$ $3.49\times 10^{-5}$ $186.89$
$x_{i}^{\prime}$ $-0.0021$ $1.78\times 10^{-5}$ $-122.06$ $-0.0021$ $1.78\times 10^{-5}$ $-122.06$ $-0.0017$ $5.03\times 10^{-5}$ $-33.65$ $-0.0017$ $4.99\times 10^{-5}$ $-34.05$
$\operatorname*{AR}\left( 1\right) $ $0.2923$ $0.0108$ $0.0108$ $0.3392$ $0.0108$ $26.87$ $0.3598$ $0.0087$ $41.16$ $0.3588$ $0.0087$ $41.03$
$\operatorname*{MA}\left( 1\right) $ $-0.1358$ $0.0114$ $0.0114$ $-0.1768$ $0.0114$ $-11.83$ $-0.2005$ $0.0092$ $-21.82$ $-0.1994$ $0.0092$ $-21.68$
分散方程式
$\omega$ $9.63\times 10^{-7}$ $4.61\times 10^{-7}$ $20.92$ $1.95\times 10^{-7}$ $1.44\times 10^{-6}$ $1.44\times 10^{-6}$ $2.43\times 10^{-5}$ $8.01\times 10^{-6}$ $3.04$ $2.42\times 10^{-5}$ $8.33\times 10^{-6}$ $2.90$
$\alpha$ $0.0229$ $0.0229$ $19.67$ $0.1001$ $0.0036$ $0.0036$ $0.0924$ $0.0043$ $21.60$ $0.0929$ $0.0042$ $22.16$
$\beta$ $0.9683$ $0.9683$ $803.68$ $0.3684$ $0.0285$ $0.0286$ $0.3884$ $0.0621$ $6.26$ $0.3840$ $0.0696$ $5.51$
$1/\Psi_{i}^{\prime}$ $1.30\times 10^{-5}$ $5.24\times 10^{-7}$ $1.14\times 10^{-5}$ $1.51\times 10^{-6}$ $7.59$ $1.10\times 10^{-5}$ $1.30\times 10^{-6}$ $8.43$
$x_{i}^{\prime}/\Psi_{i}^{\prime}$ $-3.92\times 10^{-6}$ $5.79\times 10^{-6}$ $-0.68$ $-3.87\times 10^{-6}$ $6.04\times 10^{-6}$ $-0.64$
$\xi_{i-1}$ $0.0008$ $0.0007$ $1.23$
$\operatorname*{AIC}$ $-6.3833$ $-6.4010$ $-6.4251$ $-6.4252$

5 日中ボラティリティの予測

この節ではパラメータ修正の無しの(10)式と, 修正を施した(15)式による日中ボラティリティの予測力を比較する.

説明変数の無い, 最も単純なACD-GARCHモデル(8)式におけるボラティリティの$n$期先の条件付き期待値は次式で与えられる.   

$$\begin{eqnarray}\operatorname*{E}\nolimits_{t}\left[ \eta_{t+n}^{2}\right] \ &=&\frac{1-\left( \alpha+\beta\right) ^{n}}{1-\alpha-\beta}\omega+\eta_{t}^{2}\left( \alpha+\beta\right) ^{n}\nonumber\\\ &=&\frac{\omega}{1-\alpha-\beta}+\left( \alpha+\beta\right) ^{n}\left(\eta_{t}^{2}-\frac{\omega}{1-\alpha-\beta}\right) \label{expt2}\end{eqnarray}$$ (16)

無修正の(10)式の分散方程式で説明変数として$1/\Psi_{i}$を利用している. この $\Psi_{i}$の予測値はARMA(1,1)モデルを使って求める.

一方, パラメータ修正版の予測式(15)式ではショックとして$x_{i}^{\prime}/\Psi_{i}^{\prime}$を利用しているが, これは期待値を取ると1になるので, この変数については係数推定値だけを予測計算に用いれば良い. また, ロングランボラティリティの$\xi_{i}$には$\Psi_{i}$と同じくARMA(1,1)モデルを利用する.

高頻度取引のボラティリティ予測の先駆的な研究としてBollerslev and Wright (2001)がある. 彼らは対数リターンを作成する際に, 収益率としてゼロが存在すると対数リターンが負の大きな値になって, 予測モデルの推定に不都合が生じるため, 次のような変数変換の方法を提案している.   

$$r_{t}^{\ast}=\log\left( r_{t}^{2}+\tau s^{2}\right) -\frac{\tau s^{2}}{r_{t}^{2}+\tau s^{2}} \label{rts}$$ (17)
ここで$s^{2}$は$r_{t}$の標本分散で$\tau$はBollerslev and Wright (2001)の提案に従って0.02とした. 結局, 本研究では推定期間のリターンを(17)式で変換し, $\log\left(r_{t}^{\ast}\right) ^{2}-\mu$としてボラティリティの代理変数とした.

予測結果

本研究と同じく秒単位の約定データを用いたボラティリティの予測力評価を行ったRacicot, Théoret and Coën (2008)と同じく, Mincer-Zarnowitz回帰を用いて予測力の評価を行った. 彼らはシミュレーションした3日分の仮想約定データを用いたが, ここでは3日間(2015年9月3日, 4日, 7日)の日中ボラティリティの予測値(out-of-sample)を利用した. 表6の左端の数値は約定間隔数の累計である. 予測最終日の6860は3日間の約定間隔の合計となっている.   

$$\log\left( r_{t}^{\ast}\right) ^{2}-\mu=\beta_{0}+\beta_{1}\hat{\sigma}_{t}+\epsilon_{t}$$
これはボラティリティの代理変数を被説明変数とし, 説明変数にはボラティリティの条件付き期待値$\hat{\sigma}_{t}$を用いた単純回帰モデルである.

表6 ボラティリティの予測力比較
推定式(10) 推定式(15)
観測値 修正なし 修正あり
1205 (1日分)
 $\hat{\beta}_{1}$ $-9305.48$ $-11786.52$
$\left( 0.0012\right)^{*} $ $\left( 0.0007\right) $
 $R^{2}$ $0.0087$ $0.0096$
3998 (2日分)
 $\hat{\beta}_{1}$ $-8276.32$ $-11311.45$
$\left( 0.0035\right) $ $\left( 0.0012\right) $
 $R^{2}$ $0.0021$ $0.0026$
6860 (3日分)
 $\hat{\beta}_{1}$ $-8013.57$ $-11177.83$
$\left( 0.0046\right) $ $\left( 0.0014\right) $
 $R^{2}$ $0.0012$ $0.0015$

*カッコ内は$p$値

表6から予測期間が延びるほど, ボラティリティの予測力が低下することが$R^{2}$の値から分かる. 一方, パラメータ修正を施した(15)式のほうが, 僅かな差であるが, 説明力に優れていることが分かる. 秒単位のボラティリティ予測ではMincer-Zarnowitz回帰の$R^{2}$は非常に小さな値(小数点以下3桁程度)になるが, この傾向はRacicot, Théoret and Coën (2008)とほぼ同様であり(小数点以下4桁程度), 彼らと同じく予測期間が長くなると, $R^{2}$はさらに小さくなり, 予測力が低下することが確認できる.

ちなみに, 日次データを用いたボラティリティの予測力評価の先行研究にBollerslev and Wright (2001)がある. 利用したデータが異なるので単純な比較はできないが, Mincer-Zarnowitz回帰の$R^{2}$は小数点以下1桁の典型的な単純回帰分析の値となっている. このことから本研究の$R^{2}$のサイズは秒単位データ利用時の特徴と理解することができる.

6 結論

本研究では東京商品取引所で取引されている金先物の約定情報(秒単位)を利用して, ACD-GARCHモデルによる日中ボラティリティの予測力について考察した. Racicot, Théoret and Coën (2008)の研究ではACDモデルに関して, ゼロ約定間隔と日中トレンド関数の推定に関して改良の余地が残されていた. 特に今回利用したデータについていえば, 分析期間中, 約定間隔の残存率が約46% で, 従来の方法では単純にデータの半数以上が失われてしまう. よってここでは高 (2016)によるACDモデルのパラメータ修正を用いてこれに対応し, ACDモデル推定した.

Mincer-Zarnowitz回帰によるACD-GARCHモデルの予測力評価の結果としてはパラメータ修正を施したモデルの予測力が優れているとする結果になったが, もちろん, これは本データに限定した結論であり, すべての先物や証券について同様の主張が通る訳ではない. 本研究の貢献はACDモデルのパラメータ修正の有無により, 日中ボラティリティの予測モデルであるACD-GARCHモデルの定式化に影響することを示したことである.

この報告から明らかなように, ACD-GARCHモデルの日中ボラティリティ計算には比較的多くの計算処理が必要になる. 分析の流れをポイントを絞って簡単に振り返ってみると, 1)ACDモデルのための約定間隔の日中トレンドの推定と削除, 2)ACDモデルの推定, 3)期待約定間価格の推定, 4)ACDモデルのパラメータ修正とそれに伴う約定間隔と期待約定間隔の修正, そしてACD-GARCHモデルの推定の段では, 5)瞬間リターンの日中トレンドの推定と削除, 6)ACD-GARCHモデルの推定と, 7)日中ボラティリティの予測計算, といった具合に7つの大きな計算過程がある. 最後のボラティリティの予測計算では時間にして本データのケースで約7時間程度の計算時間を要した. VaRなどのリスク計算にACD-GARCHモデルによるボラティリティを利用する場合は, この計算過程の複雑さを少しでも効率化する方法を提案する必要があると思われるが, その点は今後の課題としたい.

脚注

1 Racicot, Théoret and Coën (2008)はシミューレションにより作成した3日分価格の価格データを利用したが, ここではout-sampleの実データを利用した.

2 この事は取引参加者を取り巻く技術的環境と取引ルールの更新が結果として価格の情報効率性を高めたことを示唆している.今回の分析で利用したデータは金先物であり, Engle (2000)では約30年前のIBM株式データを扱っているので比較するすべはないが, 取引システムの高速化を物語る一つの指標としてここに記す.

参考文献
 
© 2022 一般社団法人日本金融・証券計量・工学学会(ジャフィー)
feedback
Top