為替では,取引の活況具合に応じて,取引の発生が疎らな時間帯,密になる時間帯に分かれる為替取引のクラスタ現象や,相場でのリスクの増減に応じて,価格の変動が小さく推移する時間帯,急激な価格の上下変動が持続する時間帯に分かれるボラティリティクラスタリング現象が確認でき,相互に関連しあう様に見える.本論文では,為替ティックデータを用いて,指値や取引の発生間隔の粗密,量の増減,価格変動の増減の相互の関係を明らかにしたい.
Cont et al.(2014)は,時系列データをもとに,指値注文の価格変動と量の関係を調査し,Shibata(2006)は,マーク付点過程データを用いて,取引の発生間隔と価格変動の関係を調査する.我々は,指値や取引の発生間隔と価格変動,量といった変量の関係に興味があるので,Shibata(2006)のモデルとCont et al.(2014)のモデルを統合することで,これらを同時に捉えることのできるモデルを構築した.
そして,為替の取引発生の粗密から得られるクラスタ区分上で,指値や取引の発生間隔,量,価格変動の関係を調査した.本論文の貢献は,クラスタ区分上で,指値や取引の発生頻度と価格変動,価格インパクトなどの要約量の間の相関を確認したこと,時間軸を均等に区切ることで得られる30分等間隔の区分上では隠れて確認できない価格変動に伴う価格インパクトやデプスなどの動きを視覚化したこととなる.
為替では,取引の活況具合に応じて取引の発生が疎らな時間帯と密になる時間帯に分かれる為替取引のクラスタ現象や,相場でのリスクの増減に応じて価格の変動が小さく推移する時間帯と急激な価格の上下変動が持続する時間帯に分かれるボラティリティクラスタリング現象が確認できる.この2つの現象は相互に影響を与えている可能性が十分考えられるものの,詳しく調査している研究はあまりない.そこで,この章は為替ティックデータを用いて,指値注文や取引注文の発生間隔,量,価格の変動量といった変量の相互の関係を明らかにすることで,2つのクラスタ現象の相互の影響を詳しく調査する.
為替ティックデータは,取引の発生や指値の提示,キャンセルの不規則な発生時刻と,価格と量の記録の集まりからなる.一般に,現象の発生時刻の記録の集まりを点過程データと呼び,さらに発生時刻と同時点の属性の値も合わせて記録したデータをマーク付き点過程データと呼ぶ.つまり,この章の分析で用いる為替ティックデータ(図1)はマーク付き点過程データということになる.なお,観測対象が連続時間で変化する属性を持ちそれを事前に定めた等間隔時間で記録するいわゆる時系列データとは構造が異なるので注意されたい.
ティックデータを扱っている多くの先行研究では,実は点過程データを一定の均等な時間間隔で集計,加工する(以下,等間隔区分と呼ぶ)ことで,時系列データとして扱うことが多い.すでに経済時系列データの分析手法は数多く開発されており,それがそのまま流用できるという点を考慮すれば,非常に洗練されている研究アプローチといえるだろう.例えば,Cont et al.(2014)は,株式ティックデータを10秒単位の時系列データに集計した後に30分単位に区分して指値の価格変動とネットの指値注文量(ベスト・ビッド/アスクの量の需要量と供給量の不均衡からなる注文アンバランス($OFI$:Order Flow Imbalance))が線形関係を持つかを調査している.また,Mancini et al(2013)は,0.1秒単位の為替ティックデータを1分単位に集計し1日単位にまとめた時系列データをもとに,指値の価格変動をネットの取引注文量の上に回帰して回帰係数を取得し,日次平均から作成したベスト・ビッド/アスクの価格差(スプレッド)や価格変動のボラティリティなどの流動性指標と比較してその関係を調査している.Berger et al(2006)は,1分単位の取引注文の価格変動やネットの取引注文量を1分単位,5分単位等の様々な幅で集計して回帰することで,集計幅と回帰係数,$R^2$の関係を調査している.Ito and Yamada (2017)は,銀行の公表レート決定や経済指標発表の直前直後の90秒を3秒単位に区分するなどして指値注文や取引注文の量,価格の変化幅を調査している.
ティックデータをそのまま点過程データとして扱い,取引間隔の発生間隔に着目している研究もいくつか存在する.為替取引の発生を粗密をもとにクラスタに区分して取引間隔と価格変動の関係を調査したShibata(2006)の研究,取引発生間隔の不規則性をモデル化したACD(Autoregressive conditional duration)モデルを用いたEngle and Russell(1998)の実証分析,Hawkes過程を用いたVinkovskaya(2014),Rambaldi(2014)等の研究がある.
本研究の目的は,指値や取引の発生間隔,取引量,価格変動といった変量の関係を明らかにすること,そして,これらを同時に捉えることのできるモデルの構築である.先に述べたように,指値や取引の発生間隔を捉える方法は2つある.1つは,不定の発生間隔を一定間隔の中で発生頻度に要約することで,時系列データに加工して分析する方法である.この方法は,比較的容易に,指値や取引の発生頻度,量と価格変動を分析できる利点を持つ一方で,発生時刻や発生間隔の情報が失われる欠点を持つ.指値や取引の発生間隔の情報とともに,量や価格変動の関係を追うことは難しい.もう1つのやり方は,指値や取引の発生間隔の情報をありのままにとらえたマーク付き点過程モデルの中で,量と価格変動の関係を捉える方法である.この方法は,定式化は複雑になるが,指値や取引の発生時刻や発生間隔の情報を棄損しない.発生間隔の情報とともに,量や価格変動の関係を追うことができるようになる.
我々は,後者の方法をベースにしつつ前者の分析方法の利点を導入する手法をいくつか検討し,最終的に取引の価格変動と発生間隔を調査したShibata(2006)のモデルと,指値の価格変動と量の関係を調査したCont et al.(2014)のモデルを組み合わせ,指値や取引での発生間隔,量,価格変動といった変量をとらえるフレームワークを用いることとした.具体的には,Shibata(2006)に準拠して取引の発生間隔の粗密からなるクラスタを作成し(以下,クラスタ区分と呼ぶ),各クラスタごとにCont et al.(2014)が用いた経済時系列データの分析方法を応用して,取引の発生間隔と指値の価格変動幅や量との関係を調査した.本研究で詳しく調査した項目は以下のとおりである.
以下,第2節では,本論文のデータの仕様を説明し,必要な記号を定義する.そして,Cont et al.(2014)の先行研究を紹介したうえで,Shibata(2006)を用いた取引発生間隔の頻度が均等となるクラスタへの区分方法を述べる.第3節では,為替ティックデータを用いて,30分等間隔の区分と我々のクラスタ区分で,Cont et al.(2014)の回帰モデルの結果を比較し,価格変動幅や価格インパクトなどの要約量との関係性を調査する.第4節では,まとめを行う.
この節では,本研究で使用するEBSの為替ティックデータを紹介する.そして,ベスト・ビッド/アスクの指値の提示,キャンセル,指値に対する取引からなるOBE(Order Book Event)の発生時刻の集合を数式を用いて簡潔に表現する.さらに,Shibata(2006)のアイデアを用いて,取引の発生間隔が同一の定常ポワソン過程に従うようにデータをクラスタに区分し,Cont et al.(2014)の価格インパクトモデルを組み合わせることで,指値や取引の発生間隔,量と価格変動の変量をとらえるモデルを実現する.
2.1 データの解説と記号の定義1990年代初期以降,為替市場では売り手と買い手を自動的にマッチングする電子取引ブローカー業務システムと電子指値注文ブックは,主要通貨ペアを売買するディーラー間の主な取引手段になっている.
ディーラー間のスポット取引では,EBSとロイターの2つの電子ブローカー業務システムが,グローバルに利用されており,EBSではEUR/USDとUSD/JPYの取引が活発である.EBSでは,これらの通貨ペアについて,任意の時刻で参照価格(スポットディーラー間の価格)を持ち,多くのディーラーはEBSでの価格をもとに顧客に提示する価格を決定する.
本研究の目的は,取引発生のクラスタのもとで,価格と量の変化に関する様々な情報を含むOBEの特徴を調べることにある.調査では,OBEの関係が複雑に絡み合うため,OBEの背後にあるすべてのやり取りを記録した詳細なデータセットが必要となる.この種の条件を満たすデータセットを容易に作成できるので,本研究では,EBSが提供するEBS Data Mine Level 5.0を使用する.データセットの作成には,データの仕様の理解が不可欠であるため,EBS Data Mineの仕様について簡単に説明する.
EBS Data Mineは,指値注文のデータの集まりであるPrice Record と取引注文のデータの集まりであるDeal Recordの2種類のレコードで構成されており,最小0.1秒単位の区間でデータを記録している.
Price Recordは,0.1秒単位に区切られた区間の中で,マーケットメイカーによるビッド/アスクの指値の提示とキャンセル,指値に対する取引の成立によって生成される.ベスト・ビッド/アスクから10番目までの各レベルで,ビッド/アスクの価格または量の変化があった単位区間の終端の時刻をそのレベルでの発生時刻として,その時刻での価格・量と共に記録している.この論文では,各レベルのうち,ベスト・ビッド/アスクのみが分析の対象なる.
Deal Recordは,0.1秒単位に区切られた区間の中で,取引成立時に生成される.売り/買いのサイド,取引の発生時刻,その時刻での価格と取引量を記録している.買い取引であれば0.1秒単位区間内で成立した最高価格,売り取引であれば0.1秒単位区間内で成立した最低価格が記録され,取引量は0.1秒単位区間で成立した取引量の合計が記録されている.指値注文の減少が,キャンセルによるものか,取引の成立によるものかは,Price Recordだけではわからないが,Deal Recordと照らし合わせることで識別できるようになる.
以下では,EBS Data MineのPrice Record と Deal Recordからのデータ抽出方法を示し,後にモデルの簡潔な説明に必要となる記号の詳細を定義する.
ベスト・ビッド/アスクの指値注文の発生時刻の集合$OBESet$は,Price Recordに記載のある全レコード(離散的な時刻と,それに伴う,指値注文の価格,量のレコード)を一旦集めた後,そこから,ベスト・ビッド/アスクの指値注文の価格と量のどちらかに変化があったレコードを抽出することで作成する.
最初に,EBSデータに収録されているベスト・アスクのレコードの時刻$t^a_n$と,その時刻での価格$P_{t^a_n}^a$と量$q_{t^a_n}^a$のペアを以下のように表記する2.
\begin{equation*} Ask_{t^a_n}=(P_{t^a_n}^a,q_{t^a_n}^a);n=1,\dots,N^a. \end{equation*} |
$t^a_n$は,Price Recordに収録されている時刻であり,添え字は,収録された順序を示す.$t^a_1$と$t^a_{N^a}$は,一日の最初と最後のレコードと対応するものとする.
次に,ベスト・アスクの時間を連続時間に拡張する:
\begin{equation*} Ask(t)=\sum_{n=2}^{N^a}1_{[t^a_{(n-1)},t^a_n)}Ask_{t^a_{(n-1)}}\ \ t^a_1\leq t\leq t^a_{N^a}. \end{equation*} |
ここで$1_{[t^a_{(n-1)},t^a_n)}$は,次のような指標関数である:
\begin{equation*} 1_{[t^a_{(n-1)},t^a_n)}= \begin{cases} 1 & \text{$(t \in [t^a_{(n-1)},t^a_n))$},\\ 0 & \text{$(t \notin [t^a_{(n-1)},t^a_n))$}. \end{cases} \end{equation*} |
ベスト・ビッドの価格と量のペアも同様に表記することによって,連続時間でのベスト・ビッド/アスクの価格と量のペア$Q(t)$が定義できる.
\begin{eqnarray*} Q(t)&=&(Ask(t),Bid(t))\\ &=&(P^a(t),q^a(t),P^b(t),q^b(t)). \end{eqnarray*} |
ここで,$t_1\equiv max(t^a_1,t^b_1)$,$t_N\equiv max(t^a_{N^a},t^b_{N^b})$,そして$t_N\geq t \geq t_1$.
$Q(t)$は,4次元階段関数であり,図2で示すように区分点を持つ.この論文では,これらの区分点をOBEの発生時刻と呼ぶ.区分点を集めることで,OBEの発生時刻の集合を定義する:
\begin{eqnarray*} OBESet &=& \{t| \lim_{\Delta m \to +0} Q{(t-\Delta m)} \neq Q{(t)}\}. \end{eqnarray*} |
ここで$\Delta m$は,十分に0に近い正の微小時間を示し,$Q{(t)}$が変化した時間を$t_n$で示す3.こうして集まった発生時刻について,発生順に並べて添え字を振りなおすことで,$OBESet=\{t_n|n=1,\cdots,t_N\}$を取得する.
次に,OBEの中で,価格変動を伴うOBEの発生時刻のみを集めた部分集合を${Pc}\_OBESet$として定義する.
\begin{eqnarray*} {Pc}\_OBESet &=& \{t| \lim_{\Delta m \to +0} P^a{(t-\Delta m)} \neq P^a{(t)} \ or \lim_{\Delta m \to +0} P^b{(t-\Delta m)} \neq P^b{(t)}\}. \end{eqnarray*} |
最後に,取引の発生時刻の集合${Trade}\_{Set}$をDeal Recordから抽出した,取引時刻とその上にマークされる価格と量で定義する.市場買い注文の価格$P_{t_m}^{buy}$と数量$q_{t_m}^{buy}$のペアを以下の様に記載する.
\begin{equation*} Buy_{t_m}=(P_{t_m}^{buy},q_{t_m}^{buy})\ \ ;\ m=1,\cdots,{N^{buy}}. \end{equation*} |
ここで$t_m$は,Deal Recordの買い取引の発生時刻であり,添え字$m$は注文発生の順序を示す.市場売り注文の価格と数量のペア$Sell_{t_m}$も同様に定義する.以上によって取得した,$Buy_{t_m}$,$Sell_{t_m}$の時刻をすべて集め,発生順に並べて添え字を振りなおすことで,取引発生時刻の集合${Trade}\_{Set}$を取得する.
\begin{eqnarray*} {Trade}\_{Set}=\{t_1^{tr},\dots,t^{tr}_{N^{tr}}\}. \end{eqnarray*} |
以上により,異なる定義の3種類の発生時刻の集合$OBESet$,${Pc}\_OBESet$,${Trade}\_{Set}$を定義した.
次に,本論文の中で,3種類の発生間隔の相互の関連を調べるために,これらの差分:$\delta t$,${Pc}\_\delta t$,${Trade}\_\Delta T$を定義する.
我々は指値注文の発生間隔の集合を以下で定義する.
$\delta t = \{\Delta {t_n}= {t_n}-{t_{n-1}}|t_{n-1}, t_n \in OBESet , n=2,\cdots,N\}$.
${Pc}\_\delta t = \{\Delta {t_n^{Pc}} = {t_n^{Pc}}-{t_{n-1}^{Pc}}|t_{n-1}^{Pc},t_n^{Pc} \in {Pc}\_OBESet,n=2,\cdots,N^{Pc}\}$.
${Trade}\_\Delta T = \{\Delta t_n^{tr} = {t_n^{tr}}-{t_{n-1}^{tr}}|{t_{n-1}^{tr}},{t_n^{tr}} \in {Trade}\_{Set}, n=2,\cdots,N^{tr}\}$.
本研究では,指値や取引の発生時刻は点過程に従う仮定のもと,同時に発生しないことに注意する.実際のデータでは0.1秒単位で区分されるために同時の発生が起こりうる.これに対する近似は付録に記載した.
2.2 Cont et al.(2014)の価格インパクトモデルCont et al.(2014)は,株式ティックデータについて,30分等間隔の区分の中で,指値注文の価格変動幅をネットの指値注文量($OFI$:Order Flow Imbalance)に,回帰することで,OBEの価格インパクトを調査した.また,短期間での価格変動が,ネットの取引量($TI$:Trade Imbarance)よりも,ネットの指値注文量($OFI$)に強く反応していることを確認した.以下では,本論文の調査のもととなったCont et al.(2014)の回帰モデルを説明する.
Cont et al.(2014)は,回帰モデルを構築する際に,2つの均一なタイムステップを使用する.$\{S_{0},...,S_{I}\}$は,1日を$I=48$等分した30分間隔の格子$\Delta S_i=S_{i}-S_{i-1}$で,データを回帰分析する際の区切りとなる.$\{s_{0,i},...,s_{K_i,i}\}$は,$[S_{i-1},S_{i})$を$K_i=180$等分した10秒間隔の格子$\Delta s_{k,i}=s_{k,i}-s_{k-1,i}$で,発生するデータの集計の区切りとなる.
Cont et al.(2014)の回帰分析で用いる変数は,主に,価格変動幅$\{\Delta P_{s_{k,i}}\}$,ネットの指値注文量$\{OFI_{s_{k,i}}\}$,ネットの取引量$\{TI_{s_{k,i}}\}$の3つの変数である.
Cont et al.(2014)は,被説明変数となる価格変動幅$\{\Delta P_{s_{k,i}}\}$を,10秒間隔$[s_{k-1,i},s_{k,i}]$の中で,以下のように定義する.
\begin{eqnarray*} \Delta P_{s_{k,i}}=\frac{P_{s_{k,i}}^b+P_{s_{k,i}}^a}{2}-\frac{P_{s_{k-1,i}}^b+P_{s_{k-1,i}}^a}{2}; i=1,\dots,I,k=1,\dots,K_i. \end{eqnarray*} |
同様に,10秒間隔$[s_{k-1,i},s_{k,i}]$の中で,ネットの指値注文量$\{OFI_{s_{k,i}}\}$を以下のように定義する.
\begin{eqnarray*} OFI_{s_{k,i}} &=& \Sigma_{n={N(s_{k-1,i})+1}}^{{N(s_{k,i})}} e_{t_n} ; i=1,\dots,I,k=1,\dots,K_i\\ \mbox{s.t.}\ \ e_{t_n} &=& q_{t_n}^b1_{\{P_{t_n}^b\ge P_{t_{n-1}}^b\}}-q_{t_{n-1}}^b1_{\{P_{t_n}^b\le P_{t_{n-1}}^b\}} - q_{t_n}^a1_{\{P_{t_n}^a\le P_{t_{n-1}}^a\}}+q_{t_{n-1}}^a1_{\{P_{t_n}^a\ge P_{t_{n-1}}^a\}}. \end{eqnarray*} |
ここで$t_{N(s_{k-1,i})+1}$と$t_{N(s_{k,i})}$は,10秒間隔$[s_{k-1,i},s_{k,i}]$に含まれる最初と最後のOrder Book Eventsであり,この間隔の中で発生する全てのOBEの発生時刻$\{t_{N(s_{k-1,i})+1},...,t_{N(s_{k,i})}\}$に対応する$e_{t_n}$を合計することで$OFI_{s_{k,i}}$を得る.
また,10秒間隔$[s_{k-1,i},s_{k,i}]$の中で,説明変数となるネットの取引量$\{TI_{s_{k,i}}\}$は,以下のように定義する.
\begin{eqnarray*} TI_{s_{k,i}} &=& \Sigma_{n={N(s_{k-1,i})+1}}^{N(s_{k,i})} d_{t_n} ; i=1,\cdots,I,k=1,\cdots,K_i\\ \mbox{s.t.}\ \ d_{t_n} &=& q_{t_n}^{sell}-q_{t_n}^{buy}.\\ \end{eqnarray*} |
ここで$t_{N(s_{k-1,i})+1}$と$t_{N(s_{k,i})}$は,10秒間隔$[s_{k-1,i},s_{k,i}]$の中の最初と最後の取引の発生時刻であり,この間隔の中で発生する全ての取引の発生時刻$\{t_{N(s_{k-1,i})+1},...,t_{N(s_{k,i})}\}$に起こった売りと買いの取引量の差$d_{t_n}$を合計することで$TI_{s_{k,i}}$を得る.
これらの設定の下,Cont et al.(2014)は,主に,以下で定義する4種類の同時点回帰モデルを調査した.
・$\{\Delta P_{s_{k,i}}\}$の$\{OFI_{s_{k,i}}\}$上への回帰
\begin{equation} \Delta P_{s_{k,i}}=\hat{\alpha}_i+\hat{\beta}_iOFI_{s_{k,i}}+\hat{\epsilon}_{s_{k,i}} \ \ \ \ s.t.\ s_{k,i}\in [S_{i-1},S_{i}]. \end{equation} | (1) |
ここで${s_{k,i}}$は,各30分のタイムステップ$[S_{i-1},S_{i}]\ s.t.\ i=1,\dots,48$の中で$\{k=1,...,180\}$で添え字が付けられる.この回帰の係数は最小二乗法で推計される.この章では,この$\hat{\beta}_i$を30分等間隔区分上の価格インパクトと呼ぶ.
・高次/非線形依存チェックの回帰
\begin{equation} \Delta P_{s_{k,i}}=\hat{\alpha}_i^Q+\hat{\gamma}_iOFI_{s_{k,i}}+\hat{\gamma}_i^QOFI_{s_{k,i}}|OFI_{s_{k,i}}|+\hat{\epsilon}_{s_{k,i}} ^Q\ \ \ \ s.t.\ s_{k,i}\in [S_{i-1},S_{i}]. \end{equation} | (2) |
Cont et al.(2014)は,$\hat{\gamma}_i^Q$は統計的に有意ではなく,2次項の説明力は弱いこと,線形モデル(1)と非線形モデル(2)にほとんど差異がないことを確認した.
・$\{\Delta P_{s_{k,i}}\}$の$\{TI_{s_{k,i}}\}$上への回帰
\begin{equation} \Delta P_{s_{k,i}}=\hat{\alpha}_i^T+\hat{\beta}_i^TTI_{s_{k,i}} +\hat{\epsilon}_{s_{k,i}}^T \ \ \ \ s.t.\ s_{k,i}\in [S_{i-1},S_{i}]. \end{equation} | (3) |
Cont et al.(2014)は,$TI$は$\Delta P$と統計的に強い相関を持つことを確認した.
・$\{\Delta P_{s_{k,i}}\}$の$\{OFI_{s_{k,i}}\}$と$\{TI_{s_{k,i}}\}$の上への回帰
\begin{equation} \Delta P_{s_{k,i}}=\hat{\alpha}_i^D+\hat{\theta}_i^OOFI_{s_{k,i}}+\hat{\theta}_i^TTI_{s_{k,i}}+\hat{\epsilon}_{s_{k,i}}^D\ \ \ \ s.t.\ s_{k,i}\in [S_{i-1},S_{i}]. \end{equation} | (4) |
Cont et al.(2014)は,$OFI$または$TI$のいずれかの変数を個別に取ると,その変数は価格変動と統計的に有意な相関を示すが,2変数を多変量回帰で使用すると,$TI$に対する価格変動の説明力は$OFI$よりも弱くなることを確認した.
次に,Cont et al.(2014)は,各$i$から取り出した,価格インパクト$\hat{\beta}_i$とデプス$Depth_i$の積が一定に近い関係にあることを価格インパクトの対数値$log(\hat{\beta}_i)$とデプスの対数値$log (Depth_i)$の線形関係を調査することで確認した:
\begin{equation} log \hat{\beta}_i=\hat{\alpha}_{L,i}-\hat{\kappa}log(Depth_i)+\hat{\epsilon}_{L,i} \ \ \ \ s.t.\ i=1,...,48. \end{equation} | (5) |
ここで$\hat{\beta}_i$と$Depth_i$は,各30分のタイムステップ$[S_{i-1},S_{i}]\ s.t.\ i=1,\dots,48$の中で得られた価格インパクトとデプスとなる.
以上,本節では30分等間隔の区分と10秒単位の集計のもとで,分析に使用するCont et al.(2014)のモデルを説明した.しかし,本論文で,Cont et al.(2014)の複製を作る際には,点過程の情報を残したまま指値や取引の発生間隔を調査したいので,30分等間隔のモデル,クラスタ区分のモデル共に,$\Delta s_{k,i}=10$秒として,10秒単位でデータを集計するのではなく,$\Delta s_{k,i}=0.1$秒として,EBS最小単位0.1秒のデータをそのまま使用する点に留意する.クラスタ区分のモデル詳細は,2.5に記載する.
2.3 Shibata(2006)の方法に基づくクラスタ区分2.3節ではShibata(2006)の方法に基づいてクラスタ区分を紹介する.OBEの発生間隔は点過程とみなすことができる.ティックデータを時系列データに変換する方法では,OBEを点過程として扱うことができず,価格の発生間隔や発生時刻などの為替ティックデータのいくつかの重要な情報が隠れてしまう.
本研究の目的は,為替取引の粗密の情報が隠れることなく,取引の活発非活発と価格変動の関係を調査することである.
我々は,Shibata(2006)の尤度比検定に基づき,為替取引の発生時刻からなる為替ティックデータを均一なポアソン過程によって近似することで,発生時刻が独立同一分布を保つクラスタに区分した.
以下,Shibata(2006)の方法の概要を説明する(詳細は,Shibata(2006)を参照).
点過程の与えられた列$t_1 \leq t_2 \leq \cdots \leq t_n$における強度$\lambda$の定常ポアソン過程の対数尤度関数は,
\[ L( \Delta t_2, \ldots, \Delta t_n; \lambda)= \log\left(\prod_{j=2}^n\lambda\exp(-\lambda\Delta t_j)\right)=(n-1)\log\lambda-\lambda(t_n-t_1) \] |
となる.
この対数尤度関数を$L_0$と置くとき,$L_0$が最大になるのは,$\hat\lambda=\frac{n-1}{t_n-t_1}$の時となる.この$\hat\lambda$を代入すると,$L_0$は以下のように整理できる.
\[ L_0=L( \Delta t_2, \ldots, \Delta t_n; \hat{\lambda})=(n-1)\log\frac{n-1}{t_n-t_1}-(n-1) \] |
もし,$L_0$を$1 < k < n$で,$(t_1, t_n]$を$(t_1, t_k]$と$(t_k, t_n]$に分解すれば4,対数尤度は以下となる.
\begin{eqnarray*} L( \Delta t_2, \ldots, \Delta t_k; \lambda_1)+L( \Delta t_{k+1}, \ldots, \Delta t_n; \lambda_2) \end{eqnarray*} |
この対数尤度関数を$L_1$と置くとき,$L_1$が最大になるのは,$\hat{\lambda}_1 = \frac{k-1}{t_k-t_1}, \hat{\lambda}_2=\frac{n-k}{t_n-t_k}$の時となる.これらを代入すると,$L_1$は以下のように整理できる.
\begin{eqnarray*} L_1 & = & L( \Delta t_2, \ldots, \Delta t_k;\hat{\lambda}_1)+L( \Delta t_{k+1}, \ldots, \Delta t_n;\hat{\lambda}_2)\\ & = & (k-1)\log\frac{k-1}{t_k-t_1}+(n-k)\log\frac{n-k}{t_n-t_k}-(n-1) \end{eqnarray*} |
$L1/L0$の分布は複雑であるため,Shibata(2006)は,モンテカルロシミュレーションに基づいて,$L1/L0$が従う理論分布を導出する.Shibata (2006)は,導出した理論分布に基づいて,尤度比検定を実行し,$L1/L0$が有意となる限り,$(t_1, t_k]$と$(t_k, t_n]$への更なる分割を進め,点過程列をクラスタに区分する.
以上,2.3節では,Shibata(2006)の手法を用いて,${Trade}\_{Set}=\{t_1^{tr},\dots,t^{tr}_{N^{tr}}\}$の差分である取引発生間隔の集合${Trade}\_\Delta T=\{\Delta t_k^{tr}: n=2,\cdots,N^{tr}\}$を定常ポアソン過程で近似して,クラスタ${C_i^{tr}\ s.t.\ i=1, \cdots, I}$区分を取得した.
\begin{eqnarray*} {Trade}\_{Set}=C_1^{tr}\ \dot{\cup}\ C_2^{tr}\ \dot{\cup}\ \dots\ \dot{\cup}\ C_I^{tr} \end{eqnarray*} |
クラスタ区分によって得られた$C_i^{tr}$と対応する取引発生強度$\lambda_i$の集合を以下で定義する.
\begin{eqnarray*} \Lambda\equiv \{\lambda_1,\dots,\lambda_I\}, \end{eqnarray*} |
2.4節では,2.3節のShibata(2006)の方法で得た取引の発生間隔${Trade}\_{Set}$を構成する各クラスタ${C_i^{tr}}$を用いて,指値注文のデータの発生時刻の集合$OBESet$をクラスタ$C_i$に区分する.
\begin{eqnarray*} OBESet &=& C_1\ \dot{\cup}\ C_2\ \dot{\cup}\ \dots\ \dot{\cup}\ C_I\\ s.t\ C_1&=& \{t_{k,1}|OBESet\cap [0,\min C_{2}^{tr}) \ni t_{k,1}\},\\ C_i &=& \{t_{k,i}|OBESet\cap [\min C_i^{tr},\min C_{i+1}^{tr}) \ni t_{k,i}\}\ for\ 1<i<I,\\ C_I &=& \{t_{k,I}|OBESet\cap [\min C_I^{tr},\infty) \ni t_{k,I}\}. \end{eqnarray*} |
クラスタ$C_i$の集合を${\cal C}$と定義する.各クラスタ$C_i$は$\lambda_i$に対応することに注意する.
\begin{eqnarray*} {\cal C}\equiv \{C_i: i=1, \cdots, I\}. \end{eqnarray*} |
次に,経済イベント発生前後の諸変量の特徴を調査するために,$OBESet$を構成する各クラスタ$C_i$をCPU,FOMCのような経済イベントの発生前後で分類する.
具体的には,経済イベントの発表が$n$回があった日のデータについては,${\cal C}$を$2n+1$個に分割する.例えば$n=2$であれば,
\begin{eqnarray*} {\cal C} = \{C_i: i=1, \cdots, I\}={\cal E}_1\ \dot{\cup}{\cal J}_1\ \dot{\cup}{\cal E}_2\ \dot{\cup}{\cal J}_2\ \dot{\cup}{\cal E}_3. \end{eqnarray*} |
${\cal E}_1$,${\cal E}_2$,${\cal E}_3$の範囲は,${\cal E}_1=\{C_{i_{{\cal J}_0}+1},...,C_{i_{{\cal E}_1}}\}$,${\cal E}_2=\{C_{i_{{\cal J}_1}+1},...,C_{i_{{\cal E}_2}}\}$,${\cal E}_3=\{C_{i_{{\cal J}_2}+1},...,C_{i_{{\cal E}_3}}\}$.のように書き下せる.
イベント発生の時間帯${\cal J}_1,{\cal J}_2$を除いたクラスタの集合を${\cal E}_A$で定義する.
\begin{eqnarray*} {\cal E}_A\equiv {\cal E}_1\ \dot{\cup}{\cal E}_2\ \dot{\cup}{\cal E}_3. \end{eqnarray*} |
イベント発生のない平常時のデータは,${\cal C}$のみを用いて表現する.
2.5 クラスタ区分のもとでのCont et al.(2014)の価格インパクトモデル2.5節では,Shibata(2006)のクラスタ区分のもとに,Cont et al.(2014)のモデルを書き直すことで,2つのモデルを統合する.
最初に,Shibata(2006)の方法で$OBESet$をクラスタに区分することで,各クラスタ$C_i$は,以下のように書き下せる.
\begin{eqnarray*} C_i=\{t_{k,i}|\ T_{i-1}< t_{k,i} \le T_{i},\ k=1, \cdots, K_i\}. \end{eqnarray*} |
クラスタ$C_i$の範囲は$\Delta T_i=T_{i}-T_{i-1}$となり,クラスタ区分のモデルでの回帰分析は,この区間毎に実行する.クラスタ$C_i$で発生するOBEの発生間隔を$\Delta t_{k,i}=t_{k,i}-t_{k-1,i}$で定義し,これが分析の単位となる.価格変動幅は$\Delta t_{k,i}$の間隔で以下のように定義する5.
\begin{eqnarray*} \Delta P_{t_{k,i}} = \frac{P_{t_{k,i}}^a+P_{t_{k,i}}^b}{2}-\frac{P_{t_{k-1,i}}^a+P_{t_{k-1,i}}^b}{2}; i=1,\dots,I,k=1,\dots,K_i. \end{eqnarray*} |
また,各時点での指値の変化量$e_{t_{k,i}}$と取引の変化量$d_{t_{k,i}}$を以下で定義する.
\begin{eqnarray*} e_{t_{k,i}} &=& q_{t_{k,i}}^b1_{\{P_{t_{k,i}}^b\ge P_{t_{k-1,i}}^b\}}-q_{t_{k-1,i}}^b1_{\{P_{t_{k,i}}^b\le P_{t_{k-1,i}}^b\}} - q_{t_{k,i}}^a1_{\{P_{t_{k,i}}^a\le P_{t_{k-1,i}}^a\}}+q_{t_{k-1,i}}^a1_{\{P_{t_{k,i}}^a\ge P_{t_{k-1,i}}^a\}},\\ d_{t_{k,i}} &=& q_{t_{k,i}}^{sell}-q_{t_{k,i}}^{buy}.\\ \end{eqnarray*} |
以上の設定の下,各クラスタ$C_i$上で,$\Delta P_{t_{k,i}}$を$OFI_{t_{k,i}}=e_{t_{k,i}}$,$TI_{t_{k,i}}=d_{t_{k,i}}$に回帰することで,Cont et al.(2014)の(1)から(4)のモデルを以下の(1')から(4')で読み替える.
\begin{equation} \Delta P_{t_{k,i}}=\hat{\alpha}_i+\hat{\beta}_ie_{t_{k,i}}+\hat{\epsilon}_{t_{k,i}}\ \ \ \ s.t.\ t_{k,i}\in C_{i}, \end{equation} | (1') |
\begin{equation} \Delta P_{t_{k,i}}=\hat{\alpha}_i^Q+\hat{\gamma}_i e_{t_{k,i}}+\hat{\gamma}_i^Q e_{t_{k,i}}|e_{t_{k,i}}| +\hat{\epsilon}_{t_{k,i}}^Q \ \ \ \ s.t.\ t_{k,i}\in C_{i}, \end{equation} | (2') |
\begin{equation} \Delta P_{t_{k,i}}=\hat{\alpha}_i^T+\hat{\beta}_i^Td_{t_{k,i}} +\hat{\epsilon}_{t_{k,i}}^T \ \ \ \ s.t.\ t_{k,i}\in C_{i}, \end{equation} | (3') |
\begin{equation} \Delta P_{t_{k,i}}=\hat{\alpha}_i^D+\hat{\theta}_i^Oe_{t_{k,i}}+\hat{\theta}_i^Td_{t_{k,i}}+\hat{\epsilon}_{t_{k,i}}^D\ \ \ \ s.t.\ t_{k,i}\in C_{i}. \end{equation} | (4') |
本研究では,$(1')$の$\hat{\beta}_i$をクラスタ区分上の価格インパクトと呼ぶ.
また,Cont et al.(2014)が(5)で示した$Depth_i^{\hat{\kappa}}$と価格インパクト$\hat{\beta}_i$の積がほぼ一定に近い関係にあることを示すモデルを(5')を用いて各クラスタ$C_i$上でも確認する6.
\begin{equation} log \hat{\beta}_i=\hat{\alpha}_{L,i}-\hat{\kappa}log(Depth_i)+\hat{\epsilon}_{L,i} \ \ \ \ s.t.\ t_{k,i}\in C_{i}. \end{equation} | (5') |
本節では,最初に,分析対象日の為替ティックデータの特徴を述べる.次に,時系列データに基づく30分等間隔の区分とShibata(2006)の方法に基づいて得たクラスタ区分のもとで,Cont et al.(2014)のモデルを複製した後,価格インパクトについて,その推移やデプスとの関係を比較する.また,クラスタ区分上で,指値や取引の発生間隔と他の様々な要約量の関係を調査する.
結果として,30分等間隔の区分では隠れてしまう情報が,クラスタ区分では視覚化できた.また,クラスタに対応する取引発生強度と指値注文の価格変化幅や量,価格更新頻度等の要約量との関係を比較できるようになったので,これらの変量間の線形相関を確認した.
3.1 データのサマリー本節では,分析に使用したUSD/JPY通貨ペア(以下,JPYと呼ぶ)のデータのサマリを記述する.分析に使用したデータは,1日の価格の変化幅が0.5円程度に留まった2014年9月14日21:00:00から2014年9月15日21:00:00 (GMT)のデータ(以下,平常時のデータと呼ぶ)7と,米国のCPI発表(2014年9月17日12:30:00(GMT))とFOMC発表(2014年9月17日18:00:00(GMT))の時刻を含んでおり,1日の価格が1円近く変化した2014年9月16日21:00:00から2014年9月17日21:00:00 (GMT)8のデータ(以下,イベント発生時のデータと呼ぶ)となる.
最初に,これらのデータから,Shibata(2006)に基づいて定常ポワソン過程で近似するクラスタ区分と30分等間隔の区分を作成した.クラスタ区分では,平常時のデータは81,イベント発生時のデータは181に区分できた.30分等間隔の区分は1日を48等分に区分した.
表記は,例えば9月17日であれば,クラスタ区分の集合をと${\cal C}^{0917}$記載し,
\begin{equation*} C_i \in {\cal C}^{0917}\ i=1,...,181 \end{equation*} |
とする.イベント発生時のデータのうち異常時のクラスタを除いた集合は${\cal E}_A^{0917}$と記載した.また,1日を48等分に区切った30分等間隔の区分の集合は,${\cal M}^{0917}$と記載した.
\begin{equation*} M_i \in {\cal M}^{0917}\ i=1,...,48. \end{equation*} |
以下では,特に断らない限り,イベント発生時のクラスタ区分についての結果を記載する.
図3はJPYの推移(上段),取引発生時刻$\Delta t$の推移(中段),各クラスタ$i=1,\cdots,I$毎に値$\lambda_i$,幅${(T_{i-1},T_{i}]}$を持つ階段関数の推移(下段)を示している.垂線は,CPIの発表時刻とFOMCの発表時刻を示す.イベント発表の時刻に価格がジャンプしていることがわかる.
我々は,${\cal C}^{0917}$をCPI発表前の期間${\cal E}_1$:,CPI発表後FOMC発表前の期間${\cal E}_2$:,FOMC発表後の期間:${\cal E}_3$,US CPIとUS FOMCの経済イベントが発生していた期間${{\cal J}_1}, {{\cal J}_2}$に分割した.分割の範囲は$i_{{\cal J}_0}=0, i_{{\cal E}_1}=54, i_{{\cal J}_1}=56, i_{{\cal E}_2}=108, i_{{\cal J}_2}=114, i_{{\cal E}_3}=181$となる.指標発表時のほか,指標発表前後の価格変動が激しいデータを含むクラスタも${{\cal J}_1}, {{\cal J}_2}$に含めている.
\begin{eqnarray*} {\cal C}^{0917} & = & {\cal E}_1\ \dot{\cup}{\cal J}_1\ \dot{\cup}{\cal E}_2\ \dot{\cup}{\cal J}_2\ \dot{\cup}{\cal E}_3,\\ {\cal E}_A^{0917} & = & {\cal E}_1\ \dot{\cup}{\cal E}_2\ \dot{\cup}{\cal E}_3. \end{eqnarray*} |
・CPI発表時刻までのクラスタの個数は,全クラスタ181個の$\frac{1}{3}$以下だが,CPI発表時刻までの経過時間は1日24時間の$\frac{1}{2}$以上を占めている.
・FOMC発表時刻までのクラスタの個数は,全クラスタ181個の$\frac{1}{2}$を若干超える程度だが,FOMC発表時刻までの経過時間は1日24時間の$\frac{7}{8}$程度を占めている.
経済イベントの発表前後ではクラスタの区分が頻繁に変化していたことがわかる.
サイド | 価格変化 | 指値の提示 | 取引の発生 | 指値のキャンセル |
アスク | 価格変化有り | 7,556 | 2,474 | 6,053 |
アスク | 価格変化無し | 21,664 | 1,321 | 18,300 |
ビッド | 価格変化有り | 8,060 | 2,568 | 6,107 |
ビッド | 価格変化無し | 21,920 | 1,278 | 18,338 |
イベント発生時のJPYのベスト・ビッド/アスクでの指値の数 (指値の提示,取引の発生,指値のキャンセル)を価格変化の有無別に表示
表1は,イベント発生時のデータについて,ベスト・ビッド/アスクでの指値の提示,取引の発生,指値のキャンセルを価格変化を伴うもの,伴わないもの別に示したものとなる.
NO | $Ave(Subset(Lab,C_i))$ | $Ave(Subset(RV,C_i))$ | $\lambda_i$ |
${\cal E}_A$:Total | $0.00010$ | $2.4E-10$ | $0.70$ |
${\cal E}_1$:1-54 | $0.00008$ | $1.4E-10$ | $0.17$ |
${\cal E}_2$:56-108 | $0.00008$ | $2.0E-10$ | $0.52$ |
${\cal E}_3$:115-181 | $0.00011$ | $3.5E-10$ | $0.91$ |
クラスタ$C_i$と対応するスプレッド,価格変動幅の二乗$Ave(Subset(RV,C_i))$,取引発生強度$\lambda_i$の各経済イベント間の${\cal E}_l ,l=A,1,2,3$上での標本平均の比較
表2は,クラスタ$C_i$と対応するスプレッド$Ave(Subset(Lab,C_i))$,価格変動幅の二乗$Ave(Subset(RV,C_i))$,取引発生強度$\lambda_i$の各経済イベント間の${\cal E}_l , l=1,2,3$上での標本平均を比較した結果となる.9
Chaboud et al(2007)やRosa.C (2013)は,経済イベントを境に,様々な変量の水準が一時的/恒久的に切り替わることを示している.イベント発生時のデータでも,クラスタ$C_i$と対応するスプレッド,価格変動幅の二乗,取引発生強度等の変量は,FOMC発表を境に値が上昇しており,$1\%$有意水準で差異があることがウイルコクソン検定で確認できた.
最後に,Cont et al.(2014)の時系列データに基づく30分等間隔の区分,Shibata(2006)に基づいて定常ポワソン過程で近似するクラスタ区分の各々で,取引発生間隔${Trade}\_\Delta T$の自己相関を調べた.全データで自己相関を計算した場合,取引発生間隔の自己相関0の帰無仮説は棄却された.${Trade}\_\Delta T$をクラスタに区分し$C_i \in {\cal C}^{0917}$の各区分で自己相関を計算した場合は,$\frac{113}{118}$で自己相関0の帰無仮説を受容し,自己相関がなくなることを確認した.同様に,${Trade}\_\Delta T$を30分等間隔に区分し$M_i \in {\cal M}$の各区分で自己相関を計算した場合は,$\frac{38}{48}$で自己相関0の帰無仮説を受容し,自己相関がなくなることを確認した.クラスタ区分のほうが,30分等間隔の区分より,無相関となるクラスタの割合は若干高かった.
3.2 Cont et al.(2014)の回帰モデルの本研究への適用本節では,為替ティックデータを,30分等間隔区分とクラスタ区分上で,Cont et al.(2014)の回帰モデルに当てはめ,Cont et al.(2014)と類似の結果を得ることを確認した他,2つの区分での回帰係数を比較した.
以下では,イベント発生時のデータについて,Shibata(2006)のクラスタ区分から得た回帰分析の結果を記載する.表3は,181個の各クラスタ$C_i \in {\cal C}^{0917}$上で,回帰式(1'),(2'),(3'),(4')から計算した回帰係数の平均値,回帰係数0の帰無仮説が有意水準1$\%$で棄却される数,修正決定係数(以下,$adjR^2$)の平均値を示している.
NO | const | pv | OFI | pv | TI | pv | lOFIl | pv | $adjR^2$ |
(1') | 0.00002 | $\frac{0}{181}$ | 0.00040 | $\frac{177}{181}$ | 0.20 | ||||
(2') | 0.00001 | $\frac{12}{181}$ | 0.00073 | $\frac{180}{181}$ | 0.00000 | $\frac{30}{181}$ | 0.27 | ||
(3') | 0.00003 | $\frac{6}{181}$ | 0.00033 | $\frac{130}{181}$ | 0.03 | ||||
(4') | 0.00002 | $\frac{1}{181}$ | 0.00040 | $\frac{175}{181}$ | 0.00014 | $\frac{67}{181}$ | 0.21 |
181個の各クラスタ$C_i \in {\cal C}^{0917}$上で,回帰式(1'),(2'),(3'),(4')から計算した回帰係数の平均値,回帰係数0の帰無仮説が有意水準1$\%$で棄却される数,$adjR^2$の平均値を示した表.
(1')は,各クラスタ$C_i$上での,変数$\Delta P_{t_{k,i}}$の定数項と$OFI_{t_{k,i}}$からなる説明変数の上への回帰式である.定数項の平均$\frac{\Sigma_{i=1}^{181}\hat{\alpha}_i}{181}$は0.00002であり,$OFI$係数の平均$\frac{\Sigma_{i=1}^{181}\hat{\beta}_i}{181}$は0.00040であった.$OFI$係数$\hat{\beta}_i$は,クラスターの$\frac{177}{181}$で0と異なっていた.$adjR^2$の平均$\frac{\Sigma_{i=1}^{181}R_i^ 2}{181}$は20$\%$であった.
(2')は,各クラスタ$C_i$での,変数$\Delta P_{t_{k,i}}$の定数$OFI_{t_{k,i}}$と,$OFI_{t_{k,i}}|OFI_{t_{k,i}}|$からなる説明変数の上への回帰式であり,高次/非線形への依存性を調査している.定数の平均$\frac{\Sigma_{i=1}^{181}\hat{\alpha}_i^Q}{181}$は0.00001となる.$OFI$係数の平均$\frac{\Sigma_{i=1}^{181}\hat{\gamma}_i}{181}$は0.00073となり,$OFI$係数$\hat{\beta}_i^Q$はクラスターの$\frac{180}{181}$で0と異なっていた.$OFI|OFI|$係数の平均$\frac{\Sigma_{i=1}^{181}\hat{\gamma}_i^Q}{181}$は0であり,$OFI|OFI|$係数$\hat{\gamma}_i^Q$は,クラスターの$\frac{30}{181}$で0と異なっていた.$adjR^2$の平均$\frac{\Sigma_{i=1}^{181}R_i^2}{181}$は27$\%$であった.
(3')は,各クラスタ上$C_i$での,変数$\Delta P_{t_{k,i}}$の定数項と$TI_{t_{k,i}}$からなる説明変数の上への回帰式である.定数項の平均$\frac{\Sigma_{i=1}^{181}\hat{\alpha}_i^T}{181}$は0.00003であり,$TI$係数の平均$\frac{\Sigma_{i=1}^{181}\hat{\beta}_i^T}{181}$は0.00033であった.$TI$係数$\hat{\beta}_i^T$は,クラスターの$\frac{130}{181}$で0と異なっていた.$adjR^2$の平均$\frac{\Sigma_{i=1}^{181} R_i^2}{181}$は3$\%$であった.
(4')は,各クラスタ$C_i$での,変数$\Delta P_{t_{k,i}}$の定数と$OFI_{t_{k,i}}$,$TI_{t_{k,i}}$からなる説明変数の上への回帰式であり,$OFI$が$TI$よりよく価格変化を説明するかを調査している.定数の平均$\frac{\Sigma_{i=1}^{181}\hat{\alpha}_i^D}{181}$は0.00002,$OFI$係数の平均$\frac{\Sigma_{i=1}^{181}\hat{\theta}_i^O}{181}$は0.00040,$TI$係数の平均$\frac{\Sigma_{i=1}^{181}\hat{\theta}_i^T}{181}$は0.00014となる.$OFI$係数$\hat{\theta}_i^O$はクラスターの$\frac{175}{181}$で0と異なっており,$TI$係数$\hat{\theta}_i^T$は,クラスターの$\frac{67}{181}$で0と異なっていた.$adjR^2$の平均$\frac{\Sigma_{i=1}^{181} R_i^2}{181}$は21$\%$であった.
これらは,イベント発生時のデータについて,クラスタ区分して,その上で実行した回帰分析でも,$OFI$は価格変化幅を説明しており,回帰モデル(1')の回帰係数である価格インパクト$\hat{\beta}_i$はほとんどのクラスタ区分上で有意になること,$OFI$の2次項が価格にほとんど影響しないこと,$TI$よりも$OFI$が価格変化を良く説明することなど,Cont et al.(2014)と類似の結果を得る.同様に,30分等間隔の区分を組み込んだ回帰分析,平常時のデータに基づく分析でも,同様の結果を得ることを確認した.
次に,時系列データに基づく30分等間隔の区分の回帰モデル(1)とクラスタ区分の回帰モデル(1')の価格インパクト$\hat{\beta}_i$や修正決定係数$adjR^2$の変化を視覚化して比較する.更に,残差の最少二乗誤差を用いて,データ全体での当てはまりを比較する.
図4は,イベント発生時のデータをもとに,30分等間隔の区分の回帰モデルと,クラスタ区分の回帰モデルの価格インパクト$\hat{\beta}_i$を比較したグラフである.30分等間隔の区分では,$\hat{\beta}_i$は似たような範囲で推移,経済イベントに伴う変化をとらえることができない.一方で,クラスタ区分では,経済イベント前後に$\hat{\beta}_i$の強い跳ね上がりをとらえている.
図5は,30分等間隔の区分とクラスタ区分の回帰モデルの$adjR^2$を比較したグラフである.30分等間隔の区分のモデルの$adjR^2$は,0.05から0.25の比較的狭い範囲に収まり,FOMCイベント発生前後の情報は隠れてわからない.一方,クラスタ区分のモデルの$adjR^2$は,イベント発生前は比較的安定していたが,イベント直後のJPYの急上昇するタイミングでは,取引の発生間隔が目まぐるしく変化してクラスタが短くなる中で,価格変化を$OFI$に回帰した時の$adjR^2$も乱高下を繰り返し不安定に推移したことがわかる.
次に,30分等間隔の区分とクラスタ区分で,モデルの当てはまりの良さを比較する.モデルの当てはまりの比較は,発生間隔の長短が混在する場合,30分より短いクラスタの区分では$adjR^2$が大きな値となる一方で,30分より長いクラスタの区分では等間隔の場合より$adjR^2$が小さな値となることが予想される.単純に$adjR^2$の平均などを比較することは適切ではない.そこで,30分等間隔の区分とクラスタ区分の当てはまりは,各クラスタの残差の二乗和を全区間(残差の二乗和)で合計したものを用いて比較した.
結果,経済イベント発生時のデータでは,Cont et al.(2014)の30分等間隔の区分のモデルの残差の二乗和は0.39となるのに対し,クラスタ区分のモデルの残差の二乗和は0.35となり,我々のモデルのほうが残差が小さくなり,若干当てはまりが改善した.平常時のデータでも確認すると,30分等間隔の区分のモデルの残差の二乗和は0.083となるのに対し,クラスタ区分のモデルの残差の二乗和は0.081となり,こちらも,我々のモデルのほうが残差が小さくなり,若干当てはまりが改善した.また,平時とイベント発生時では平時のほうが当てはまりが良かった.
3.3 価格インパクトとデプスの関係の調査Cont et al.(2014)は株式ティックデータを用いる30分等間隔区分上の分析でデプス$Depth_i^{\hat{\kappa}}$10と価格インパクト$\hat{\beta}_i$の積が均衡状態を保つことを確認した.為替ティックデータを用いたクラスタ区分上での分析でも,類似した関係が予想されるが,経済イベントなどが生じて売買が過熱する局面で,均衡状態がどのように変化するかを調べたい.
前節の図4では,クラスタで区分した$\hat{\beta}_i$の推移を見た.ここでは,30分等間隔区分上では隠れていた$\hat{\beta}_i$の経済イベントの発生時のジャンプが確認できた.
表4は,クラスタ区分と30分等間隔区分で,$log(\hat{\beta}_i)$を$log(Depth_i)$に回帰する場合の回帰係数,P値,$R^2$を比較した表となる.クラスタ区分上で,$log(\hat{\beta}_i)$を$log(Depth_i)$に回帰(5')すると,$\hat{\alpha}_{L,i}$は-6.29,$\hat{\kappa}$は1.09とどちらも有意となり,$R^2$は0.33の結果を得た.30分等間隔区分では,$\hat{\alpha}_{L,i}$が-5.53,$\hat{\kappa}$が1.64となった.
区分 | const | pv | $\hat{\kappa}$ | pv | $R^2$ |
30分等間隔区分 | -5.53 | 0 | 1.64 | 0 | 0.34 |
クラスタ区分 | -6.29 | 0 | 1.09 | 0 | 0.33 |
30分等間隔区分(5),クラスタ区分(5')を調査
本節では,イベント発生時の為替ティックデータ全部を用いて,30分等間隔とクラスタの各区分で,$Depth_i$と$log(\hat{\beta}_iDepth_i^{\hat{\kappa}})$を調査した後,経済イベント後の売買が過熱する局面を切り出して,これらの変量がどのように変化するかを調査する.
図6は,30分等間隔とクラスタの区分に基づく,$Depth_i$の推移を示している.30分等間隔の区分での$Depth_i$は,概ね5から8で推移していた.一方,クラスタ区分での$Depth_i$も,同程度で推移したが,FOMC発表時など短い時間幅で$Depth_i$が15から20の高い値を示すクラスタ(5箇所程度)や,比較的長い時間幅で10程度の値が持続するクラスタが確認できた.30分等間隔の区分では,経済イベント発表前後の情報が隠れて,$Depth_i$の変化はわからないが,クラスタ区分からは,$Depth_i$の厚みとそのクラスタの持続時間が読み取れる.
図7は,30分等間隔の区分とクラスタ区分での$log(\hat{\beta}_iDepth_i^{\hat{\kappa}})$の推移を示している.30分等間隔の区分での$log(\hat{\beta}_iDepth_i^{\hat{\kappa}})$は,全体としては概ね-11から-12で推移した.CPI発表前後では-15から-16まで減少したところがあったが,FOMC発表時の変化は読み取れない.一方,クラスタ区分では,全体としては概ね-7から-8で推移した.CPI発表前に一旦平均よりも大きく下がった後,CPI発表が近づくに従って,比較的長い時間幅で$log(\hat{\beta}_iDepth_i^{\hat{\kappa}})$が上昇するクラスタを確認した.また,FOMC発表時には短い時間幅で$log(\hat{\beta}_iDepth_i^{\hat{\kappa}})$が-4までジャンプするクラスタや短い時間幅で-7前後の値が激しく切り替わるクラスタを確認した.$log(\hat{\beta}_iDepth_i^{\hat{\kappa}})$は,30分等間隔の区分では,情報が隠れて経済イベント発生による変化が全く読み取れない.一方で,クラスタ区分では,経済イベント発生に伴って,短い時間幅のクラスタの中で$log(\hat{\beta}_iDepth_i^{\hat{\kappa}})$がジャンプしたこと,その後も短い時間幅のクラスタが多数表れて$log(\hat{\beta}_iDepth_i^{\hat{\kappa}})$が小刻みに動いていることが確認できる.
図8は,FOMC発表前後の情報を読み取るために,FOMCイベントの発生前後5分間についての価格と$Depth_i$,$\hat{\beta}_i$の推移を局所的に切り出したグラフとなる.為替の価格の推移(上段),30分等間隔の区分とクラスタ区分での$\hat{\beta}_i$の推移(中上段),30分等間隔の区分とクラスタ区分での$Depth_i$の推移(中下段),$log(\hat{\beta}_iDepth_i^{\hat{\kappa}})$の推移(下段)を示している.
イベント発生直前のJPYは,一旦下落した(円高ドル安)が,イベント発生直後から大きく反転し,上昇(円安ドル高)を続けた.この時,30分等間隔の区分上の$\hat{\beta}_i$は,イベント前後の動きを捕らえられない.一方,クラスタ区分上の$\hat{\beta}_i$は,イベント発生直前のJPY下落時に跳ね上がり,イベント発生時に価格が反転する中で落ち着いた水準まで低下したことが分かる.クラスタ区分でのイベント前後の$\hat{\beta}_i$の動きを視覚化でき,価格推移との関係も捕らえている.
$Depth_i$についても,30分等間隔の区分ではイベント前後の動きを捕らえられない.一方,クラスタ区分では,FOMC発表前後のJPYが一旦下落して反転したタイミングで$Depth_i$は落ち込んだが,その後,JPYが円安に大きくジャンプしたタイミングでは,$Depth_i$も瞬間的に増加に転じたことが分かる.しかし,その後,数分経過すると$Depth_i$は,FOMC発表直前の水準以下にもどり,その後3から5程度で推移した.
の$\hat{\beta}_i$の推移と$Depth_i$の推移を併せて比較すると,$\hat{\beta}_i$が跳ね上がるところでは$Depth_i$が減少し,$\hat{\beta}_i$が落ち込むところでは$Depth_i$が増加しており,為替データの極端な価格ジャンプの局面でも,$\hat{\beta}_i$と$Depth_i$は,均衡を保つように推移している様子が見て取れた.30分等間隔の区分では平坦なグラフが描写されるだけだが,クラスタ区分では,$Depth_i$や$\hat{\beta}_i$の推移する様子が細かく見えるようになる.
以上,経済イベント発生前後の変化は,30分等間隔の区分を用いたモデルでは,情報が隠れて読み取れなかった.一方で,クラスタ区分を用いたモデルでは,為替の価格インパクトとデプスの積が一定の均衡が崩れても,価格変動が激しい局面を過ぎると,元の均衡に戻ることが確認できた.
3.4 為替の取引間隔と様々な要約量の関係の調査為替取引の発生間隔をクラスタに区分したことで,取引の発生間隔が均一な区間毎に,対応する取引発生強度や様々な要約量の関係を比較することが可能になった.本節では,平常時とイベント発生時のデータから得られるクラスタ区分上で,取引発生強度$\lambda_i$と価格インパクト$\hat{\beta}_i$,価格変動幅の二乗の平均$Ave(Subset(RV,C_i))$,指値の価格更新割合$nPuR\_OBS(C_i)$などの要約量の線形相関11を調査した.
図9は,平常時のデータから得たクラスタ$C_i\in {\cal C}^{0915}$上での$\lambda_i$,$Ave(Subset(RV,C_i))$,$nPuR\_OBE(C_i)$の比較となる.表5左列には,これらの相関を記載している.
図9の1段目は,$\lambda_i$と$Ave(Subset(RV,C_i)$の比較となる.変量間の相関は,$0.42$となり,強い相関ではないが,正の相関を持っていた.これは,取引が活発になるクラスタでは,価格変動幅も大きくなりやすいことを示している.
2段目は,平常時のデータから得たクラスタ$C_i\in {\cal C}^{0915}$上での$Ave(Subset(RV,C_i)$と以下で定義する$nPuR\_OBS(C_i)$の比較となる.
\begin{eqnarray*} nPuR\_OBS(C_i)\equiv \frac{\#(C_i\cap Pc\_OBS\_Set)}{\#(C_i\cap OBS\_Set)}. \end{eqnarray*} |
ここで$\#(C_i\cap OBS\_Set)$は,指値件数の合計であり,$\#(C_i\cap Pc\_LAsk\_Set)$は,価格変化を起こした指値件数の合計を示す.
指値の価格更新割合の増加は,クラスタ内の価格更新の活発化を意味するので,$nPuR\_OBE(C_i)$は価格変動の代替の指標とみなすことができる.一方で,価格変動幅の二乗の平均$Ave(Subset(RV,C_i))$の増加は,クラスタ内の価格変動幅の増加を意味するので,価格ボラティリティの代替の指標とみなすことができる.
$Ave(Subset(RV,C_i))$と$nPuR\_OBE(C_i)$の間には$0.88$と強い正の相関が現れ,価格変動幅の増加はクラスタ内の指値の価格更新の活発化と強く関係していることが確認できる.
比較した変量 | ${\cal C}^{0915}$ | ${\cal C}^{0917}$ | ${\cal E}_A^{0917}$ |
$corr(Ave(Subset(RV,C_i)), \lambda_i)$ | 0.42 | 0.16 | 0.72 |
$corr(Ave(Subset(RV,C_i)), nPuR\_OBE(C_i))$ | 0.88 | 0.32 | 0.80 |
$corr(\lambda_i, nPuR\_OBE(C_i))$ | 0.51 | 0.66 | 0.62 |
$corr(Ave(Subset(RV,C_i)), \hat{\beta}_i)$ | 0.62 | 0.95 | 0.62% |
平常時のデータ${\cal C}^{0915}$,イベント発生時のデータ${\cal C}^{0917}$,イベント発生前後のクラスタを除外したデータ${\cal E}_A^{0917}$について,$Ave(Subset(RV,C_i))$,$\lambda_i$,$nPuR\_OBE(C_i)$,$\hat{\beta}_i$などの相関を調査
3段目は,$C_i\in {\cal C}^{0915}$上での$\lambda_i$と$nPuR\_OBE(C_i)$の比較となる.相関は0.51となり,取引が活発になると,指値の価格更新も頻繁に起こることが見て取れる.
また,図10は,$nPuR\_OBS(C_i)$と$\frac{Ave(Subset(\delta t,C_i))}{Ave(Subset({Pc}\_\delta t,C_i))}$を比較したものとなる.$nPuR\_OBS(C_i)$と$\frac{Ave(Subset(\delta t,C_i))}{Ave(Subset({Pc}\_\delta t,C_i))}$は,変量の定義から強い正の相関を持つ.
\begin{eqnarray} nPuR\_OBS(C_i)\propto\frac{Ave(Subset(\delta t,C_i))}{Ave(Subset({Pc}\_\delta t,C_i))}. \end{eqnarray} | (6) |
$\lambda_i$と$nPuR\_OBE(C_i)$の正の相関と(6)式を併せて考えると,取引が活発になる(取引の強度$\lambda_i$が大きくなる)ときには,指値の発生間隔(分子)が短くなる以上に,指値の価格更新の間隔(分母)が短くなることが示唆される.
次に,イベント発生時のデータから得たクラスタ$C_i\in {\cal C}^{0917}$上で,$\lambda_i$,$Ave(Subset(RV,C_i))$,$nPuR\_OBE(C_i)$を比較した.表5中央列は,これらの相関の記載となる.$\lambda_i$と$Ave(Subset(RV,C_i))$の相関は,$0.16$とほぼ無相関であった.$\lambda_i$と$nPuR\_OBE(C_i)$の相関は,$0.66$となり,イベント発生時のデータでも,取引が活発化するほど$C_i$に対応するクラスタ内での指値の価格更新割合が大きくなる結果を得た.$Ave(Subset(RV,C_i))$と$nPuR\_OBE(C_i)$の相関は$0.32$であり,あまり強い相関は持っていなかった.$\lambda_i$と$Ave(Subset(RV,C_i))$の低い相関は,価格変動幅の二乗の平均が相場の過熱で極端な値をつけたのに対し,取引の発生頻度は大きくなったものの極端な増加はなかったことが原因と考える.
図11は,イベント発生時のデータをもとに得たクラスタ区分から,CPIとFOMCの各々のイベント発生時前後のクラスタを除外した時の$\lambda_i$,$Ave(Subset(RV,C_i))$,$nPuR\_OBE(C_i)$の比較となる.表5右列は,これらの相関を示している.経済イベントの発生時のデータを取り除いたクラスタ$C_i\in {\cal E}_A^{0917}$では,3つの変量の間に再び,比較的強い正の相関が現れた.経済イベント発生が原因で価格変動幅が過度に拡大し,イベント発生データでの正の相関を壊していたが,イベント発生時前後の数個のクラスタを除外したことで,$\lambda_i$と$Ave(Subset(RV,C_i))$には再び正の相関が現れたと考える.$\lambda_i$とクォートの価格更新割合$nPuR\_OBE(C_i)$は,どのデータからも比較的安定した正の相関を確認できた.
最後に,平常時とイベント発生時のデータで,各クラスタ$C_i$上での価格変動幅の二乗の平均$Ave(Subset(RV,C_i))$と価格インパクト$\hat{\beta}_i$の関係を調査した.表5の4段目は,これらの相関となる.イベント発生時のデータでは,$Ave(Subset(RV,C_i))$と$\hat{\beta}_i$は,$0.95$と強い正の相関があった.イベント発生直後に相場が過熱したことでこれらの変量の相関が高くなったと思われる.しかし,経済イベント発生前後のクラスタを除外すると,変量の相関は,0.62に低下した.また,平常時のデータでも,変量の相関は0.62となった.以上,クラスタ区分のもと,イベント発生時のデータを除く場合や平常時でもお互いの相関は比較的強かったが,経済イベント発生前後の過熱したクラスタを含む場合には,$Ave(Subset(RV,C_i))$と$\hat{\beta}_i$は特に強い相関が現れた.価格インパクトとボラティリティは,比較的安定した正の相関を確認できた.
3.5 指値や取引の発生間隔の共通因子の調査取引が活発になる時,マーケットメイカーによる指値の抜き差しも活発化して,指値で価格変化の発生も活発化するように見える.
本節では,為替の指値注文の発生間隔$\delta t$,指値注文での価格変化の発生間隔$PC\_\delta t$,取引の発生間隔${Trade}\_\Delta T$について,活況の変化に伴う相互の関係を調べたい.
我々は,指値や取引の発生を裏で動かす共通の潜在変数があり,潜在変数に係数を乗じることで3種類の各発生強度が変化していると仮定した.そして,3つの変数の背後にある潜在変数を共通因子として取り出して,発生頻度のボラティリティの代理変数とみなすことで,他の変量との関係を調査した.
図12は,イベント発生時のデータでから得た各クラスタ$C_i \in {\cal C}^{0917}$に対して,指値の平均発生間隔$Ave(Subset(\delta t,C_i))$(OBEの発生間隔),価格変化を伴う指値の平均発生間隔$Ave(Subset({Pc}\_\delta t,C_i))$(価格変動を伴うOBEの発生間隔),取引の平均発生間隔$Ave(Subset({Trade}\_{Set},C_i))$(取引発生強度$\lambda_i$の逆数)の相関を調べたグラフとなる.これらの発生間隔の変量は,相互に強い正の相関を持つことが分かる.
我々は,これらの発生間隔の変量から,発生間隔をコントロールする潜在変数を因子分析の手法により抽出して,他の変量との関係を調査した.
\begin{eqnarray*} d_{1,i}&=&Ave(Subset(\delta t,C_i)),\\ d_{2,i} &=& Ave(Subset({Pc}\_\delta t,C_i)),\\ d_{3,i} &=& Ave(Subset({Trade}\_{Set},C_i)). \end{eqnarray*} |
OBE,価格変動を伴うOBE,取引の発生の各変数$d_{i}$の逆数
\begin{eqnarray*} \{1/d_{1,i},1/d_{2,i},1/d_{3,i}\} \equiv \{\lambda_{1,i},\lambda_{2,i},\lambda_i\} \end{eqnarray*} |
をとることで共通の因子を用いて以下のようにまとめることができる.
\begin{eqnarray*} \hat \lambda_{1,i} &=& \beta_1 Factor_i+\epsilon_{1,i}, \\ \hat \lambda_{2,i} &=& \beta_2 Factor_i+\epsilon_{2,i}, \\ \hat \lambda_i &=& \beta_3 Factor_i+\epsilon_{3,i}. \end{eqnarray*} |
$\hat \{\lambda_{1,i},\hat \lambda_{2,i},\hat \lambda_i\}$は,$\{\lambda_{1,i},\lambda_{2,i},\lambda_i\}$を基準化した変量であり,共通因子$Factor_i$は,基準化の変量をもとに抽出していることに注意する.
図13は,経済イベントの発生時について,為替レート(上段)と発生間隔の共通因子$Factor_i$(中段),価格変動幅の二乗の平均$Ave(Subset(RV,C_i))$(下段)を並べたグラフとなる.また,表6は,$Factor_i$と$Ave(Subset(RV,C_i))$,$nPuR\_OBE(C_i)$,$\hat{\beta}_i$の線形相関を比較した表となる.
比較した変量 | ${\cal C}^{0915}$ | ${\cal C}^{0917}$ | ${\cal E}_A^{0917}$ |
$corr(Factor_i, Ave(Subset(RV,C_i)))$ | 0.44 | 0.20 | 0.84 |
$corr(Factor_i, nPuR\_OBE(C_i)$ | 0.51 | 0.83 | 0.86 |
$corr(Factor_i, \hat{\beta}_i)$ | 0.12 | 0.28 | 0.52 |
平常時のデータ${\cal C}^{0915}$,イベント発生時のデータ${\cal C}^{0917}$,イベント発生前後のクラスタを除外したデータ${\cal E}_A^{0917}$について,$Factor_i$と$Ave(Subset(RV,C_i))$,$nPuR\_OBE(C_i)$,$\hat{\beta}_i$の相関を調査.
$Ave(Subset(RV,C_i))$は価格変動幅の変量だが,$Factor_i$は,指値や取引の発生間隔の粗密ばかりでなく,取引量や価格変動など様々な情報を内包する変量となる.経済イベントの発生時(図13)には,$Ave(Subset(RV,C_i))$と$Factor_i$は共に跳ね上がって,似たような動きをしているが,線形相関は0.20と低い値となった.一方で,イベント直前直後の異常値が多いクラスタを除くと0.84と正の相関を示した.相場の過熱で$Ave(Subset(RV,C_i))$が跳ね上がったのに比べ,$Factor_i$は安定して推移したことで,両方の動きに乖離が生じたものと思われる.また,平常時のデータでは,0.44の相関を示していた.
次に,クォートの価格更新割合$nPuR\_OBE(C_i)$と発生間隔の共通因子$Factor_i$の相関を調査した.$nPuR\_OBE(C_i)$と$Factor_i$の相関は,平常時で$0.51$,経済イベント発生時の全データでは$0.83$,経済イベント発生時の一部除外データでは$0.86$と,比較的大きな値を示した.これは,発生間隔の共通因子$Factor_i$が大きくなると,指値注文全体に占める価格更新の割合が高くなることを示している.
この他,$Factor_i$と$\hat{\beta}_i$の相関は,平常時で$0.12$,経済イベント発生時の全データでは$0.28$,経済イベント発生時の一部除外データでは$0.52$となった.
以上,平常時やイベント直前直後の異常値を除いたクラスタでは,発生間隔の共通因子$Factor_i$は,価格変動幅の二乗の平均$Ave(Subset(RV,C_i))$やクォートの価格更新割合$nPuR\_OBE(C_i)$と正の相関を持っており,相場の活況をとらえる指標となっていた.
本研究では,為替ティックデータをCont et al.(2014)の30分等間隔と本研究のクラスタのそれぞれで区分して回帰モデルに当てはめることで,Cont et al.(2014)が株式ティックデータを30分等間隔で区分して得た結果と類似の結果を得るかを調査した.そして,$OFI$の2次項が価格にほとんど影響しないこと,$OFI$は$TI$よりも価格変化を良く説明することなど,Cont et al.(2014)と類似の結果を得ることを確認した.
更に,回帰モデルから得た価格インパクト$\beta$と修正決定係数$adjR^2$について,区分の取り方で見え方に違いが生じることを確認し,また,回帰モデルの当てはまりを比較した.イベント発生時のデータを見ると,30分等間隔の区分では,情報が平準化されてしまい,価格の動きに応じたイベント発生時点の変量の変化を全くとらえることができないのに対し,クラスタ区分では,イベント発生時点での価格ジャンプに応じて,価格インパクトがジャンプする様子や,修正決定係数が不安定になる様子が視覚化できていた.また,残差の最少二乗誤差を用いて,クラスタ区分と30分等間隔の区分のデータのモデルへの当てはまりを比較すると,クラスタ区分の方が残差の最少二乗誤差が小さくなり,当てはまりは改善することを確認した.
次に,為替ティックデータを30分等間隔とクラスタで区分し,Cont et al.(2014)が株式で調査した価格インパクトとデプスの積が一定に近い値となる関係を確認した.特に,FOMCイベントの発生前後を部分的に切り出したデータを詳しく見ると,クラスタ区分では,経済イベントの局面でも,価格インパクトが増加する中でデプスが減少し,デプスが戻る中で価格インパクトが減少することで均衡に戻る様子が確認できた.
次に,本研究のクラスタ区分によるモデル化で,様々な変量を要約して比較できる様になったことを受け,発生強度$\lambda_i$と対応するクラスタ$C_i$上で,価格変動幅,価格インパクト,価格更新割合などの要約量の線形相関を調査した.平常時やイベント発生時の異常値を除いた場合のクラスタ区分上では,発生強度と価格変動幅,価格更新割合,価格インパクトは互いに正の相関を持つことを確認した.
最後に,指値の発生間隔$\delta t$,価格変化を伴う指値の発生間隔$PC\_\delta t$,取引発生間隔${Trade}\_\Delta T$は,相場の活発や非活発に伴って似た動きをするように見えるので,発生強度と対応するクラスタ区分のもとで,これらの変量の共通因子を抽出した.そして,取り出した共通因子が,クラスタ区分上で価格インパクト,価格変動幅,価格更新割合などの要約量と正の相関を持つことを確認した.
図1 価格と発生間隔の推移(例)
図2 ビッド/アスクの価格と量の推移(例)
上段2行:ビッド/アスク の価格の推移.下段2行:ビッド/アスク の量の推移.
図3 JPY,$\Delta t$,$\lambda_i$の推移
上段: イベント発生時のデータ(2014/9/16 21:00から2014/9/17 21:00(GMT))でのJPYの推移,中段: 取引間隔$\Delta t$の推移,下段: 各クラスタ$i=1,\cdots,I$毎に値$\lambda_i$,幅${(T_{i-1},T_{i}]}$を持つ階段関数の推移,垂直線: 米国のCPI発表(2014/9/17 12:30:00(GMT))とFOMC発表(2014/9/17 18:00:00(GMT))の時刻.
図4 イベント発生時のデータでのJPYの推移(上段)と30分等間隔区分(下段上)とクラスタ区分(下段下)での$\hat{\beta}_i$の推移の比較.
図5 イベント発生時のデータでのJPYの推移(上段)と30分等間隔区分(下段上)とクラスタ区分(下段下)での$adjR^2$の推移の比較.
図6 イベント発生時のデータでのJPYの推移(上段)と30分等間隔区分(下段上)とクラスタ区分(下段下)での$Depth_i$の推移の比較.
図7 イベント発生時のデータでのJPYの推移(上段)と30分等間隔区分(下段上)とクラスタ区分(下段下)での$log(\hat{\beta}_iDepth_i^{\hat{\kappa}})$の推移の比較.
図8 イベント発生時のデータのFOMCイベント発生時刻18:00$\pm$00:05でのJPYの推移(上段),30分等間隔区分とクラスタ区分での$\hat{\beta}_i$の推移(中上段),30分等間隔区分とクラスタ区分での$Depth_i$の推移(中下段),30分等間隔区分とクラスタ区分での$log(\hat{\beta}_iDepth_i^{\hat{\kappa}})$の推移(下段)の比較.
図9 平常時のデータでの$\lambda, Ave(Subset(RV,C_i)), nPuR\_OBE(C_i)$の相関比較
図10 イベント発生時のデータでの$nPuR\_OBS(C_i)$とs$\frac{Ave(Subset(\delta t,C_i))}{Ave(Subset({Pc}\_\delta t,C_i))}$の比較.
図11 イベント発生時のデータ(イベント発生時のクラスタ除外後)での$\lambda, Ave(Subset(RV,C_i)), nPuR\_OBE(C_i)$の相関比較.
図12 イベント発生時のデータの$C_i\in {\cal E}_A$上での指値の平均発生時刻$Ave(Subset(\delta t,C_i))$,価格を変化させる指値の平均発生時刻$Ave(Subset({Pc}\_\delta t,C_i))$,取引の平均発生時刻$Ave(Subset({Trade}\_\Delta T,C_i))$の比較.
図13 イベント発生時のデータでのJPYの推移(上段),$Factor_i$の推移(中段),$Ave(Subset(RV,C_i))$の推移(下段)の比較.
クラスタ区分については,Deal Recordから得られた${Trade}\_\Delta T$をそのまま使用して作成しているが,それ以外の分析は,Price Recordをもとに,Deal Recordを適宜参照して,指値の提示,取引の成立,指値のキャンセルに分類することで本研究の分析データを作成している.
Price Recordから,本研究の分析データを作る際に留意した点は以下となる.
1.Deal Recordには,Price Recordに表示されている取引と,Price Recordに表示されていないダークプールの取引が含まれていること.
2.EBSデータの制約でPrice Recordは,0.1秒単位で区切られているので,ベスト・ビッドとベスト・アスクの指値が同じ時間間隔で発生する可能性があること.
3.ベスト・アスク(ベスト・ビッド)の指値の提示,取引の成立,指値のキャンセルのイベントが,同じ時間間隔で発生する可能性があること.
これらの問題について,本研究では,以下のように対処を行っている.
・1.Deal Recordの価格$P_{t_n}^{buy}$ $(P_{t_n}^{sell})$が1つ前のPrice Recordの価格$P_{t_{n-1}}^A$ $(P_{t_{n-1}}^B)$と等しい場合,Deal Recordの量を取引と対応する指値の量として数える.
一方,Deal Recordの価格$P_{t_n}^{buy}$ $(P_{t_n}^{sell})$が1つ前のPrice Recordの価格$P_{t_{n-1}}^A$ $(P_{t_{n-1}})$と等しくない場合,Deal Recordの量をダークプールでの取引と見なして,取引と対応する指値の量とは数えない.
・2.ベスト・ビッドとベスト・アスクの指値が同じ時間間隔で発生する場合は,指値が同じ時間間隔でベスト・ビッドとベスト・アスクの両方が同時に発生しないようにカウントするために,データの配置順序に従って,微小時間ずらした発生時間を再割り当てする.
・3.ベスト・ビッド(ベスト・アスク)の指値の提示,取引の成立,指値のキャンセルのイベントが,同じ時間間隔で発生することを避けるため,以下の順序に従ってデータを分類する.詳しい,近似方法は付録付録Bに示してある.
ベスト・ビッドの発生イベントについては,$P_{t_n}<P_{t_{n-1}}$またはの$P_{t_n}=P_{t_{n-1}},q_{t_n}>q_{t_{n-1}}$ケースをベスト・ビッド増加イベント,それ以外のケースをベスト・ビッド減少イベントと定義する.ベスト・ビッドの減少イベントは,取引イベントとキャンセルイベントがあるが,$P_{t_n}^{buy}=P_{t_{n-1}^a}$の時を取引イベントと定義し,取引量を上限に指値の減少量を割り当てる.上記以外のベスト・ビッドの減少イベントは,キャンセルイベントと定義する.
ベスト・アスクも同様に定義する.
指値の発生のイベントは,点過程の中で同時には起こらない仮定のもとでは,指値の発生時刻の集合$OBESet$は,ベスト・アスクでの指値の提示$LimitAsk\_Set$,ベスト・アスクでの取引の成立$MarketBuy\_Set$,ベスト・アスクでの指値のキャンセル$CancelAsk\_Set$,ベスト・ビッドでの指値の提示$LimitBid\_Set$,ベスト・ビッドでの取引の成立$MarketSell\_Set$,ベスト・ビッドでの指値のキャンセル$CancelBid\_Set$を用いて直和で表現できる.
\begin{eqnarray*} OBESet & =& LimitAsk\_Set\ \dot{\cup}\ (MarketBuy\_Set\ \dot{\cup}\ CancelAsk\_Set)\\ &\ \dot{\cup}\ & LimitBid\_Set\ \dot{\cup}\ (MarketSell\_Set\ \dot{\cup}\ CancelBid\_Set). \end{eqnarray*} |
しかし、実際のデータは,複数のレコードが,EBS DataSetの最小区切りである0.1秒区間の中で同時に起こるかもしれない.
\begin{eqnarray*} MarketBuy\_Set\ &{\cap}&\ CancelAsk\_Set\neq \phi, \\ MarketSell\_Set\ &{\cap}&\ CancelBid\_Set\neq \phi. \end{eqnarray*} |
このため,取引とキャンセルの同時発生を考慮した指値注文の量の分割アルゴリズムが必要となる.本研究の分析データは,以下の分割アルゴリズムに従って指値の発生を分類した.
・アスクでの指値の提示$LimitAsk\_Set$
\begin{equation*} q\_LAsk({t_n})= \begin{cases} q_{t_{n}}^a-q_{t_{n-1}}^a & \text{$((P_{t_{n-1}}^a=P_{t_n}^a)\land (q_{t_{n-1}}^a<q_{t_n}^a))$},\\ q_{t_{n}}^a & \text{$(P_{t_{n-1}}^a> P_{t_n}^a)$},\\ 0 & \text{$others$}. \end{cases} \end{equation*} |
ここで$t_n$はOBEの発生時刻,$t_{n-1}$は$t_n$の直前のOBEの発生時刻を指す.そして$t_n\in LimitAsk\_Set \Leftrightarrow q\_LAsk({t_n})\neq 0$として$LimitAsk\_Set$を定義する.
・アスクでの取引の成立$MarketBuy\_Set$
\begin{equation*} q\_MBuy({t_n})= \begin{cases} q_{t_{n-1}}^a & \text{$((P_{t_{n-1}}^a< P_{t_n}^a)\land (P_{t_{n-1}}^a=P_{t_n}^{buy})\land (q_{t_{n-1}}^a<=q_{t_n}^{buy}))$},\\ q_{t_{n}}^{buy} & \text{$((P_{t_{n-1}}^a<P_{t_n}^a)\land (P_{t_{n-1}}^a=P_{t_n}^{buy})\land (q_{t_{n-1}}^a>q_{t_n}^{buy}))$},\\ q_{t_{n-1}}^a-q_{t_n}^a & \text{$((P_{t_{n-1}}^a=P_{t_n}^a)\land (P_{t_{n-1}}^a=P_{t_n}^{buy})\land (q_{t_{n-1}}^a>q_{t_n}^a)\land (q_{t_{n-1}}^a-q_{t_n}^a<q_{t_n}^{buy}))$},\\ q_{t_n}^{buy} & \text{$((P_{t_{n-1}}^a=P_{t_n}^a)\land (P_{t_{n-1}}^a=P_{t_n}^{buy})\land (q_{t_{n-1}}^a>q_{t_n}^a)\land (q_{t_{n-1}}^a-q_{t_n}^a>=q_{t_n}^{buy}))$},\\ 0 & \text{$others$}. \end{cases} \end{equation*} |
ここで$t_n$はOBEの発生時刻,$t_{n-1}$は$t_n$の直前のOBEの発生時刻を指す.そして$t_n\in MarketBuy\_Set \Leftrightarrow q\_MBuy({t_n})\neq 0$として$MarketBuy\_Set$を定義する.
・アスクでの指値のキャンセル$CancelAsk\_Set$
\begin{equation*} q\_CAsk({t_n})= \begin{cases} q_{t_{n-1}}^a-q_{t_n}^{buy} & \text{$((P_{t_{n-1}}^a<P_{t_n}^a)\land (P_{t_{n-1}}^a= P_{t_n}^{buy})\land (q_{t_{n-1}}^a>q_{t_n}^{buy}))$},\\ q_{t_{n-1}}^a & \text{$((P_{t_{n-1}}^a<P_{t_n}^a)\land (P_{t_{n-1}}^a\neq P_{t_n}^{buy}))$},\\ q_{t_{n-1}}^a-q_{t_n}^a-q_{t_n}^{buy} & \text{$((P_{t_{n-1}}^a=P_{t_n}^a)\land (P_{t_{n-1}}^a= P_{t_n}^{buy})\land (q_{t_{n-1}}^a>q_{t_n}^a)\land (q_{t_{n-1}}^a-q_{t_n}^a>=q_{t_n}^{buy}))$},\\ q_{t_{n-1}}^a-q_{t_n}^a & \text{$((P_{t_{n-1}}^a=P_{t_n}^a)\land (P_{t_{n-1}}^a\neq P_{t_n}^{buy})\land (q_{t_{n-1}}^a>q_{t_n}^a))$},\\ 0 & \text{$others$}. \end{cases} \end{equation*} |
ここで$t_n$はOBEの発生時刻,$t_{n-1}$は$t_n$の直前のOBEの発生時刻を指す.そして$t_n\in CancelAsk\_Set \Leftrightarrow q\_CAsk({t_n})\neq 0$として$CancelAsk\_Set$を定義する.
・ビッドでの指値の提示$LimitBid\_Set$
\begin{equation*} q\_LBid({t_n})= \begin{cases} q_{t_{n}}^b-q_{t_{n-1}}^b & \text{$((P_{t_{n-1}}^b=P_{t_n}^b)\land (q_{t_{n-1}}^b>q_{t_n}^b))$},\\ q_{t_{n}}^b & \text{$(P_{t_{n-1}}^b< P_{t_n}^b)$},\\ 0 & \text{$others$}. \end{cases} \end{equation*} |
ここで$t_n$はOBEの発生時刻,$t_{n-1}$は$t_n$の直前のOBEの発生時刻を指す.そして$t_n\in LimitBid\_Set \Leftrightarrow q\_LBid({t_n})\neq 0$として$LimitBid\_Set$を定義する.
・ビッドでの取引の成立$MarketSell\_Set$
\begin{equation*} q\_MSell({t_n})= \begin{cases} q_{t_{n-1}}^b & \text{$((P_{t_{n-1}}^b>P_{t_n}^b)\land (P_{t_{n-1}}^b=P_{t_n}^{sell})\land (q_{t_{n-1}}^b<=q_{t_n}^{sell}))$},\\ q_{t_{n}}^{sell} & \text{$((P_{t_{n-1}}^b>P_{t_n}^b)\land (P_{t_{n-1}}^b=P_{t_n}^{sell})\land (q_{t_{n-1}}^b>q_{t_n}^{sell}))$},\\ q_{t_{n-1}}^b-q_{t_n}^b & \text{$((P_{t_{n-1}}^b=P_{t_n}^b)\land (P_{t_{n-1}}^b=P_{t_n}^{sell})\land (q_{t_{n-1}}^b>q_{t_n}^b)\land (q_{t_{n-1}}^b-q_{t_n}^b<q_{t_n}^{sell}))$},\\ q_{t_n}^{sell} & \text{$((P_{t_{n-1}}^b=P_{t_n}^b)\land (P_{t_{n-1}}^b=P_{t_n}^{sell})\land (q_{t_{n-1}}^b>q_{t_n}^b)\land (q_{t_{n-1}}^b-q_{t_n}^b>=q_{t_n}^{sell}))$},\\ 0 & \text{$others$}. \end{cases} \end{equation*} |
ここで$t_n$はOBEの発生時刻,$t_{n-1}$は$t_n$の直前のOBEの発生時刻を指す.そして$t_n\in MarketSell\_Set \Leftrightarrow q\_MSell({t_n})\neq 0$として$MarketSell\_Set$を定義する.
・ビッドでの指値のキャンセル$CancelBid\_Set$
\begin{equation*} q\_CBid({t_n})= \begin{cases} q_{t_{n-1}}^b-q_{t_n}^{sell} & \text{$((P_{t_{n-1}}^b>P_{t_n}^b)\land (P_{t_{n-1}}^b=P_{t_n}^{sell})\land (q_{t_{n-1}}^b>q_{t_n}^{sell}))$},\\ q_{t_{n-1}}^b-q_{t_n}^b-q_{t_n}^{sell} & \text{$((P_{t_{n-1}}^b=P_{t_n}^b)\land (P_{t_{n-1}}^b=P_{t_n}^{sell})\land (q_{t_{n-1}}^b>q_{t_n}^b)\land (q_{t_{n-1}}^b-q_{t_n}^b>=q_{t_n}^{sell}))$},\\ q_{t_{n-1}}^b & \text{$((P_{t_{n-1}}^b>P_{t_n}^b)\land (P_{t_{n-1}}^b\neq P_{t_n}^{sell}))$},\\ q_{t_{n-1}}^b-q_{t_n}^b & \text{$((P_{t_{n-1}}^b=P_{t_n}^b)\land (P_{t_{n-1}}^b\neq P_{t_n}^{sell})\land (q_{t_{n-1}}^b>q_{t_n}^b))$},\\ 0 & \text{$others$}. \end{cases} \end{equation*} |
ここで$t_n$はOBEの発生時刻,$t_{n-1}$は$t_n$の直前のOBEの発生時刻を指す.そして$t_n\in CancelAsk\_Set \Leftrightarrow q\_CBid({t_n})\neq 0$として$CancelAsk\_Set$を定義する.
・価格変化を伴うアスクでの指値の提示$Pc\_LimitAsk\_Set$
\begin{equation*} q\_Pc\_LAsk({t_n})= \begin{cases} q_{t_{n}}^a & \text{$(P_{t_{n-1}}^a> P_{t_n}^a)$},\\ 0 & \text{$others$}. \end{cases} \end{equation*} |
ここで$t_n$はOBEの発生時刻,$t_{n-1}$は$t_n$の直前のOBEの発生時刻を指す.そして$t_n\in Pc\_LimitAsk\_Set \Leftrightarrow q\_Pc\_LAsk({t_n})\neq 0$として$Pc\_LimitAsk\_Set$を定義する.
$Pc\_LimitBid\_Set$は$Pc\_LimitAsk\_Set$のアナロジーとして定義する.
1 本論文のデプスは,ベスト・ビッド/アスクの平均を指す.30分等間隔区分での$Depth_i$の定義はCont et al.(2014)と同じ.クラスタ区分での$Depth_i$の定義は2.5節に記載.
2 価格と数量の記号は,Cont et al.(2014)やVinkovskaya.E(2014)の既存研究の表記法に倣っている.数量または価格の記号の右上に,指値注文のサイド:Bid/Ask,取引注文のサイド:Buy/Sellを表す.これらはべき乗ではないことに注意する(特に断らない限り,他の添え字も識別記号を意味する).
3 $N^a+N^b\geq \#OBESet$.なお,添え字#は集合の個数を示す
4 クラスタ分類においてプログラムがエラーを起こさないようにパラメータを推定するために,クラスタに含まれる最小のティックの数を30に設定した
5 $OBESet$上の全ての価格変動幅の集合を$\Delta P = \{\Delta P_{t_{k,i}}|{t_{k,i}} \in OBESet\}$で定義する
6 $Depth_i$は,$C_i$上でのビッドとアスクの指値注文の量の平均である.$Depth_i$は,Cont et al.(2014)に従って,以下の様に定義する.
\begin{eqnarray*} Depth_i = \frac{1}{2}\left[\frac{\Sigma_{t_n \in C_i}\left(q_{t_n}^a1_{\{P_{t_n}^a> P_{t_{n-1}}^a \}}+q_{t_{n-1}}^a1_{\{P_{t_{n}}^a< P_{t_{n-1}}^a\}}\right)}{\Sigma_{t_n \in C_i}1_{\{P_{t_n}^a\neq P_{t_{n-1}}^a \}}} + \frac{\Sigma_{t_n \in C_i}\left(q_{t_n}^b1_{\{P_{t_n}^b< P_{t_{n-1}}^b \}}+q_{t_{n-1}}^b1_{\{P_{t_{n}}^b> P_{t_{n-1}}^b\}}\right)}{\Sigma_{t_n \in C_i}1_{\{P_{t_n}^b\neq P_{t_{n-1}}^b \}}}\right] \end{eqnarray*} |
7 日本時間(JST)では2014年9月15日06:00:00~2014年9月16日06:00:00,ニューヨーク夏時間(EDT)では2014年9月14日17:00:00~2014年9月15日17:00:00に対応
8 日本時間(JST)では2014年9月17日06:00:00~2014年9月18日06:00:00,ニューヨーク夏時間(EDT)では2014年9月16日17:00:00~2014年9月17日17:00:00に対応
9 比較に使用する変量と区間上の標本平均を以下で定義する.
・標本平均
クラスタ上の変量間の関係性を調査するために,我々は,区間$Set$上の変量$op_n$の標本平均を以下で定義する.
\begin{eqnarray*} Ave(Subset(OP,Set))=\frac{1}{\#Set}\Sigma_{s \in Set}op_s, \end{eqnarray*} |
ここで$Subset(OP,Set)=\{op_s|s\in Set \subset Index\} \subset OP=\{op_s|s\in Index=\{1,...,N_s\}\}$.
‐価格変動幅の二乗
価格変動幅の二乗の集合を次のように定義し,
\begin{eqnarray*} RV=\{(\Delta P_{t_n})^2|{t_n} \in OBESet\}. \end{eqnarray*} |
この$C_i$上での部分集合を$Subset(RV,C_i)=\{(\Delta P_{t_{k,i}})^2|{t_{k,i}}\in C_i\}$と定義する.この標本平均を$Ave(Subset(RV,C_i))$と記載する.
‐スプレッド
スプレッドの集合を次のように定義し,
\begin{eqnarray*} Lab=\{Spread_{t_n}=2\frac{P_{t_n}^a-P_{t_n}^b}{P_{t_n}^a+P_{t_n}^b}|{t_n} \in OBESet\}. \end{eqnarray*} |
この$C_i$上での部分集合を$Subset(Lab,C_i)=\{Spread_{t_{k,i}}|{t_{k,i}}\in C_i\}$と定義する.更に,この標本平均を$Ave(Subset(Lab,C_i))$と記載する.
‐発生間隔
$\delta t$の部分集合を$Subset(\delta t,C_i)=\{\Delta {t_{k,i}}|{t_{k,i}}\in C_i\}$と定義する.更に,この標本平均を$Ave(Subset(\delta t,C_i))$と記載する
10 $Depth_i^{\hat{\kappa}}$の添え字$\hat{\kappa}$はべき乗を意味する.
11 本論文では変量間の線形相関を調査.線形相関は,$Corr$を用いて表示する.