機械学習による為替フォワード取引期間の判別モデルおよび運用シミュレーション

雉子波 晶; 杉本 誠忠; 酒本 隆太; 鈴木 智也

doi:10.32212/jafee.20.0_22

概要

本研究は，外国為替証拠金取引業務におけるロールオーバー戦略について検討した．一般に実務においては流動性の観点より，受渡し日が短いトゥモローネクストでロールオーバーするのが一般的である．しかし理論的には金利のタームプレミアムを考慮すると，1週間や3週間など長期のフォワード取引を活用することにより受取りスワップポイントの上乗せを期待できる．しかし稀に短期のスワップ金利が急騰する場合があり，その際に長期フォワード取引を選択していれば高いスワップポイントを逃してしまう．そこで我々は機械学習によって長期のフォワード取引を積極的に選ぶべきタイミングを検出し，短期のトゥモローネクストおよびより長期のフォワード取引を組み合わせた混合戦略を提案する．このタイミングは，対象通貨における為替相場のみならず，株式・債券・商品先物など様々な要因が非線形的に影響すると考えられる．またフォワードレートは一般的にカバー付き金利平価説によって定式化できるが，突発的な政治経済情勢などの変化によって，現実のフォワードレートは理論値から乖離する可能性がある（Du et al. (2018a)）．その結果，タームプレミアムの逆転現象（短期と長期のフォワード取引から得られるスワップ金利の逆転現象）も実際に度々観測される．本研究ではこのような状況を踏まえ，理論値からの乖離に影響を与えうる要因を説明変数とし，機械学習によって適切なフォワード期間を選択するための判別モデルを構築した．教師データとして過去の最適解を学習し，その後の判別を行った結果，約70%の正答率を実現できた．さらに獲得したスワップポイントのリスクリターン比によれば，我々の混合戦略は長期のフォワード取引と同等の安定性を維持したまま，短期のトゥモローネクストと同等の収益性を実現できた．

1　はじめに

外国為替証拠金（Foreign Exchange Trading: FX）取引では，約定の2営業日後に現物の受渡しを行うルールがある．しかし一般的に取引額は高額に及ぶため，FX業者など非銀行が毎回現物を用意するのは非現実的である．そこで長期に渡りドル円を買い持ちしたい場合，約定の翌日にドル円を売り，さらに同時に新規にドル円を買う．つまり売り取引と買い取引を同時に行い，決済日を繰り延べする．これをロールオーバーといい，ロールオーバーを繰り返すことで現物の受渡しを無期限化できる．さらにロールオーバー時にトゥモローネクスト（以下，トムネ）や1週間フォワードといった，受渡し日を自由に長期化できるフォワード取引を組み合わせることでスワップポイントを獲得できるようになる¹．外国為替取引において通貨ごとに金利が異なり，この金利差はスワップポイントとして表される．通常の経済状況では決済日までの期間が長いほど金利が高くなるタームプレミアムが考えられるため，決済日が長期に及ぶフォワード取引の方が多くのスワップポイントを獲得しやすい²．しかし流動性リスクや在庫管理業務の観点により，実務においては受渡し日が短いトムネでロールオーバーするのが一般的である．

本研究ではロールオーバーにおける長期のフォワード取引の選択について分析する．フォワードレートと金利の関係については一般的にカバー付き金利平価説（Covered Interest rate Parity: CIP）によって定式化できる．2008年のグローバル金融危機以前はCIPからの乖離は一時的という報告が多くの研究でなされてきた（Taylor (1987), Fletcher and Taylor (1996), Takezawa (1995), Akaram et al. (2008)）³．さらにLustig et al. (2011)やMenkhoff et al. (2012)など為替ポートフォリオの研究においても，CIPが成立していることを前提でポジションを構築することが一般的に行われている．しかしグローバル金融危機以降はCIPからの乖離が大きく，また継続することがBaba and Packer (2009), Du et al. (2018a), Cerutti et al. (2021)などで報告されている．その理由としてBaba and Packer (2009)では金融機関同士のカウンターパーティーリスク，Du et al. (2018a)では金融危機後の銀行への規制，Cerutti et al. (2021)では上記の要因に加え，非伝統的金融政策が重要な役割を果たしていることが指摘されている．加えてDu et al. (2018b)とAvdjiev et al. (2019)は金融危機以後は米ドルによる資金調達コストが上昇していることを示している．以上のようにCIPからの乖離について近年市場構造が変化しており，大きな注目を集めている．

我々は上述の先行研究のようにCIPからの乖離の要因を検証するのではなく，ロールオーバー戦略の効率化を目的とする．本研究ではロールオーバーを行う金融機関は，トムネでのロールオーバーを複数回行うか，あるいはより長期の先物でロールオーバーを行うかを選択する．この選択を決定するモデルに機械学習を用いる．近年，機械学習によるモデルの有効性がファイナンスの研究においてもクレジットリスク（Khandani et al. (2010), Butaru et al. (2016)），株価リターン（Gu et al. (2020)），債券リターン（Bianchi et al. (2021)）で有効性が示されている．本研究では機械学習の中でもChen and Guestrin (2016)により提案されたXGBoostを用いる．XGBoostはNobre and Neves (2019)やYe and Schuller (2021)で示されているように非線形な市場の構造を捉えるのに適している．マクロ経済変数と為替の収益機会についても非線形の関係があることが知られているため⁴，XGBoostにより通常の線形モデルでは捉えきれない非線形性を捉えることが期待される．なお本論文は，著者らの研究成果（雉子波・杉本・酒本・鈴木 (2021)）に，追加実験を行ったうえで改訂したものである．

2　カバー付き金利平価からの乖離

本稿に用いる数式記号を表1に示す．wはフォワード取引の期間を表し，w∈{0, 1, 2, 3}とする．ここで， w=0をトムネ， w=1を1週間フォワード， w=2を2週間フォワード， w=3を3週間フォワードとする．なお時刻tは，営業日（土日祝日を含まない）とする．

カバー付き金利平価とは，どの通貨で資産を保有しても収益率が同じになることを仮定した為替レートの決定理論である．ドル円市場を例とすると，

1+ywtnwt365=FwtSt1+dwtnwt365

(1)

が成立するものとする．これを変形して，フォワードレートの理論値Fw*を得る．

Fw*t=St1+ywtnwt3651+dwtnwt365

(2)

しかし実際のフォワードレーFwtは理論値から乖離する．その乖離ewt（=Fwt-Fw*t）を図1に示す．主にマイナス側に乖離が発生する様子を確認できる．カバー付き金利平価の範疇では，フォワードレートFwtは2カ国間の金利差によって決定されるが，実際には通貨に対する需給の変化も関係すると思われる．例えば，ある銀行においてドルの調達意欲が高まった場合，割安なフォワードレートFwtを提示するため，乖離ewtはマイナス側に偏る．さらに乖離ew(t)はフォワード取引の期間wによっても異なり，これは日米の株式や債権，商品先物市場などの動向や今後の予想がドル調達に伴う時間感覚に影響するためと考えられる．なお，得られるスワップポイントは

Awt=Fwt-St=Fw*t-St+ew(t)

(3)

であるため⁵，乖離ew(t)が理論的な金利差収益（金利平価）以上に得られる追加的なスワップポイントとなる．金利のタームプレミアムの判別に加えて，この乖離の判別もフォワード取引の選択にとって重要となる．

図1　カバー付き金利平価（理論値）からの乖離ew(t)

表1　本稿で用いる数式記号

記号	意味
nw(t)	フォワード日数
Fw(t)	フォワードレートの実測値
Fw*t	フォワードレートの理論値
ew(t)	理論値からの乖離: Fwt-Fw*(t)
S(t)	スポットレート
Aw(t)	スワップポイント: Fwt-S(t)
yw(t)	日本のLIBOR金利（年率）
dw(t)	米ドルのLIBOR金利（年率）
ydw(t)	内外金利差: ywt-dw(t)
Δ*(t+i)	変数の時間変化: t+i-(t)

3　要因分解

本稿は最も基礎的な設定として，トムネ（w=0）または長期フォワード（w∈1, 2, 3）のいずれかを各営業日tにおいて選択する2クラス判別問題とする．比較のため互いのフォワード日数nw(t)を統一すると，トムネに対する長期フォワードの超過スワップポイントは

Rwt+nwt-1=Aw(t) - ∑i=0nwt-1A0'(t+i)

(4)

となる．ここで日付を追加するiには土日祝日を含むとする．しかし実際には土日祝日のスワップポイントは存在せず，その前日にまとめて付与される．これは決済日が土日祝日になる場合，フォワード日数nwが翌営業日まで延長されるためである．特にトムネの場合，通常はn0=1であるが，木曜日においてはn0=3，休日の2営業日前においてはn0=休日数+1となる⁶．そこで式(4)のように和の形式で表現するために，w=0について以下の前処理によって揺らぎを除去し，1日分の値に補正する．

A0't=A0tn0t

(5)

F0't=St+A0'

(6)

F0*t=S(t)1+y0(t)13651+d0(t)1365

(7)

e0't=F0't-F0*t

(8)

この補正により，本章で用いるシグマ記号∑i 中の変数が土日祝日の場合は，前営業日の値を代用できる．なお，Rw<0ならば長期フォワード（陽性），Rw≥0ならばトムネ（陰性）が最適解となる．この答えはnwt-1日後の決済日に確定するため，本判別問題はRw(t+nwt-1)の予測に相当する．図2にの様子を示す．フォワード日数Rw(t)が長いほどRw<0の頻度が増えている．つまりトムネよりも長期フォワードを選択すべき機会が増えており，1章で述べたタームプレミアムの議論と整合的である．

図2　(a) 目的変数Rw(t)の時系列プロット，(b) Rwの頻度分布

次に，Rwを構成する本質的な要因を把握すべく，式(4)を展開する．詳細は付録1に示すが，Rw(t+nwt-1)はα~εという5つの要因に分解できる．

Rwt+nwt-1=α-β-γ-δ-ε

(9)

ここで，

α=Awt-nw(t)∙A0'(t)

(10)

β=1365∑i=1nwt-1∆S(t+i)∙∆yd0(t+i)

(11)

γ=1365∙yd0(t)∑i=1nwt-1∆S(t+i)

(12)

δ=1365∙S(t)∑i=1nwt-1yd0(t+i)

(13)

ε=∑i=1nwt-1∆e0't+i=∑i=1nwt-1e0't+i-nwt-1∙e0'(t)

(14)

となる．なお，αは時刻tで期待される超過スワップポイント（対トムネ），β, γ, δはスポットレートと内外金利差のクロスターム項（非線形性），εは乖離の未来変化量である．Rw(t+nwt-1)の判別において，現在時刻tで確定している変数はそのまま機械学習に投入すれば良く，将来時刻t+iで確定する変数については何らかの代理変数を用いて予測する必要がある．

式(9)を構成する各要因（α~ε）の混合比率を図3に示す．なお全て絶対値処理を施し，各要因の合計が1.0になるように補正した．結果として，αとεが本質的であることが判る．近年の低金利により内外金利差yd0は小さく，その差分∆yd0は更に小さい．そして365で除される点も理由である．なおαは時刻tでの確定値であるため，εを予測する問題となる．そこでεに含まれるe0'(t)や∑i=1nwt-1e0'(t+i)の自己相関関数を図4に示す．

これらの乖離には自己相関構造が存在するため，現在までに確定している乖離のヒストリカルデータが機械学習にとって有用だと考えられる（仮説1）．しかし2章で考察したように，乖離は為替の受給変化の影響を受けるため，様々な金融市場に関する説明変数も有用だと考えられる（仮説2）．さらに金融システムは複雑系であるため，機械学習においては線形モデルより非線形モデルの方が有用だと考えられる⁷（仮説3）．次章において，この3つの仮説を検証する．

図3　要因分解の混合割合（ただしw=3の場合）

図4　(a) 乖離e0'tの自己相関関数，(b) ∑i=1nw(t-1)e0'(t+i)の自己相関関数（ただしw=3の場合）

4　機械学習による仮説の検証

仮説3を検証するために，線形モデルと非線形モデルを比較する．本研究は2クラス判別問題であるため，線形モデルとして「線形判別分析」「ロジスティック回帰 (正則化なし)」「ロジスティック回帰 (L1正則化あり)」「ロジスティック回帰 (L2正則化あり)」「サポートベクターマシン (線形カーネル)」の5モデルを用いる．なお正則化は，多重共線性や過学習を緩和する効果を期待している．比較対象となる非線形モデルについてもモデル数を揃えつつ，代表的な「k近傍法」「ニューラルネットワーク」「サポートベクターマシン (多項式カーネル)」「サポートベクターマシン (RBFカーネル)」「XGBoost」の5モデルを用いる．Pythonのライブラリとして，XGBoostには「xgboost 1.3.3」を用い，それ以外には「scikit-learn 0.24.1」を用いた．なお一般的なモデリング性能を評価すべく，ハイパーパラメータはデフォルト値を用いた．それらの詳細を付録2に示す．

2014年1月〜2021年1月を機械学習の評価期間とし，毎日動的に再学習することでモデルパラメータを更新する．各評価日tから直近22日間⁸を検証期間とし，学習期間の最適化に用いる．検証期間より以前の50日間, 100日間, ⋯, 500日間を学習期間の候補とし，それぞれでモデルパラメータを学習し，検証期間のAUC（Area Under Curve）⁹を評価する．その後，AUCを最大化する学習期間に最新の検証期間を加えてモデルパラメータを再学習し，評価日tの判別を行う．このtを1ずつ進めながら上記を繰り返し，評価期間全体の判別精度を検証する．

表2　機械学習に用いる説明変数

式(9)中の時刻tで確定している変数
期待超過スワップポイント	α=Awt-nwtA0'(t)
国内外の金利差	yd0(t)
スポットレート	S(t)
理論値からの乖離	e0'(t)
フォワード日数	nw(t)
目的変数Rwに関する変数
実現超過スワップポイント	Rwt-Rwt-1 \| w∈1, 2, 3
実現スワップポイント	wの各要素を同時に利用
乖離e0'に関する変数
乖離のヒストリカル合計値	wの各要素を同時に利用10
スポットレートSに関する変数
変化率
モメンタム	変化率の平均値（直近25日）
ボラティリティ	変化率の標準偏差（直近25日）
VIX指数	IVIXt-IVIX(t-1)
CVIX指数	ICVIXt-ICVIX(t-1)
金利に関する変数
内外金利差	ydwt-ydwt-1 \| w∈0, 1, 2, 3
物価に関する変数
WTI原油先物価格	IWTIt-IWTI(t-1)
CRB原材料価格指数	ICRBt-ICRB(t-1)
CRB金属サブ指数	ICRBMt-ICRBM(t-1)
CRB食品サブ指数	ICRBFt-ICRBF(t-1)
国債に関する変数
米国債金利（3ヶ月）	Iu3mt-Iu3m(t-1)
米国債金利（2年）	Iu2yt-Iu2y(t-1)
米国債金利（10年）	Iu10yt-Iu10y(t-1)
日本国債金利（3ヶ月）	Ij3mt-Ij3m(t-1)
日本国債金利（2年）	Ij2yt-Ij2y(t-1)
日本国債金利（10年）	Ij10yt-Ij10y(t-1)
景気に関する変数
TOPIX指数	Itopixt-Itopix(t-1)
S&P500指数	Ispt-Isp(t-1)
World Stock指数	Iworldt-Iworld(t-1)
金スポット価格	Igoldt-Igold(t-1)
ドルインデックス	Iusdt-Iusd(t-1)
円インデックス	Ijpyt-Ijpy(t-1)

3章の仮説を鑑み，機械学習に用いる説明変数を表2に示す．時刻tで確定している変数や目的変数に関する変数に加え，仮説1に関して乖離e0に関する変数や，仮説2に関して様々な金融市場の情報を投入する．例えば先行研究（Du et al. (2018), Bakshi and Panayotov (2013), Lettau et al. (2014), Byrne et al. (2019)）によれば，為替レートはコモディティ価格や株式のボラティリティの影響を受けるため，CRB指数，株式市場指数，VIX指数を投入する．その他，短期および長期の金利情報も用いる．なお目的変数Y(t)については，Rwt+nwt-1<0ならばYt=1（陽性: 長期フォワードを選択），Rw(t+nwt-1)≥0ならばYt=0（陰性: トムネを選択）とする．

図5に，評価期間における各モデルのROC曲線およびAUCを示す．ROC曲線はTPR（True Positive Rate: 真陽性率）とFPR（False Positive Rate: 偽陽性率）のトレードオフを示し，その下方面積を表すAUC（Area Under the Curve）値が大きいほど判別性能に優れている．結果として，いずれのwにおいてもXGBoostの判別性能が最良であり，他の非線形モデルも概ね線形モデルよりも優れている．これにより仮説3の妥当性を確認し，複雑な金融システムをモデリングするには非線形モデルは有用である．非線形モデルは線形モデルを内包するため，過学習が及ばない評価期間において有用であるならば，解釈性や計算コストを優先しない限り非線形モデルを避ける理由は無いだろう．

図5　 ROC曲線とAUC値: (a) w=1の場合，(b) w=2の場合，(c) w=3の場合

図6　 XGBoostにおける説明変数の重要度（ただしw=3の場合）

次に仮説1，2の検証として，XGBoostに用いた各説明変数の重要度（Feature importance）を図6に示す．この重要度の算出には，xgboostライブラリのget_scoreメソッドにて「importance_type='gain'」と設定した¹¹．オリジナルのXGBoost（Chen and Guestrin (2016)）は決定木を構成するため，ノード毎の分割基準に各説明変数をランダムに割り当て，ノード分割によって低減できた不純度（ジニ係数など）の差分を情報利得（gain）として算出する．XGBoost全体を学習した後，説明変数毎に複数の情報利得が得られるため，説明変数毎に情報利得を平均化することで各説明変数の重要度を算出した．なお比較のため，各時刻tにおいて重要度の合計値が1.0になるように補正した．結果として，乖離のヒストリカル合計値に関する変数の重要度が高く，仮説1の妥当性を確認できる．しかし乖離のみでは不十分であり，他の説明変数も一様に重要であることから，仮説2の妥当性も確認できる．

5　運用シミュレーション

XGBoostによる判別モデルを実務に活用することを想定し，どの程度の収益改善を期待できるのか検証する．その際にベストな運用パフォーマンスを実現すべく，Optuna（Akiba at el. (2019)）によりXGBoostのハイパーパラメータを最適化した．その評価指標として，検証期間におけるLog損失を最小化するハイパーパラメータを選択した．表3にハイパーパラメータの探索範囲を示す．未記載のハイパーパラメータはデフォルト値を用いた．その他，評価期間や評価日t毎の再学習，学習期間の最適化は前章と同一とする．

表3　ハイパーパラメータの探索範囲

random_state	0
max_depth	3~9
min_child_weight	0.1~10.0
gamma	10-8~100
colsample_bytree	0.60~0.95
subsample	0.60~0.95

図7に評価期間の混同行列を，表4に評価スコアを示す．提案手法の評価スコアはより長期の長期フォワードを対象にするほど向上している．これは図5の各wにおけるXGBoostの判別性能と整合的である．なお従来の一般的な手法として，同判別問題において常にトムネを選択した場合の正答率はそれぞれ42.4%（w=1の場合），42.6%（w=2の場合），40.0%（w=3の場合）であり，いずれも提案手法の方が優れている．

図7　混同行列: (a) w=1の場合，(b) w=2の場合，(c) w=3の場合

表4　提案手法の評価スコア（太字は各項目の最良値）

取引手法	正答率	再現率	適合率	F値
w=1	62.8%	67.3%	67.9%	67.9%
w=2	65.4%	69.3%	70.0%	69.7%
w=3	72.9%	74.5%	79.1%	76.7%

次に，獲得したスワップポイントAw(t)について比較する．これまでと同様に，評価期間における各営業日t毎に判別するが，スワップポイントはフォワード日数nw(t)に応じて拡大するため，フォワード日数で除した1日あたりの換算値Aw'(t)で評価する．

Aw't=Aw(t)nw(t)

(15)

ここで，w=0は常にトムネを選択する場合に相当し，w∈1, 2, 3は常に長期フォワード（1週間，2週間，3週間）を選択する場合に相当する．両者の混合戦略である提案手法についてはw∈0, 1, 0, 2, 0, 3として表す．

表5に，獲得したスワップポイント集合Aw'のパーセンタイルを示す．単位は10Lot（1万ドル）あたりの円である．負のスワップポイントは受け取り，正のスワップポイントは支払いを意味するため，Aw'は負の方向に大きいほど望ましい．

まず，常にトムネを選択する場合（w=0）の最小値は-1068.5と非常に大きい一方で，最大値は0.7と正の値でありスワップポイントを支払う危険を伴う．つまり高リターンの代償として高リスクを伴う．一方，常に長期フォワードを選択する場合（w∈1, 2, 3）は，最小値のリターンは縮小するものの，最大値は負の値を維持しており，各パーセンタイルも常にトムネを選択するよりも優れている．これは長期のフォワード日数により中心極限定理が働き，標準偏差が縮小したためと考えられる．つまりリスクを低減できるが，トムネのような高リターンも低減してしまう．しかし両者の混合戦略である提案手法では，両者の長所を同時に実現できている．最大値は常にトムネを選択する場合と同等であり，最小値や各パーセンタイルは常に長期フォワードを選択する場合に接近している．

さらに表6に，リターンとリスクの詳細を示す．なお，Aw'の平均値でリターンを評価し，リスクについては通常の標準偏差に加えて，次式の半偏差（Semi Deviation: SEM）を用いる．

SEM=Emax⁡(Aw't-τ, 0)2

(16)

この半偏差は下方リスクに相当し，τは損失とみなす基準である．本研究ではτとして，標準偏差が最小になると期待される3週間フォワードのみ（w=3）の平均値を用いる¹²．つまり高リターンよりも低リスクを優先した場合を基準とし，これよりも更にリターンが悪化するならば損失とみなす．

結果として，平均値については提案手法と常にトムネを選択する場合が高リターンであり，提案手法で混合するフォワード取引を長期化するほど平均値は向上している．これは常に長期フォワードを選択する場合も同様であり，タームプレミアムによる恩恵だと考えられる．標準偏差については，中心極限定理により常に長期フォワードを選択する場合が低リスクであり，常にトムネを選択する場合が高リスク，提案手法はその中間である．しかし下方リスクのみに着眼すると，提案手法のリスクリターン比（平均値/半偏差）は，常に長期フォワードを選択する場合と同等である．つまり現実的には，提案手法は常に長期フォワードを選択する場合と同等の低リスク水準を実現しつつ，常にトムネを選択する場合と同等の高リターンを獲得できる混合戦略と言える．

表5　1日あたりの獲得スワップポイントAw'

取引手法	最小値 [¥/10Lot]	25パーセンタイル [¥/10Lot]	中央値 [¥/10Lot]	75パーセンタイル [¥/10Lot]	最大値 [¥/10Lot]
常にトムネのみ（w=0）	-1068.5	-61.0	-22.4	-8.0	0.7
常に1週間フォワードのみ（w=1）	-201.9	-63.6	-30.9	-10.0	-1.3
常に2週間フォワードのみ（w=2）	-187.1	-65.9	-32.9	-11.0	-3.95
常に3週間フォワードのみ（w=3）	-167.1	-66.7	-35.2	-11.8	-4.3
提案手法（混合戦略w∈0, 1）	-1068.5	-65.5	-26.4	-9.7	-1.0
提案手法（混合戦略w∈0, 2）	-1068.5	-65.8	-27.1	-10.5	-0.2
提案手法（混合戦略w∈0, 3）	-1068.5	-67.1	-29.3	-11.6	-0.3

表6　1日あたりの獲得スワップポイントAw'の平均値および標準偏差

取引手法	平均値 [¥/10Lot]	標準偏差 [¥/10Lot]	平均値/ 標準偏差	半偏差 [¥/10Lot]	平均値/ 半偏差
常にトムネのみ（w=0）	-44.1	78.9	-0.56	25.8	-1.71
常に1週間フォワードのみ（w=1）	-38.2	30.2	-1.26	21.3	-1.79
常に2週間フォワードのみ（w=2）	-40.2	31.1	-1.29	20.4	-1.97
常に3週間フォワードのみ（w=3）	-41.6	30.7	-1.35	19.6	-2.12
提案手法（混合戦略w∈0, 1）	-43.2	66.3	-0.65	23.4	-1.85
提案手法（混合戦略w∈0, 1）	-44.6	70.7	-0.63	23.0	-1.94
提案手法（混合戦略w∈0, 1）	-46.5	69.0	-0.67	22.2	-2.09

6 まとめ

フォワードレートの理論値（カバー付き金利平価）からの乖離に着眼し，より多くのスワップポイントを獲得できるフォワード取引を機械学習により判別した．その際に，長期フォワード取引による追加的なスワップポイントを目的変数とし，これを解析的に要因分解することで機械学習モデルを設計した．特に要因分解を通じて，理論値からの乖離の高い影響力や非線形モデルの必要性を認識し，乖離に影響し得る様々な金融市場に関する説明変数を採用した．実データ分析を通じてこれらの妥当性を検証したところ，広範な説明変数が機械学習に寄与している様子や，非線形ダイナミクスを表現できるXGBoostの導入により線形なロジスティック回帰よりも判別精度を向上できることを確認した．実運用を想定したシミュレーションにおいては，本判別モデルによる正答率やF値は約70%に達し，取引期間を長期化するほど良好であった．獲得したスワップポイントのリスクリターン比によれば，短期のトゥモローネクストはリターンは高いがリスクも高く，フォワード取引を長期化すれば中心極限定理によりリスクを低下できるが高いリターンを失った．しかし本判別モデルによる混合戦略は，短期のトゥモローネクストと同等の収益性を維持したまま，長期のフォワード取引と同等の安定性を実現した．つまり本研究により，低リスクかつ高リターンなロールオーバー戦略を実現できた．

なお1章で述べたように，実務においては流動性や在庫管理に伴う業務リスクも考慮しつつ長期のフォワード取引を選択する必要がある．そこで今後の課題として，このような業務リスクとタームプレミアムのトレードオフを考慮しつつ，最適なフォワード取引を判別する．さらにリスクの観点から，ドル円市場のみならず新興国市場についても検証する．

付録A

式(4)から式(9)を得る詳細を示す．

Rwt+nwt-1=Awt-∑i=0nwt-1A0't+i

=Fwt-St-[F0't+F0't+1+⋯+F0't+nwt-1

-St+St+1+⋯+St+nwt-1]

=Fwt-St-nwt∙F0't-St

-F0't+1-F0't+⋯+F0't+nwt-1-F0't

+St+1-St+⋯+St+nwt-1-St

=Awt-nw(t)∙A0'(t)-∑i=1nwt-1ΔF0't+i-ΔS(t+i)

ここで，

ΔF0t+i-ΔSt+i=F0t+i-F0t-St+i-St

=F0't+i-F0't-St+i-St

=F0*t+i-F0*t+e0't+i-e0't-St+i-St

=F0*t+i-St+i-F0*t-St+Δe0't+i

≃St+i∙y0t+i-d0t+i∙1365-St∙y0t-d0t∙1365+Δe0't+i

=St+i∙yd0t+i∙1365-St∙yd0t∙1365+Δe0't+i

=1365∙[St+i-St∙yd0t+i-yd0t+yd0(t)∙St+i-St+St ∙yd0t+i-yd0(t)]+Δe0't+i

=1365∙ΔSt+i∙Δyd0t+i+yd0t∙ΔSt+i+St∙Δyd0t+i+Δe0't+i

最終式にてab-cd=(a-c)(b-d)+d(a-c)+c(b-d)の関係を利用した．したがって，

Rwt+nwt-1

=Awt-nwt∙A0't-1365∑i=1nwt-1Δ St+i∙Δyd0t+i+yd0t∑i=1nwt-1ΔSt+i+St∑i=1nwt-1Δyd0t+i-∑i=1nwt-1Δe0't+i

=Awt-nwt∙A0't

-1365∑i=1nwt-1ΔSt+i∙Δyd0t+i

-1365∙yd0t∑i=1nwt-1ΔSt+i

-1365∙St∑i=1nwt-1Δyd0t+i

-∑i=1nwt-1Δe0't+i

が得られる．

付録B

4章の機械学習に用いたハイパーパラメータを以下に示す．各項目の意味については，ライブラリの説明サイト（scikit-learn: https://scikit-learn.org/0.23/，XGBoost: https://xgboost.readthedocs.io/en/release_1.3.0/parameter.html）を参照されたし．

表7　 4章の機械学習に用いたハイパーパラメータ

線形判別分析		l1_ratio	None
solver	svd	ロジスティック回帰（L2正則化あり）
shrinkage	None	penalty	l2
priors	None	dual	False
n_components	None	tol	1e-4
stor_covariance	False	C	1.0
tol	1.0e-4	fit_intercept	True
covariance_estimator	None	Interccept_scaling	1
ロジスティック回帰（正則化なし）		class_weight	None
penalty	none	random_state	0
dual	False	solver	lbfgs
tol	1e-4	max_iter	100
C	1.0	multi_class	auto
intercept_scaling	1	verbose	0
class_weight	None	warm_start	False
random_state	0	n_jobs	None
solver	lbfgs	l1_ratio	None
max_iter	100	サポートベクターマシン（線形カーネル）
multi_class	auto	C	1.0
verbose	0	kernel	linear
warm_start	False	degree	3
n_jobs	None	gamma	scale
l1_ratio	None	coef0	0.0
ロジスティック回帰（L1正則化あり）		shrinking	True
penalty	l1	probability	True
dual	False	tol	1e-3
tol	1e-4	cache_size	200
C	1.0	class_weight	None
fit_intercept	True	verbose	False
intercept_scaling	1	max_iter	-1
class_weight	None	decision_function_shape	ovr
random_state	0	break_ties	False
solver	liblinear	random_state	0
max_iter	100	k近傍法
multi_class	auto	n_neighbors	5
verbose	0	weights	uniform
warm_start	False	algorithm	auto
n_jobs	None	leaf_size	30
metric	minkowski	p	2
metric_params	None	gamma	scale
n_jobs	None	coef0	0.0
ニューラルネットワーク		shrinking	True
hidden_layer_sizes	(100, )	probability	True
activation	relu	tol	1e-3
solver	adam	cache_size	200
alpha	0.0001	class_weight	None
batch_size	auto	verbose	False
learning_rate	constant	max_iter	-1
learning_rate_init	0.001	decision_function_shape	ovr
power_t	0.5	break_ties	False
max_iter	200	random_state	0
shuffle	True	XGBoost
random_state	0	booster	gbtree
tol	1e-4	verbosity	1
verbose	False	validate_parameters	false
momentum	0.9	nthread	not set
nesterovs_momentum	True	disable_default_eval_metric	false
early_stopping	False	eta	0.3
validation_fraction	0.1	gamma	0
beta_1	0.9	max_depth	6
beta_2	0.999	min_child_weight	1
epsilon	1e-8	max_delta_step	0
n_iter_no_change	10	subsample	1
max_fun	15000	sampling_method	uniform
サポートベクターマシン（多項式カーネル）		colsample_bytree	1
C	1.0	colsample_bylevel	1
kernel	poly	colsample_bynode	1
degree	3	lambda	1
gamma	scale	alpha	0
coef0	0.0	tree_method	auto
shrinking	True	sketch_eps	0.03
probability	True	scale_pos_weight	1
tol	1e-3	updater	grow_colmaker
cache_size	200	refresh_leaf	1
class_weight	None	process_type	default
verbose	False	grow_policy	depthwise
max_iter	-1	max_leaves	0
decision_function_shape	ovr	max_bin	256
break_ties	False	predictor	auto
random_state	0	objective	binary:logistic
サポートベクターマシン（RBFカーネル）		base_score	0.5
C	1.0	eval_metric	logloss
kernel	poly	seed	0
degree	3	seed_per_iteration	false

謝辞

本研究の遂行にあたり有益なご助言を頂いた，外貨ex byGMO株式会社の市川佳彦氏やホエルデン氏に感謝申し上げます．なお本稿の内容は筆者個人の見解であり，所属組織の公式見解ではありません．本研究の一部はJSPS科研費（20K11969）の助成により行われました．

脚注

1 マネックス証券: https://info.monex.co.jp/fx/fx-plus/rule/swap.html（参照日: 2021.9.7）

2 例えばGürkaynak and Wright (2012)などを参照．

3 一方，カバーなし金利平価（Uncovered Interest rate Parity: UIP）は乖離することが多く，収益機会となることが報告されてきた．Fama (1984), Bekaert and Hodrick (1993), Engel (1996), Lustig and Verdelhan (2007), Menkhoff et al. (2012)などを参照．

4 Bansal (1997), Bansal and Dahlquist (2000), Baillie and Kim (2015), Sakemoto (2019)を参照．

5 Awt<0の方が高金利通貨の保有によるスワップポイントは大きい．例えばdwt>ywtならば，式(1)よりFwt<S(t)となる．

6 マネックス証券: https://info.monex.co.jp/fx/fx-plus/rule/swap.html（参照日: 2021.9.7）

7 混合割合が微小であるが，β, γ, δは非線形を有する．

8 1ヶ月間の平均的な営業日数に相当する．各国で祝日数が異なるため土日のみを除いた暦日数を12ヶ月で割ると21.7日になる．

9 後述するROC曲線の下方面積を意味する．

10 w>0においても式(5)〜式(8)のように1日分に補正した後に和をとる．

11 Python API Reference: https://xgboost.readthedocs.io/en/latest/python/python_api.html（参照日: 2021.12.25）

12 結果として1週間フォワードのみ（w=1）の標準偏差が最小であるが，これは事後的に分かることである.

参考文献

Akiba, T., Sano, S., Yanase, T., Ohta, T., and Koyama, M. (2019), “Optuna: A next-generation hyperparameter optimization framework,” Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2623-2631.
Akram, Q. F., Rime, D., and Sarno, L. (2008), “Arbitrage in the foreign exchange market: Turning on the microscope,” Journal of International Economics, 76(2), 237-253.
Ang, A., and Chen, J. S., (2010), “Yield curve predictors of foreign exchange returns,” AFA 2011 Denver Meetings Paper.
Avdjiev, S., Du, W., Koch. C., and Shin, H. S. (2019), “The dollar, bank leverage, and deviations from covered interest parity,” American Economic Review: Insights, 1(2), 193-208.
Baba, N., and Frank, P. (2009), “Interpreting deviations from covered interest parity during the financial market turmoil of 2007-08,” Journal of Banking and Finance, 33(11), 1953-1962.
Baillie, R. T. and Kim, K. H. (2015), “Was it risk? Or was it fundamentals? Explaining excess currency returns with kernel smoothed regressions,”Journal of Empirical Finance, 34, 99-111.
Bakshi, G., and Panayotov, G. (2013), “Predictability of currency carry trades and asset pricing implications,” Journal of Financial Economics, 110(1), 139-163.
Bansal, R. (1997), “An exploration of the forward premium puzzle in currency markets,” The Review of Financial Studies, 10(2), 369-403.
Bansal, R. and Dahlquist, M. (2000), “The forward premium puzzle: different tales from developed and emerging economies,” Journal of International Economics, 51(1), 115-144.
Bekaert, G., and Hodrick, R.J. (1993), “On biases in the measurement of foreign exchange risk premiums,” Journal of International Money and Finance, 12(2), 115-138.
Bianchi, D., Büchner, M., and Tamoni, A (2021), “Bond risk premiums with machine learning,” The Review of Financial Studies, 34(2), 1046-1089.
Butaru, F., Chen, Q., Clark, B., Das, S., Lo, A.W., and Siddique, A. (2016), “Risk and risk management in the credit card industry,” Journal of Banking and Finance, 72, 218-239.
Byrne, J. P., Ibrahim, B. M., and Sakemoto, R. (2019), “Carry trades and commodity risk factors,” Journal of International Money and Finance, 96, 121-129.
Cerutti, E. M., Obstfeld, M., and Zhou, H. (2021), “Covered interest parity deviations: Macrofinancial determinants,” Journal of International Economics, 130, 103447.
Chen, T., and Guestrin, C. (2016), “Xgboost: A scalable tree boosting system,” Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 785-794.
Chen, Y. C., and Tsang, K. P. (2013), “What does the yield curve tell us about exchange rate predictability?” The Review of Economics and Statistics, 95(1), 185-205.
Du, W., Tepper, A., and Verdelhan, A. (2018a), “Deviations from covered interest rate parity,” The Journal of Finance, 73(3), 915-957.
Du, W., Im, J., and Schreger, J. (2018b), “The U.S. treasury premium,” Journal of International Economics, 112, 167-181.
Engel, C. (1996), “The forward discount anomaly and the risk premium: A survey of recent evidence,” Journal of Empirical Finance, 3, 123-192.
Fama, E. F. (1984), “Forward and spot exchange rate,” Journal of Monetary, 14(3), 319-338.
Fletcher, D. J., and Taylor, L. W. (1996), “"Swap" covered interest parity in long-date capital markets,” The Review of Economics and Statistics, 78(3), 530-538.
Gu, S., Kelly, B., and Xiu, D. (2020), “Empirical asset pricing via machine learning,” The Review of Financial Studies, 33(5), 2223-2273.
Gürkaynak, R. S., and Jonathan, H. W. (2012), “Macroeconomics and the term structure,” Journal of Economic Literature, 50(2), 331-367.
Khandani, A. E., Kim, A. J., and Lo, A. W. (2010), “Consumer credit-risk models via machine-learning algorithms,” Journal of Banking and Finance, 34(11), 2767-2787.
Lettau, M., Maggiori, M., and Weber, M. (2014), “Conditional risk premia in currency markets and other asset classes,” Journal of Financial Economics, 114(2), 197-225.
Lustig, H., Roussanov, N., Verdelhan, A. (2011), “Common risk factors in currency markets,” The Review of Financial Studies, 24(11), 3731-3777.
Lustig, H., and Verdelhan, A. (2007), “The cross section of foreign currency risk premia and consumption growth risk,” American Economic Review, 97(1), 89-117.
Menkhoff, L., Sarno, L., Schmeling, M., and Schrimpf, A. (2012), “Carry trades and global foreign exchange volatility,” Journal of Finance, 67(2), 681-718.
Nobre, J., and Neves, R. F. (2019), “Combining principal component analysis, discrete wavelet transform and XGBoost to trade in the financial markets,” Expert Systems, 125, 181-194.
Rossi, B. (2013), “Exchange rate predictability,” Journal of Economic Literature, 51(4), 1063-1119.
Sakemoto, R. (2019), “Currency carry trades and the conditional factor model,” International Review of Financial Analysis, 63, 198-208.
Takezawa, N. (1995), “Currency swaps and long-term covered interest parity,” Economics Letters, 49(2), 181-185.
Taylor, M. P. (1987), “Covered interest parity: A high-frequency, high-quality data study,” Economica, 54(216), 429-438.
Ye, Z. J., and Schuller, B. W. (2021), “Capturing dynamics of post-earnings-announcement drift using a genetic algorithm-optimized XGBoost,” Expert Systems, 177, 114892.
雉子波晶・杉本誠忠・酒本隆太・鈴木智也 (2021), 「機械学習による為替フォワード取引期間の判別モデル」, 『人工知能学会研究会資料』, SIG-FIN-027, 87-93.

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）