In this study, we analyze the information value of extreme opinions on Twitter that are identified by the most positive and negative Twitter sentiments for each firm. We find that these extreme opinions predict stock returns without subsequent reversals. In addition, they contain incremental information regarding firm fundamentals that are identified by subsequent revisions in analysts' earnings forecasts and target prices. Finally, we find that the return predictability is attributed to the fundamental information contained in the extreme tweets. Our analysis sheds light on the role of extreme opinions on social media.
景気の先行きを考える上で,製造業の生産活動の活況度合いをいち早く把握することは重要である.本研究では,日本における製造業の主要業種である自動車工業の生産量のナウキャスティング手法を提案する.具体的には,携帯電話端末の位置情報(GPS 情報)を用いることで,大手自動車メーカーの工場の敷地内に滞在している人数を時間帯ごとに計測し,そこから得られる情報を基に,自動車工業の生産状況を推計するモデルの構築を行った.これにより,高い速報性を保ちつつ,大手自動車各社の生産量の概ねの推計に成功した.更に本研究では,同情報が示すメーカーごとの生産状況の趨勢に基づく株式投資戦略を構築することで,堅調なパフォーマンスを確認した.このことは,株式市場予測における,携帯電話の位置情報に基づく生産量把握の有効性を示す結果と言えよう.
In This paper, the investment performances of the AI traders that predict fluctuations in Nikkei 225 Futures during the period under COVID-19 Crisis were measured. In addition, by comparing the data under the Lehman Shock with "learned AI traders" and "not learned AI traders", learning of past market crash could improve the investment performance of AI traders in future market crash. Furthermore, it was confirmed that AI traders who have learned the period of the Lehman shock were more likely to avoid risk when the market fluctuation range was small.
個人のライフサイクルを前提として長期投資を考える場合,通常の分散分析アプローチとは異なり多期間最適化の視点が必要となる.より現実に即した仮定の下で,強化学習を用いて構築した投資ポートフォリオは典型的な手法より優れた生涯効用を達成し得ることを検証する.
金融市場安定時には高頻度取引(HFT)は市場に流動性を供給すると言われている.しかし,金融危機等で市場が不安定になった際,彼らは注文の供給を手控えてしまい,それが市場不安定化に拍車をかけているのではないかという批判の声がある.そこで本研究では,HFT 戦略の中では一般的なマーケットメイク戦略をとるHFT が,市場急落時にどのような行動をし,それが市場にどのような影響を与えているのかを人工市場を用いて観察した.
Various preceding market models can reproduce basic financial stylized facts such as volatility clustering, but most of those models require ad hoc tuning of parameters for the reproduction. Inspired by the idea of the sandpile model, we present a simple agent-based model of the financial market named Self-organized Speculation Game, where the number of traders is spontaneously tuned. While this model has high reproducibility of stylized facts, it holds similar behavioral properties to those of the sandpile model. The simulation results infer the possible contribution of self-organized criticality for the spontaneous emergence of stylized facts.
資産運用会社や証券会社などの多くの金融機関では,定期的な(月次,週次等)市況コメントを作成し,顧客に提供している.この市況コメントを作成する際には,ニュース記事や公的機関発表の統計など,様々な情報源にあたり事実関係を確認しながら,実務者の知識や経験に照らして原稿を作成することになる.一方で,こうした市況コメントの調査・執筆の作業は時間とコストが伴うものである.もし,主要な情報源から,自然言語処理をはじめとした機械的なプロセスによって,信頼できる市況コメントを作成することができれば,それは金融機関における当該業務のコストの削減,あるいは処理の迅速化やカバレッジ拡大による顧客サービス向上に資することになる.そこで,本研究では,まずニュース記事に含まれる原因・結果を含む因果文を抽出することで,市況コメントを自動的に生成することを試みた.
本研究では,金融テキストを用いて,債券市場における金融極性辞書を構築するための表現獲得,および極性付与手法を提案する.獲得する語句は,各金融市場において特徴的な語やそれらを表現にまで拡張した文字列である.例えば,「増加」という語について,その語のみでは極性を決定できず,「消費が増加」や「リスクが増加」のように語の前後関係まで広く捉えることで極性が付与できる.我々はこれまで株式を対象として表現獲得,および,極性付与のための手法[1]を開発しており,良好な精度を得た.しかし,債券を対象として表現獲得,および,極性付与を行う場合,高い精度を達成できなかった.債券における表現への極性付与の精度が低い原因は, 債券市場における極性付与が複雑であるという点が挙げられる.そこで,本研究では特に債券市場を対象として,表現に対して景気要因における極性,債券における極性をそれぞれ付与することで,上記の問題を解決することを試みる.
Recognizing risks that are descriptive information is important to judge how companies manage their risks, that is, the consistency of the strategy when evaluating companies. So, in this research, risk is defined as "uncertainty of future results that can be obtained by taking actions", and we tried to extract the details of the risks recognized by each company from the text of the securities report. We also tried to classify the extracted risk based on their respective contents. The extraction method is investigating and classifying the expression patterns (possibly, etc.) used when expressing the content of risk, and using them as clues.
In this paper, we examine whether it is possible to generate the government's "Assessment of the current state of the economy" by the Japanese government using several economic indicators that are believed to be consistent with the Japanese economic trend. In the Monthly Economic Report released by the Cabinet Office, the government publishes the government's "Assessment of the current state of the economy" along with expressions such as "recovering," "worsening," and "standstill", etc. In this paper, we developed a model to generate the government's "Assessment of the current state of the economy" and tested the accuracy of the predictions. In addition, we examined which economic indicators are likely to influence the government's "Assessment of the current state of the economy". It is expected that this analysis will be useful in predicting the government's policy decisions.
資産配分の文脈において,各資産の価格変動を横断的に説明する共通因子を構成し,これを介して資産配分を決定するアプローチが注目されている.このような価格変動の共通因子はリスクファクターと呼ばれる.特に,マルチアセット市場(multi-asset market) を説明するリスクファクターはマクロ経済的な概念と紐づけて解釈されることが多く,マクロファクターとも呼ばれる.リスクファクターの構成手法としては主成分分析が広く用いられている.しかし,主成分分析によって構成されるリスクファクターは上位のものを除き,その解釈が困難であるという問題点がある.リスクファクターを介して資産配分を決定するアプローチにおいては,より多くのリスクファクターを解釈できることが望ましく,このような主成分分析の性質は実務上重大な問題である.本研究では上に掲げた主成分分析の問題点を解決する次元削減手法を提案し,人工データ及びマルチアセット市場データを用いた実験によってその有効性を示す.マルチアセット市場データを用いた実験では,提案手法によって構成されたマクロファクターを貿易,金融政策,外交政策など,相異なるマクロ経済的な概念と紐づけて解釈する.
When predicting stock prices with a complex model using machine learning or artificial intelligence, overfitting sometimes occurs, and the prediction accuracy expected in actual operation cannot be obtained. In such a model, the cost function is presumed to be steep and multi-modal, while in a model that maintains stable prediction results, the cost function is considered to be gradual and single-peaked. In this study, we first compared the performance of several stock price prediction models, and then visualized the cost function for each model using t-SNE. As a result, the model using Lasso regression, which had the highest performance, showed a gradual unimodal cost function, while the linear regression, which had relatively low performance, showed a steep and multi-modal shape. Visualizing the cost function using t-SNE can be an important index for evaluating the stability and versatility of a stock price prediction model.
アセットアロケーションやデリバティブの計算において, 金融資産の変動規模を表すボラティリティが活用されている. 一方で, ボラティリティは直接観測される量ではないため, 観測量に対する潜在変数を用いたモデル化が行われている. これらのモデルは総じてボラティリティ変動モデルとよばれており, 主に計量ファイナンスや金融工学の分野において使用されてきた. 従来のボラティリティ変動もモデルのほとんどは線形モデルであるため, 非線形性を有する複雑なボラティリティ変動を推定することができない. 潜在変数の非線形ダイナミクスを推定する機械学習モデルとして, ガウス過程動的潜在変数モデルが提案されている. 本研究では, ボラティリティの非線形ダイナミクスを外れ値に対してロバストの推定することを目的に, スチューデントのt 過程を動的潜在変数モデルに拡張したモデルを提案する. 提案モデルの潜在変数とハイパーパラメータを粒子フィルタに基づいてオンライン推定する. これにより, 観測された金融資産に対応するボラティリティ変動を推定する.
動的モード分解(DMD: Dynamic Mode Decomposition) は多変量時系列データのダイナミクスを安定・中立不安定多様体に対応した固有モードの重ね合わせによって表現する, 流体解析の分野で提案された新しい手法である. 動的モード分解は対象とする多変量時系列の支配方程式を陽に必要とせず, データのみから時空間ダイナミクスの構造を抽出する. また, DMD は時間および空間変数の次元削減手法であり, 高次元の時空間ダイナミクスに埋め込まれた本質的に重要な低次元の時空間的特徴を抽出することが可能となる. この特徴を利用すると, 多変量時系列の複雑な時間発展の中から単一方向のトレンド成分に対応するモードを抽出することができる. 本研究では, スパースな時空間構造を抽出するため, DMD を拡張したAdaptive Elastic DMD(AEDMD) を提案し, これを用いて伝統的なモメンタム戦略の改良を行う. 具体的には, 価格系列に対してAEDMD を適用し, 価格系列の背後にある時空間構造に基づいた価格トレンドの推定を行う. 推定されたトレンドに基づいて売買を行うことで, 単純な過去のトレンドに基づくモメンタム戦略を上回ることが可能であることを実証する.
人工知能が相場操縦を行った場合の責任の所在が議論されている.そこで本研究では,遺伝的アルゴリズムを用いた人工知能が人工市場シミュレーションを用いて学習するモデルを構築し,人工知能の作成者が相場操縦という取引戦略を全く意図していなかったにも関わらず,人工知能が学習を通じて相場操縦という取引戦略を発見するのか調べた.その結果,人工知能は相場操縦に他ならない取引を最適な取引として見つけ出した.この結果は,株式取引を行う人工知能の作成者には,人工知能が相場操縦を行わないようにする義務を負わせるなどの規制の必要性を示唆している.
In recent years, investment strategies in financial markets using deep learning have attracted a significant amount of research attention. The objective of these studies is to obtain investment behavior that is low risk and increases profit. Although Distributional Reinforcement Learning (DRL) expands the action-value function to a discrete distribution in reinforcement learn- ing which can control risk, DRL has not yet been used to learn investment action. In this study, we construct a low-risk investment trading model using DRL. This model is back-tested on Nikkei 225 data and compared with Deep Q Network (DQN). We evaluate the performance in terms of final asset amount, standard deviation, and the Sharpe ratio. The experimental results show that the proposed method can learn low-risk actions with the increasing profit, outperforming the compared method DQN.
This paper examines the possibility of applying the novel likelihood-free Bayesian inference called BayesFlow proposed by Radev et al. (2020) to the estimation of agent-based models (ABMs). The BayesFlow is a fully likelihood-free approach, which directly approximates a posterior rather than a likelihood function, by learning an invertible probabilistic mapping that implements a Normalizing Flow between parameters and a standard Gaussian variables conditioned by data from simulations. This deep neural network-based method can mitigate the trilemma in the existing methods that all of the following three ?higher flexibility, lower computational cost, and smaller arbitrariness cannot be achieved at the same time. As a result of the experiments, BayesFlow certainly achieved the superior accuracies in the validation task of recovering the ground-truth values of parameters from the simulated datasets, in case of a minimal stock market ABM. The method did not involve any extensive search of the hyperparameters or handcrafted pre-selections of summary statistics, and took a significantly shorter computational time than an existing non-parametric MCMC approach.