多くのファイナンス (金融) 研究は,投資戦略の最適化や市場の効率性など,さまざまな仮定の上で議論されている.しかし,その仮定そのものが批判されることも少なくない.投資戦略の最適化が不可能な要因として,投資家自身の売買によって価格を変化させてしまうこと (マーケットインパクト) を最適化時に考慮できないことも考えられる.そこで本研究では,人工市場を用いてバックテストによってシミュレーション期間を通じて投資戦略の最適なパラメータを1つ探す (経済学やファイナンス研究で言うところの最適化を行う) テクニカルエージェントを追加してシミュレーションを行い,マーケットインパクトを最適化時に考慮できないという要因だけで最適化が安定しなくなることを議論した.その結果,投資戦略のパラメータはある値に収束することなく不安定になることが分かった.他の全員が全く同じに固定されていたとしても,1人でも,戦略の最適化を行うために,バックテストとその実践投入を繰り返し行うだけで,その戦略は定まることがないし,価格時系列も特定のものには達せず,不安定となった.この最適化の不安定性は,いわいる "市場価格が均衡しない" という不安定よりもさらに上位の不安定性であり,当然,市場価格の均衡を妨げる.そして,価格時系列の規則性をも不安定にさせうる.このことから,金融市場は本質的に不安定であると言えるかもしれない.
日本における製造業の基調的な生産動向を捉える上で,自動車工業の生産量を把握することは有用である.本研究では,携帯電話端末の位置情報(GPS 情報)を用いて計測した,自動車メーカーの生産拠点における時間帯ごとの滞在人数を基に,自動車生産量のナウキャスティング(即時性の高い推計)を行った.更に本研究では,同情報が示す自動車メーカー各社の生産状況の趨勢に基づいて株式投資戦略を構築した場合,堅調なリターンが得られることを確認した.また,比較検証のため,各社の株価の趨勢(モメンタム情報)に基づいて同戦略を構築した場合には,安定的なリターンは得られなかった.これらの検証結果は,株式投資において,携帯電話の位置情報に基づく即時性の高い生産量推計の有効性を示す内容と言えよう.
Stock exchanges are making many changes to become a more desirable market. One of these efforts is changing the tick size. This represents the unit of order price when an investor places an order. In this study, we estimated the change point for trading volume in the period before and after this change. As a result, it became clear that the change point exists before the actual tick size change date.
本稿では, 企業の IR 戦略の一つであるパブリックな情報公開の効果を検証する. 企業のIR 活動は自社への投資呼び込みを目的として行なわれている. 決算報告会は主要な IR 活動の一つだが, 企業間で時期が重複しやすく, 投資家の参加が分散してしまうことで機会損失を生じるという課題がある. この損失を埋める目的で, 一部の企業は決算報告会の内容を書き起こしたテキストをウェブ上のプラットフォームや自社 HP で一般公開し, 情報へのアクセシビリティを高めている. しかし, 実際にこのような情報公開が投資家の関心を惹きつけ, 投資の呼び込みを促す効果があるかについては未だ検証されていない. ここでは, このような企業の情報開示戦略の変化と株式の出来高の変化の関連を重回帰分析によって評価し, その効果検証を試みる.
暗号資産販売所は、ビッド・アスク価格を提示し、顧客から暗号資産の注文を受け付ける相対取引サービスであり、暗号資産市場に流動性を供給している。顧客からの注文によって販売所の暗号資産の在庫は変化し、一方で、在庫は常に価格変動リスクに晒される。このため、適切な在庫管理が必要になる。同じ相対取引サービスである FX ディーラーの在庫管理問題については、確率制御に基づいた最適流動化戦略が提案されている。ただし、暗号資産市場は FX 市場と比べ、流動性が低く、ボラティリティが大きい。更に、暗号資産販売所においては顧客から注文に大きな偏りがみられる。そのため、暗号資産販売所における在庫管理問題を解決するためには、暗号資産市場に特有の性質を考慮して、最適流動化戦略を構築する必要がある。そこで、本研究では暗号資産販売所に対する在庫管理問題を定義し、確率制御に基づき最適流動化戦略を提案する。また、モデルパラメータを bitFlyer の公開データを用いて推定し、数値計算により、最適流動化戦略を得た。得られた結果から、注文頻度の偏りが最適流動化戦略に影響を与えることを示した。また、単純な流動化戦略と比較することで、提案手法の有効性も確認した。本研究は暗号資産販売所における最適流動化戦略という新たな領域を開拓するものになるであろう。
近年、中国経済の躍進に伴い、中国の各国経済に与える影響が高まっている。そのため、米国経済を中心に把握するだけではなく、中国経済の動向を把握することがより重要になっている。しかしながら、中国経済に言及した英語記事は中国語媒体よりも少なく、また、中国語で記載された中国経済に関する膨大な記事から選別してトピックを抽出することは現状難しい。そこで本研究では、中国語記事と英語記事の両方からセンチメントを獲得し、これらを合わせて利用することで、中国市場インデックスを予測する新たなモデルを提案する。
This paper proposes an Understanding of non-Financial Objects in Financial Reports (UFO) task. The UFO task aims to develop techniques for extracting structured information from tabular data and documents, focusing on annual securities reports. We will provide a dataset based on annual securities reports and organize an evaluation-based workshop for participants. The UFO task consists of two subtasks: table data extraction (TDE) and text-to-table relationship extraction (TTRE). The table data extraction subtask aims to extract the correct entries and values in the tables of the annual securities reports. The text-to-table relationship extraction subtask aims to link the values contained in the tables with the relevant statements in the text. In this paper, we describe an overview of the UFO task.
This paper targets to predict overnight stock movement by taking contextualized news and stock information into account, using the Pre-trained Language Model (PLM) that was recently popular in Natural Language Processing (NLP) field. We proposed a model in which, given a piece of news and a stock code, the model can predict its overnight stock movement by utilizing combined news-stock embedding. Such embedding consists of (1) the contextualized embedding that contains the semantics of such a piece of news produced by a language model trained on a set of news and its paired stock movement. (2) The contextualized embedding is produced by a PLM trained on the information of stocks. Moreover, we introduce news augmentation on multiple pieces of news for the input and study its effect, respectively.
決算説明会とは,企業がステークホルダーに対し業績や計画・戦略を決算内容とともに説明する場である.決算説明会の参加者は経営者による説明を聞くことができるほか,質疑応答を通して業績と見通しに関する疑問を解消することができる.一方で,参加者はアナリストや機関投資家に限定されていることが多く,決算説明会に参加できない投資家との情報格差が指摘されてきた.しかしながら,本邦における決算説明会の情報価値についての分析例はほとんど存在しない.そこで本報告では,質疑応答を含む決算説明会のテキストデータに感情極性を付与し,説明会がもつ情報価値を定量的に分析する.具体的には,金融専門極性辞書と Fama-French のファクターモデルを利用して株価リターンに対する説明力を分析する.
株式市場においては、価格変動の説明要因となるファクター等の属性を基に投資を行う投資家が多い。このため、市場の先行きに対する投資家の心理が、これらの属性を持つ銘柄物色に反映される可能性がある。本研究では、株式市場における銘柄物色の変化から株式インデックスのトレンドの変化点を検知する手法について検証した。株価推移の類似性が高い銘柄同士を結合して作成したグラフに対して、Graph Based Entropy の手法を適用することで、属性ごとの銘柄の物色変化と、株式インデックスのトレンドの関係性について、検証した。TOPIX 500、S&P500、STOXX® Europe 600 の 3 つの株式インデックスに対して検証を行った結果、株式インデックスのトレンドの変化点において、 それぞれ共通して、Graph Based Entropy が特徴的な変化をすることがわかった。
不動産価格の一つである土地の価格は,実勢価格,公示地価,路線価,固定資産税評価額の 4 種類が存在し,公示地価を起点として他の価格が形成されている.しかし,公示地価として公示されるのは標準地として選定された地点のみであり,標準地と離れた場所では,土地取引時や固定資産税の算出時に,適切な価値として評価することができない可能性を孕んでいる.また近年では,機械学習を用いて土地の価格単体や建物込みの取引価格,賃料等を予測する研究が盛んに行われているが,公示地価を予測対象とした研究や,モデルの入力として周囲の標準地の価格を適用した研究の事例は少ない.そこで本研究では,標準地ではない地点の公示地価に資する価格(土地価格)を予測可能とすることを目的に,モデルの構築および検証を行った.予測対象地点の土地に関する属性情報に加え,周囲の標準地の件数を一定数で取得し,その標準地の属性情報を説明変数とした機械学習モデルを構築,検証した.この結果,一定の精度で任意の地点の土地価格を予測可能なモデルを構築できた.
株価や経済指標などの金融時系列は,一般に長期記憶性や不確実性など,単純なモデルでは再現の難しい特徴を持つことが観測されており,このことは金融市場の複雑性を反映していると考えられる.一方,このような金融時系列は実データであるためサンプル数が十分でなく,しばしば観測データを用いた定量的な分析を困難にする.本研究の目的は,このような複雑性を持つ時系列を機械学習の手法を用いて人工的に生成することである.これにより,より現実に近い様々な市場局面を大量に生成することができ,投資戦略のストレステストや,経済指標を用いた分析・リスク管理等を効果的に行うことが可能となる.特に,本発表では標準 Brown 運動よりも正則性の低い極めて「ラフな」パスが観測されているボラティリティを対象にし,非整数階 Brown 運動を用いた生成手法である Neural rough fractional SDE-Net を用いて元データの特性を再現することを目指す.
機械学習を用いた株価予測は実務的にも学術的にも重要であり、多くの研究がおこなわれている。それらのうち有望な方法の一つとして、株式市場のダイナミズムを考慮し、高い予測力と解釈可能性を兼ね備えた Trader-Company (TC) 法がある。一方、TC 法をはじめとする機械学習による株価予測手法は、点推定であり、その予測の不確実性が考慮できていないため、実務的な応用に際して懸念が生じる。そこで本研究では、Uncertainty Aware Trader-Company Method (UTC) 法という高い予測力を持ち、予測の不確実性を定量化できる株価予測手法を提案する。UTC 法は、TC 法を不確実性の推定を可能にする確率的モデリングと組み合わせることにより、不確実性を捉えながら、TC 法の予測力と解釈可能性を維持できる。理論的にも、UTC 法による推定分散が事後分散を反映し、かつ TC 法に対して予測の悪化につながるバイアス等を与えないことを証明できる。さらに、人工および実際の市場データに基づいた実証分析を行い UTC 法の有効性を確認した。人工データでは、予測が困難な状況や予測対象の分布の変化を UTC 法が検出できることを確認した。実際の市場データを用いた分析では、UTC 法による投資戦略がベースライン手法よりも高いリスク・リターン比を達成できることを示した。
Autoregressive integrated moving average (ARIMA) is a widely used linear model withgreat performance for time series forecasting problems. Supplemented by support vector regression (SVR), an effective method to solve the nonlinear problem with a kernel function, ARIMA-SVR model captures both linear and nonlinear patterns in stock price forecasting. However, it does not have high accuracy and parameter selection speed when its parameters are chosen by the traditional method. Therefore, in this study, we applied genetic algorithm (GA) to optimize the parameter selection process of SVR to improve the performance of the ARIMA-SVR model. Subsequently, we built the ARIMA-GA-SVR model by integrating ARIMA with optimized SVR. Finally, we used actual stock price data to compare the forecasting accuracy of the proposed model, ARIMA and ARIMA-SVR models using error functions. The result shows that the proposed ARIMA-GA-SVR model outperforms other models.
大量の金融市場の取引データの蓄積に伴い, ランダムウォークを中心とする一般的な金融理論体系では説明が困難な金融市場の経験則が観測されるようになった. 本研究では, その経験則の一つである売買符号時系列の長期記憶性 (long range correlation, LRC) という現象に注目しよう. 売買符号時系列の LRC とは, t 番目の成行注文の売買符号を ϵ(t),買い注文を +1, 売り注文を −1 と定義したとき, その自己相関関数 C(τ) が 1 より小さいべき指数 γ を持つべき則 (C(τ) ∝ τ −γ) に従って減衰する現象である [2, 3]. 現在に至るまで, そのべき指数 γ の推定方法には DFA[4] をはじめとする様々な手法が提案されている. しかし, Akyildirim ら [7] の研究によってそれらの統計手法はから得られる推定値は, 使用する手法に強く依存することを示した. つまり, 売買符号時系列の自己相関のべき指数 γの測定に対して有効な方法の再検討の余地があると言える. そこで本発表では, それらの統計手法の優劣を検討するために, 売買符号時系列の長期記憶性を説明するミクロモデルとして Lillo-Mike-Farmer(LMF) のモデル [5] を取り上げる. LMF モデルは γ についての解析的性質が詳細に調べられており,厳密解の観点から各手法別の推定値の妥当性を検証することができる. 本発表では LMF モデルを利用し、統計学で最も重要視されつ性質である一致性と不偏性の観点から評価した結果を報告する.
The Hawkes process is a flexible and versatile model that can accommodate the self-exciting nature of occurrences of events in natural and social sciences. Recently, a nonlinear version of this model has been applied to describe financial markets' intermittent and clustering behaviour. On the other hand, analytical characters of the nonlinear Hawkes process have not been studied well due to its nonlinear and non-Markovian nature. In this talk, we present our solution to a broad class of nonlinear Hawkes processes via the field master equations based on our previous publications (K. Kanazawa and D. Sornette, PRL 2020 and PRL 2021). We find that the power-law relationship is ubiquitously found in the intensity distributions in nonlinear Hawkes processes. This character would be helpful for data calibration to financial data, particularly from the viewpoint of the power-law price movement statistics.
Selection of product portfolio and determination of its inclusion ratio is fundamental management issues in e-commerce (EC) logistics business. EC logistics business is a form of business in which products are stocked in advance. Upon receiving an order from a customer via the Internet, the company allocates the stocked products and ships them to the customer. The problem is to control logistics costs by taking into account risks, such as seasonality of individual products, changes in trends, and sudden fluctuations in demand, to increase expected profits continuously. We investigate a method of product portfolio optimization using Markowitz's mean-variance model as a starting point for solving this problem. The general computational complexity of the mean-variance model scales with the target number of items n as ∝ n3. Since n is of order a million, a significant issue is whether it can efficiently find an optimal or good solution using such an extensive data set in a finite amount of time. We seek a method to obtain a feasible solution to this problem within an acceptable time frame for business operations using computer resources that are currently relatively easy to acquire by an average business. In this study, we report on our investigation of classical methods such as divide-and-conquer, compact decomposition, and multi-factor models, as well as relatively new methods such as quantum annealing.