In recent years, various researches in the field of economic prediction have been carried out using fundamental analysis and technical analysis with numerical information. Considering news articles containing not only numerical information but also textual information means that we can pay attention to public opinion, and thus we can make more accurate economic trend prediction which are difficult to predict only by numerical information. In this study, we propose a news text analysis for economic trend prediction using polarity dictionaries.
BERT を始めとする事前学習言語モデルは,様々な自然言語処理のタスクにおいて成果を上げている.これらのモデルの多くはWikipedia やニュース記事などの一般的なコーパスを用いているため,専門的な単語が使用される金融分野においては十分な効果が得られない.本研究では決算短信や有価証券報告書から事前学習言語モデルを構築する.また金融ドメインのタスクによって汎用モデルとの性能を比較する.
近年の資産運用分野では,財務情報である売上や利益だけでなく,非財務情報である環境(Environment),社会(Social),企業統治(Governance)の3 つの観点を考慮して投資を行う「ESG投資」が世界的に広まりつつある.そのためESG 投資において,企業によるESG 情報を判断材料として獲得することは重要である.日本においては,企業の自社のESG 情報を開示する手段として統合報告書がある.決算短信や有価証券報告書のような他の金融テキストとは異なり,統合報告書には企業の財務情報に加え非財務情報が開示されており,ESG 投資を行う上で重要な情報源であると言える.しかし,統合報告書の中には100 ページを超えるものもあり,人手でESG 情報を探すには多くの時間と労力が必要となる.統合報告書においてESG 情報が存在する位置を自動で推定することが可能になれば,例えば,企業の成長・持続可能性を判断し,投資リスクを抑えることが可能となる,そこで本研究では,ESG に関連する内容についての記述が含まれるページをESG 関連ページと定義し,機械学習手法を用いて統合報告書からESG 関連ページを推定する手法を提案する.
有価証券報告書などの金融文書において,重要な情報はテーブル形式で記載されることもあり,テーブル内の情報抽出は金融データの更なる利活用に向けて重要な役割を果たすと期待される.しかし,企業が共通して開示する文書であっても,企業によってテーブル形式が異なることや,情報抽出の難しいPDF 形式で開示される文書も存在することから,現状テーブル情報が抽出され,十分に活用されているとは言い難い.そこで本研究では,PDF 形式で開示されている日本語金融文書内のテーブルからの情報抽出を試みた.我々の手法では,PDF 内の罫線情報を利用しテーブル領域およびテーブル内セルを抽出した.その上でセル内での改行とセルの区切りを区別するために,セル内項目情報および数値情報に着目したBERT ベースの分割判定モデルを構築した.実験では,2 種類のPDF 形式の金融文書に含まれるテーブルを対象とした性能評価実験を行い,我々の提案手法が優れた性能を発揮することを確認した.
In an environment of high uncertainty, risks in corporate management are changing daily. However, risks do not occur independently, but are often caused by a variety of events (risk factors), including other risks. We define this as causal relationships between risk factors. In addition, a single risk factor may have multiple consequences. For example, when a risk factor such as the Covid-19 epidemic occurred in one company, some departments increased sales due to increased IT investment, while others suffered losses as a result of reduced advertising due to worsening business conditions (risk factors of worsening business environment). Therefore, when actually understanding and assessing the risks faced by a company, it is necessary not only to understand the risk factors, but also to understand how they will ultimately affect business performances. In other words, it is important to stratify the risk factors. In this study, we propose a method to obtain the causal content of extracted risk sentences and to understand the risk factors using a hierarchical structure.
We trained a classifier to determine whether a technology in the patent literature corresponds to a decarbonization-related technology or not, using BERT pre-trained on the patent documents and the corpus of decarbonization-related patents we collected. The trained BERT model was also used to conduct macro analysis of Japanese published patent gazettes applied after 2000 to visualize the decarbonizationrelated patent technologies in Japan.
本研究では, アナリストの個別銘柄に対するセンチメントが, マクロ経済指標の予測に役立つかを実証する. これはアナリストレポートのテキスト情報を自然言語処理を使用して極性指標を作成することで実現可能となる. 本研究では, 作成した極性指標に対し, 各種マクロ経済指標を使用し,VAR モデルを用いた分析を行った. 結果, 極性指標から物価, 為替, 国債等の指標へのグレンジャー因果性があることが確認された. これにより, 極性指標が先行しており, マクロ経済指標の予測に役立つことが示唆された.
In this paper, we propose a method that uses causal information extracted from economic texts to predict numerical indicators related to economic and financial fields, such as macroeconomic indicators and stock prices. The proposed method automatically detects whether each sentence in the economic text contains causal information or not, and if it does, it identifies the cause and effect expressions and stores them in our economic causality database. Furthermore, the proposed method calculates the similarity between the result expression of causal information contained in the economic causal database and the causal expression of another causal information, and generates causal chains from the given text data. Causal chains are used to predict how the numerical values of economic indicators will change in the future due to spillover effects.
本研究では,人工市場モデル「投機ゲーム」を洗練化した「Self-organized SpeculationGame(SOSG)」をさらに単純化し,パラメータの数を減らした軽量モデル「Pure Random SpeculationGame(PRSG)」を構築した.PRSG のプレーヤーは,戦略テーブルの代わりに,確率に従ってホールドの長さを決めるため,往復取引を「機械的に」行う.しかし,SOSG と同様に市場規模が自発的に定まり,また,volatility clustering などの基本的なstylized facts が創発する.一方で,asymmetryin time scales などの高次のstylized facts については,PRSG では再現されない.高次特性の消失には,価格変動の時間構造に投機的パターンが見られないことが関連していると考えられる.
人工市場モデルを用いて、約定価格がファンダメンタル価格を上回るショートサイド(割高)の非効率性はどのような要因で顕在化するかを分析した。エージェントが出す買いと売りの注文数量に差を設け、買いの数量に対して売りの数量を少なくした場合は、市場非効率性のうちショートサイドの内訳がロングサイド(割安)のそれを上回った。一方で、エージェントの注文価格の決定に用いられるファンダメンタル価格を緩やかに上昇させた場合は、ショートサイドの内訳がロングサイドのそれを上回ることは確認できなかった。また、ショートサイドの市場非効率性が顕在化するメカニズムは、ファンダメンタル価格から一定の範囲で板に提示される売注文の数量が買注文と比べて少なくなり、買注文によるマーケットインパクトが大きくなることで、最良売気配の価格がファンダメンタル価格から乖離することを議論する。
Agent-Based Modeling(ABM)アプローチを用い,経済現象を分析する研究手法にAgentbasedComputational Economics(ACE)がある.ACE の中でも,財市場を内包するマクロ経済モデルは経済活動を模倣するため,モデル上でエージェントや財などの実体を伴う意思決定の系と,金銭上の取引の系の2 つを必要とする.そのため,モデルの構造が複雑となり,シミュレーションプログラムの実装が困難になる.本発表はACE 研究における,モデル構築からシミュレーション実験までの困難性を排除することを目的にして,会計簿記の考え方を拡張した会計関連モデリング提案について述べる.また,会計関連のモデリングを実際に適用して,主要な取引環境として財市場を内包する家計,企業,政府からなるマクロ経済のベースモデルについて紹介する.
The purpose of this study is to visualize nonlinear relationships which are quite ambiguous in the correlation diagram by the approach of explainable artificial intelligence (XAI). By using this approach for a practical marketing problem, we could visualize the nonlinear relationship between fund performances and money flows, which is asymmetric in inflows and out flows and is consistent with investors psychology based on the behavioral economics.
Recently, many researchers have studied foreign exchange trading using technical analysis. However, it is difficult to achieve profitability using this technique. Therefore, using Genetic Network Programming, we construct a model that considers the technical index signal strength for devising a profitable trading strategy. Finally, we confirmed the effectiveness of our model using historical data of the exchange market.
In the rollover of forward foreign exchange contracts, FX brokers generally selects tomorrow-next transaction because of higher liquidity and lower risk. However, it might be possible to obtain larger swap points by selecting longer forward transactions such as one-week or three- week forward in terms of the term premium. Therefore, we detect optimal timings to select longer forward transactions by machine learning techniques, and propose a mixed strategy that combines tomorrow-next and longer forward transactions. This timing might be affected by various factors such as global stocks, bonds, commodities, etc., and we could obtain larger swap points by the mixed strategy using the machine learning with these global factors.
平均分散ポートフォリオは,ポートフォリオ構築もしくは資産配分等の目的で実務において最も使用されてきた。しかしながら,パラメータ推定誤差等の問題点のために事後的には平均分散の意味で効率的なポートフォリオとはいえず,実際,リスクベース・ポートフォリオや等ウェイトポートフォリオなどのヒューリスティックな戦略のパフォーマンスがより良好であることは既に広く実証されている。これらのポートフォリオのうち最も効率的と考えられるものを,市場の動向などを鑑みて選択することは一般に困難である。加えて,複数のポートフォリオを効果的に合成することでより安定したパフォーマンスを生み出す方法は,未だ十分に検討されていない。そこで本研究では,複数のヒューリスティックなポートフォリオの選択を多腕バンディット問題とみなし,これらを適切な比重で合成する手法の提案を行う。具体的には,先行研究にて提案されたThompson Sampling を用いて2 つのポートフォリオの合成比率を決定する手法を,複数のポートフォリオの合成が可能なように拡張する。この際,各ポートフォリオのパフォーマンスを定める事前分布として仮定するディリクレ分布に関して,その時間経過に対する妥当性の担保のため,使用する観測データのローリングを行なった。実際に,代表的なベンチマークデータを用いて構築したポートフォリオによる実証分析を行った結果,提案手法は良好なパフォーマンスを示した。
国債のイールドカーブ情報には中央銀行の金融政策の方針が反映されるほか,市場参加者の物価や景気の見通しが織り込まれている.また金利水準自体は各種経済主体にとっての借り入れコストとなることから,先行きの経済活動に影響を与えうる.これらを踏まえ,本研究では,企業や家計などの経済主体による景気に先行的な経済活動をとらえた各種経済統計に加えて,国債イールドカーブの情報を特徴量として用いた,ニューラルネットワークベースの機械学習手法に基づく短期経済予測モデルを構築した.その結果,深層学習手法の一種であり再帰的なネットワーク構造を持つRNN(リカレントニューラルネットワーク)ベースのモデルにおいて,相対的に高い予測精度を確認した.更に,経済統計のみをモデルの特徴量として用いた場合に比べて,イールドカーブの情報も学習に用いた場合に,先行きの経済予測の精度が改善する傾向を確認した.このことは,経済予測において,イールドカーブに織り込まれる情報の有用性を示す結果と考える.