2024 Volume 13 Issue 1 Pages 5-15
本稿では,わが国におけるオルタナティブデータを用いた経済研究のサーベイを行う.経済研究におけるオルタナティブデータの活用と研究の発展に大きな弾みがついたのは,2020年以降の新型コロナの流行下であった.ナウキャスティング,経済行動・経済構造の変化の把握,政策効果の計測・評価など,幅広い分野で多くの研究が進み,変動の激しい時期の経済分析には,とりわけオルタナティブデータが有用であることが示された.もっとも,その後は新型コロナ関連以外の分析も増えるなど,研究分野は広がりつつある.一方で,オルタナティブデータ活用の課題として,とくにデータの信頼性の観点からは,基本的な性質や公式統計との関係性についての知見がまだ足りない点,標本抽出・標本設計の適切性を確保するための取り組みが必要な点などを指摘することができる.
This paper provides a survey of economic research using alternative data in Japan. The use of alternative data in economic research has increased signi.cantly since the outbreak of COVID-19 in early 2020s. A large number of studies have been conducted in a wide range of areas, including i) nowcasting, ii) analysis of changes in economic behavior and in economic structure, and iii) measurement and evaluation of policy e.ects. These stud-ies have proved that alternative data are particularly useful when economies exhibit high volatilities. More recently, the .eld of research is expanding toward topics not necessarily related to COVID-19. These developments of research, however, have also revealed caveats and challenges from the point of statistical reliability, when using alternative data. These issues include insu.cient knowledge about basic characteristics of data and its relationship with o.cial statistics, and degree of adequacy of sampling method and sample design.
本稿では,わが国におけるオルタナティブデータを活用した経済研究のサーベイを行う.本稿の目的は大きく2つあり,第1に,オルタナティブデータを活用した経済研究が足もと大きく増加している現状に鑑みて,こうした動きが最近の日本経済の情勢評価や構造分析にどのように貢献しているのかを明らかにすること,第2に,この分野における一段の研究の発展を促進するため,オルタナティブデータを活用した経済分析の利点と留意点,並びに今後の課題を整理することである.
何がオルタナティブデータであるかについて厳密な定義はないが,本稿ではKameda (2022)と同様に,近年の技術革新やデジタル化の進展を背景に1,従来の公式統計とは別の入手経路で,新たに利用が可能あるいは容易になった各種データをオルタナティブデータと総称する.
オルタナティブデータを用いた分析は,経済だけでなく金融市場や医療などの社会政策など,幅広い分野を対象に行われている.このうち本稿で取り扱う範囲は,経済研究,具体的には消費や1具体的には,1クラウドサーバーや高性能端末など,大容量データを取り扱う情報インフラのキャパシティ増大,生産などの景気動向や物価変動,経済成長率や生産性といった経済変数を主たる対象とした分析に絞る2.経済研究におけるオルタナティブデータ活用の実例としては,まず,GPSなどを用いた位置情報(人流データ),POSやクレジットカードの履歴情報などを用いた消費データが挙げられる.これらの多くは,更新頻度が日次あるいは週次など短く,とくに速報性に優れることから,高頻度データとも呼ばれる.また,政府や企業の公式文書,インターネットやSNS上のニュースといったテキストデータ,各種の画像・動画情報も,オルタナティブデータに該当する3.
わが国におけるオルタナティブデータを活用した経済研究は,新型コロナ以前にも一部で行われていたものの,研究が大きく増加したのは新型コロナの流行が始まった2020年以降である.その背景は2節で述べるが,本稿ではそうした点を踏まえ,サーベイの対象となる期間を,事実上,新型コロナ期以降に絞っている.
本稿の構成は以下のとおりである.2節では,オルタナティブデータを活用した既存の経済研究を,その主たる目的に沿って,1ナウキャスティング(足もと予測),2経済行動や経済構造の変化に関する研究,3政策効果の計測や評価,の3つの分野に分けて紹介する4.3節では,そうしたオルタナティブデータ活用における課題や留意点について,主に統計データとしての信頼性やその検証面を中心に整理する.
経済研究におけるオルタナティブデータの活用について,平田(2020)は,オルタナティブデータは従来の公式統計に比べ,1データの速報性,2更新頻度の高さ,3データの確定性(改訂が無い),などの「実務的な優位性」が高いと主張している.この点,2020年の新型コロナの流行に伴う経済環境の急変は,そうしたオルタナティブデータの利点を一段と高め,利用可能なデータベースの拡充も相俟って,様々な研究の動機につながったと考えられる.
このような経緯から,これまでのところ,オルタナティブデータを用いた経済研究の多くは,新型コロナに直接関連したものが多い.以下では,既存の研究をその主たる目的に沿って,1ナウキャスティング, 2経済行動・経済構造の変化の把握,3政策効果の計測・評価,の3つの分野に分けて紹介するが,いずれも新型コロナの流行が研究増加の大きなきっかけとなっている.もっとも,ごく最近では,感染の収束に伴いオルタナティブデータの持つ高頻度,速報性という価値が相対的に低下していることもあって,新型コロナ関連以外のテーマや問題意識に基づく研究も増えてきており,研究分野や方向性には徐々に広がりもみられ始めている.
2.1. ナウキャスティングナウキャスティング(足もと予測)とは,将来ではなく足もとの人々の経済行動や経済指標の動きを,当該期の公式統計が明らかになる前に予測する手法である.
新型コロナの下でのロックダウン政策や企業・消費者の自粛行動は,人流や対面接触の制限や2金融市場を対象とした分析では,個別銀行別かつ個別企業向け別の貸出債権データや,国債市場の銘柄別データなど,いわゆる高粒度データ(粒の細かいミクロデータ)を用いた研究が多い.金融市場分析も広い意味では経済研究と言えるが,別途サーベイとしてカバーする文献が膨大となるため,本稿の範囲外とした.3公式統計でないという点では,サーベイ調査を基に(とくにインターネット経由で)集計されたデータも,一種のオルタナティブデータと解釈できるかもしれない.もっとも,サーベイ調査という収集方法自体は,伝統的なデータ入手経路の 1つであることから,本稿の範囲外とした.4頁数の都合上,取り上げることのできなかった研究が少なくないことを,予めお断りしておく.減少につながり,対面型のサービス業を中心に未曾有の悪影響を及ぼした.また,感染症が流行・一時収束・再流行というサイクルを繰り返したこともあって,景気変動の振幅は増加し,景気局面も短期間のうちに下降と回復を行き来した.こうした環境変化を受け,速報性に優れるオルタナティブデータを活用したナウキャスティング分析が増えていった.
具体的には,まず,人流データ,すなわち人々の地区別かつ時間別の位置情報を利用した研究がある.Yabe et al. (2020)やKatafuchi, Kurita, and Managi (2020),Nagata et al. (2021)は,いずれも Googleがその顧客アカウント情報を基に提供する各種移動データを用いて,緊急事態宣言の下で都心部を中心に人流がどの程度減少したかを分析し,サービス消費を中心とした経済活動の縮小を示唆した.また,Mizuno, Onishi, and Watanabe (2021)は,感染防止に必要となるのは繁華街への流入抑制ではなく住宅地からの流出抑制であると主張し,その裏付けとして住宅地の移動データを用いた人々の自粛率の計測結果を示した.これらの研究で用いられている人流データは,経済活動そのものを表す変数ではないが,その背後にある経済活動の足もと動向を探ることが目的という点では,広い意味でナウキャスティング分析に含めることができよう.人流以外のデータを使った同様の研究としては,衛星の夜間光データを用いて飲食店の営業自粛状況を分析したHayakawa, Keola, and Urata (2022),衛星データから得られるCO2排出量を用いた経済活動予測を行った水門・田邊 (2022)がある.
また,消費関連は利用可能なオルタナティブデータが豊富なこともあって,それらを用いて公式統計における個人消費をナウキャスティングする試みも多数行われた.例えばNakazawa (2022)は,週次小売データと日次ウェブ検索データを用いて GDPのナウキャスティングを行い,水門 (2022)は,GPSやPOSデータを用いた消費活動のナウキャストを行っている.また,Okubo et al. (2022)は,クレジットカード情報や POSデータ,家計簿アプリ情報を組み合わせることによって,GDP確報における個人消費の先行指標とされる「消費活動指数」を,高い精度でナウキャスティングできることを報告している.
こうした研究の多くは,新型コロナ流行下での人出や消費動向等に主たる関心を向けたものであるが,一部には脱コロナ以降も有用性を失わないと考えられる研究も出てきている.例えば,人流分析においては,人々の移動がどのような要因に影響されるかについての研究も進んでおり,Morita and Ono (2022)は新聞情報から抽出した不確実性ショックが,Suimon, Tanabe, and Izumi (2022)は X(旧Twitter)のネガティブ情報が,それぞれ移動データに先行性を持つとしている.人流情報を観光振興や地方経済の再生に利用する試みも始まっており,例えばKondo (2023)は,サーベイ調査と位置情報データを組み合わせて,観光地の魅力度指数を作成している.また,予測精度自体に関する研究も進み,新谷 (2023)はテキストデータを用いた既往のナウキャスティング分析をサーベイして,辞書アプローチ(各単語の出現頻度に着目)と機械学習アプローチ(モデルをデータから学習)に大別したうえで,単純な予測精度の観点からは後者が優位にあると主張している.
また,船舶の位置情報を用いた機械学習により「実質輸出」をナウキャスト推計したFurukawa and Hisano (2022),位置情報データや電力データに,同じく機械学習を組み合わせ,「鉱工業生産指数」をナウキャスティングしたFurukawa et al. (2022)など,個人消費以外の経済変数のナウキャストを行った研究もある.こうした輸出,生産のナウキャスト分析は,自然災害の発生や地政学リスクの顕在化などによってサプライチェーンが途絶する場合などにも,速やかな状況把握手段として有効に活用できる潜在的な可能性を有している.
2.2. 経済行動・経済構造の変化の把握新型コロナの流行下では,人々の経済行動の変容や経済・産業構造の変化の把握に力点を置いたオルタナティブデータ分析も増えていった.
例えば消費については,旅行や外食などの対面型サービスの消費は減る一方でモノ(財)の「巣ごもり消費」は増える,また,実店舗での販売の代わりにインターネットを通じたオンライン消費が増えるといった,急激な構成変化が生じた.この点に関して,小西ほか (2022, 2023),肥後ほか (2021)は,いずれも,公式統計以上に詳しい品目別情報が取得可能なPOSデータの特徴を活かし,新型コロナ流行期に通常時と異なる消費パターンが生じたことを示している.また, Watanabe and Omori (2021)はクレジットカードの利用状況を,Nakajima, Takahashi, and Yagi (2022)は家計調査のオーダーメード集計とスマートフォンの家計簿アプリの履歴情報をそれぞれ用いて,新型コロナを契機にオンライン消費が大幅に増加したことを示した.もっとも,感染収束後の新たな定常(ニューノーマル)に対する含意は両者で異なっており,前者は新型コロナ前の消費パターンに戻る可能性を否定していない一方,後者は今後もオンライン消費が定着する可能性を示唆している.また,後者の分析では,新型コロナ前からオンライン消費を開始していた家計とそうでない家計の比較分析を行っているが,そのように伝統データで一般公開されている情報とは異なる形での属性別分析が容易である点も,オルタナティブデータの強みと言えるだろう.
労働市場では在宅勤務(テレワーク)が増加した点が,新型コロナ下の大きな特徴である.その点に関して,Kikuchi, Kitao, and Mikoshiba (2020)は,クレジットカード情報等を活用して新型コロナの影響を受けやすい労働者の属性を分析し,サービス業・低所得者層・非正規雇用への影響が大きいことを示した.また,Hoshi et al. (2022)は,移動データとテレワーク指数を用いて移動自粛が雇用に与えた影響を分析し,テレワークが可能な業種ほど,コロナ期の失業率の上昇は小幅にとどまったことを示した.またKawaguchi, Kitao, and Nose (2022)は,位置情報データなどを用いて,人流減少による売上減をテレワークによる企業活動の維持が下支えしたと分析した.
消費・労働以外の分野では,宮川ほか (2020)が,企業のリース料金の延滞情報と信用評価情報を繋ぎ合わせた信用リスク分析を行っている.また,Watanabe (2020)は,「日経 CPINow」とクレジットカード情報を用いて,新型コロナ下では(東日本大震災時と異なり)物価下落が示唆されていたことを報告した.
このように,オルタナティブデータを利用した研究は,新型コロナの影響がマクロレベルで甚大であったことだけでなく,業種や雇用形態などによって,そのプラス・マイナスの影響が区々であったことも明らかにした点に功績がある.一方で,最近は感染の収束や,感染症が一つの契機となって引き起こされたインフレ率や賃金の上昇の方に研究の関心が移る傾向もみられる.例えば,中小企業の信用リスクデータから,価格マークアップと賃金マークダウンを推計したAoki, Hogen, and Takatomi (2023),また,オンライン求人サイトの求人広告情報をウェブスクレイピングして正社員の労働需給や募集賃金を分析したFurukawa, Hogen, and Kido (2023)などの研究がある.また,Nakajima et al. (2021)では,「景気ウォッチャー調査」を用いたテキスト分析から物価に関して人々が抱くセンチメント指数を作成し,同指数を用いることで,インフレ率の予測に際して予測誤差を小さくできることを示している.
2.3. 政策効果の計測・評価新型コロナ下では,政府のコロナ対策の効果に関する研究もいくつかみられた.Watanabe and Yabu (2020, 2021)は,位置情報データから算出した自粛率を用いて人々の行動変容の背景を要因分解し,政府の自粛要請の直接的な影響よりも,人々の自発的な抑制効果の方が大きいと結論付けた.Inoue and Okimoto (2023)は,人流データと感染者数の関係を分析し,ワクチン接種が感染拡大防止に与えた効果を示した.2021年1月に出された2回目の緊急事態宣言について,Fujii and Nakata (2021)は,位置情報データを組み込んだマクロモデルを構築し,宣言解除のタイミングによって,宣言解除後に想定される経済損失とコロナ死者数が,トレードオフの関係を描くことを示した.
また,政府が2020年に決めた1人10万円の特別定額給付金の効果について,Kubota, Onishi, and Toyama (2021)は個人の銀行口座の入出金情報から,Kaneda, Kubota, and Tanaka (2021)はアプリ決済データから,それぞれ給付金の費消状況を推計し,前者は給付金の限界消費性向が約0.3と相応のプラスであったこと,後者は給付後6週間程度,家計消費を刺激したことを示した.
以上のように,わが国におけるオルタナティブデータを用いた経済研究は,ナウキャスティングにせよ,経済行動・経済構造の変化の把握に関する研究にせよ,新型コロナの流行が大きな契機となって発展をみた.この点については,東京大学金融教育研究センターと日本銀行調査統計局が共催したビッグデータフォーラム (日本銀行調査統計局, 2020)において,渡辺努が「速報性や高頻度といったオルタナティブデータの持つ強みが,ウィズコロナ期の経済分析に発揮されたことは,パネリストの間で見解が共有されている」と総括している.
また,きっかけは新型コロナであったものの,その後はコロナ関連以外の分野への研究の広がりもみられており,研究の増加がオルタナティブデータに対する認知度を高め,またそれが新たな研究につながるという,一種の好循環も生じているように窺われる.政策効果の計測や評価を取り扱った研究はまだ少ないものの,新たな研究者の参入も相俟って,わが国でもEBPM(客観的なデータ・情報に基づく政策立案)や,データ分析に基づく政策面のPDCAサイクルが,徐々に定着していくことを期待したい.
その一方で,これらの研究が進むにつれて,オルタナティブデータを経済研究に用いる際の限界や留意点も明らかになってきた.以下,本節では,とりわけ統計データとしての信頼性の観点からオルタナティブデータの課題を3点に分けて整理するとともに,その克服に向けた工夫や取組みも合わせて紹介したい.
3.1. 基本的性質や公式統計との関係性に関する知見の蓄積課題の第1として,そもそもオルタナティブデータは,その基本的な性質が完全には解明されておらず,伝統的な公式統計との関係性も確立されているわけではない.オルタナティブデータの多くは時系列方向のデータ期間が短いことや,研究が増え始めてまだ間もないことから,新型コロナ流行以前の平時の挙動や,季節性,バイアス等について既知の情報が少なく,その点が分析上の無視しえない留意点となる.これに対して伝統的な公式統計については,指標によって多少のばらつきはあるとはいえ,統計作成機関による長年にわたる作成・整備,またユーザーによる研究や議論を経て,それらの点に関する知見は相当程度蓄積されている.平田 (2023)は,オルタナティブデータの多くは,総務省がガイドラインとして統計に求める4要素(ニーズ適合性,正確性,適時性,解釈可能性)を満たしていないと指摘している.
例えば,2.1節で紹介した人流分析,あるいは衛星を利用した夜間光やCO2排出量によるナウキャスティングは,その背後にある問題意識は人々の消費行動や企業の経済活動の迅速な把握であるが,使用しているデータはそれらの活動の大まかな代理指標にすぎない.繁華街近くの人流については,必ずしも消費行動を伴うものとは限らないし,仮に消費行動を伴ってもそこで購入する商品やサービスによって購買単価,すなわち消費金額は変動し得る.これらの指標が経済活動の代理指標として機能するには,両者の相関関係が少なくとも短期的に安定していなければならない.同様に,2.3節で紹介したKubota, Onishi, and Toyoma (2021)は,個人口座の入出金情報を消費の代理変数として扱っているが,一般的に言えば,引き出されたマネーは消費に向かうこともあれば,贈与や新たな貯蓄に向かうこともある.ある程度消費の代理指標と見做せることは間接的に示されているものの,とりわけ政策効果の定量的な評価としては,幅をもった慎重な解釈が必要となろう.
この課題を克服するには,既に公式統計の動向も明らかとなっている過去の局面において,データの観測頻度を揃えたうえで,公式統計とオルタナティブデータの間に安定的な関係が見いだされるか否かを検証する方法が有力と考えられる.その例として,日本銀行 (2020)は,Googleの提供する人流データのうち「小売・娯楽」関連の動きが,総務省「家計調査」の選択的サービス支出と極めて相関が高いことを実証的に確認したうえで,対面型サービス支出の代理指標として活用できるとしている.Furukawa and Hisano (2022)やMatsumura et al. (2022)も,オルタナティブデータが公式統計のナウキャスティング指標として利用可能なことを確認した上で,分析を行っている.
ただし,検証に使える時系列データの蓄積が短い場合には,特定の局面でしか相関の高さなどを検証できていないことには依然留意が要る.この点,新型コロナ流行下に限れば,短期的な経済変動が感染状況に大きく影響を受けており,相対的にそれ以外の(平時の)変動要素の寄与が小さかったことから,オルタナティブデータ固有の振れや不規則変動に目を瞑っても,実証結果から経済的な解釈を得やすかった可能性がある.また,Fukui, Kikuchi, and Golist (2020)が用いた正社員の募集段階の求人・賃金データのように,そもそも公式統計がない分野については,こうした比較手法も使えない.
3.2. 標本抽出,標本設計の適切性の確保課題の第2は,標本抽出,標本設計の適切性の確保である.政府等の公式統計では,無作為抽出や層化抽出等を通じて標本が母集団の特性を適切に反映するような設計が意図されている.これに対してオルタナティブデータは,もともと民間企業が,自らのビジネスあるいは社会的ニーズに鑑みて公表や有償での提供を始めるなど,その起源が自然発生的なこともあって,公式統計ほど明確な標本設計思想がなく,サンプリングの調整も未実施,あるいは他統計との平仄などを考慮せず恣意的に行われていることが少なくない.例えば,スマートフォンの家計簿アプリの記録データを基にした消費データについては,わが国における高齢層のITリテラシーの程度を踏まえると5,若年層や中年層に偏ったサンプルであることは容易に推測される.また,クレジットカードの履歴情報を用いた消費データについては,カード払いという性質上,耐久消費財などの高額消費は把握しやすい可能性が高い一方で,食品など日用的な少額消費のカバレッジは比較的小さいかもしれない.
もっとも,これらの問題についても,完全ではないにせよ,対処手段は存在する.小林・鈴木 (2022)は,家計簿アプリのデータのサンプルが若年層に偏っていることへの対応として,アプリユーザーの属性をアンケートで取得し,年齢や年収を軸に構成比を調整した上で「家計調査」と比較している.2.1節で紹介したOkubo et al. (2022)は,年齢や家族構成を軸にサンプルの構成比を調整しているほか.複数のオルタナティブデータを用いて特定指標への依存度を低下させたうえで,消費分野別に予測精度が最も高いデータを選定,それらを合成することで,マクロ全体の消費額に対する予測精度を高めている.データ提供側の取組みとして,株式会社ナウキャストは,「JCB消費 NOW」の作成に際し,ユーザーの属性情報や決済された業種情報を元に,母集団である実際の経済構造に合わせる形で,サンプルの年齢や業種の構成比の調整を施している.
また,オルタナティブデータの多くはいわゆるビッグデータであり,サンプルサイズが公式統計よりも際立って大きい.例えば,上述した「家計調査」は8千世帯,「家計消費状況調査」は 3万世帯を調査対象としているが,「JCB消費 NOW」の元データは1千万人である.そのため,サンプルサイズの大きさ自体が,「大数の法則」を通じて偏りの問題を軽減し,公式統計の精度を凌駕するケースもあると考えられる.上述したような,公式データの属性別構成比情報などを用いてサンプルの調整を行ったオルタナティブデータは,とくにそうであろう.
それに関連して,サンプルサイズの大きなオルタナティブデータを使った分析は,非線形性,すなわち過去の平均的な動きの延長線上にはみられない経済の急激な変化を捉えることにも優れている可能性がある.一般に,経済モデルに非線形性を組み込んでパラメータを推計することは,自由度の観点から制約が大きいが,サンプルサイズの巨大なデータを用いれば,特定のモデルを先験的に仮定せず,いわばデータ自身に関数形を決定させる形で,非線形性を捉えることが容易となる.AI(人工知能)による機械学習手法の発展は,この利点を後押ししている.具体例の一つとしては,2.1節で紹介したFurukawa and Hisano (2022)があり,そこでは輸出のナウキャスティングに当たって,船舶の積載量や寄港時間と輸出額との関係に非線形性があることを,深層学習を用いた関数推計によって明らかにしている.
3.3. データの継続性,データ間の互換性の担保課題の第3として,より実務的な論点になるが,オルタナティブデータの継続性が担保されていないこと,また,似通ったデータ間で必ずしも調査対象の定義や内訳項目の分類方法などが統一されていない点が,ユーザーである研究者やエコノミストにとっての制約になっていると考えられる.
オルタナティブデータは統計法の域外にあり,民間企業が自らの経営判断で作成・提供しているケースがほとんどであるため,公表停止や大幅な見直しが突然行われる不確実性がある.実際,Google Mobility Report(2022年 10月末に更新停止)のように,ニーズの低下やビジネス上の観点から公表が停止されたオルタナティブデータもある.先に引用した日本銀行調査統計局 (2020)でも,参加者から,「政策形成で活用されるためには,より統一的なフォーマットかつクロスセクションでのデータ整備が進む必要がある(川口大司)」,「オルタナティブデータが各企業で別々に保管されているため,政策評価に向けたデータの利活用が十分に進んでいない(宮川大介)」といった意見が聞かれている.公式統計ほどの強制的対応は難しくとも,民間のデータ業界全体としてサービスの継続性や整備状況に対する透明性を一段と高めていく取組みは必要であろう.
ここまで,オルタナティブデータの課題とその取組みを述べてきたが,一方で公的統計も完全無欠ではなく,精度向上を企図した改善が日々行われている.その1つに,オルタナティブデータからの情報を活用する試みも始まっており,一例として,ウェブスクレイピングデータの物価指数への活用が挙げられる.総務省 (2021)では,2020年基準の消費者物価指数(CPI)より,航空運賃や外国パック旅行の価格算出に同データを用いているほか,日本銀行 (2024)も,現在改定作業中の2020年基準の企業向けサービス価格指数(SPPI)で,宿泊サービスの調査価格に同データを用いると発表している.またGDPについても,西村・肥後 (2023)は,統計精度の改善策の1つにオルタナティブデータの活用を提案している.こうした点も踏まえると,今後は,オルタナティブデータが既存の公式統計との間で,ある程度の共通基盤を構築し,互いの利点を取り込みつつ切磋琢磨していく展開が,官民データを使った実証研究の発展には望ましいと考えられる.
本稿では,新型コロナの流行以降,わが国でオルタナティブデータを活用した経済研究が大きく増加している現状に鑑みて,これらの研究のサーベイを行い,研究成果の評価を行った.具体的には,ナウキャスティング,経済行動・経済構造の変化の把握,政策効果の計測・評価など,幅広い分野で多くの研究が進んだことで,経済変動の激しい時期には,とりわけオルタナティブデータを活用した経済分析が有用であったことが示された.加えて,その後は新型コロナ関連以外の分析も増えるなど,研究分野は広がりつつあることも確認された.
一方で,経済研究におけるオルタナティブデータの活用には,少なからず課題や留意点も存在する.とりわけ,データの信頼性の観点からは,その基本的な性質や公式統計との関係性についての知見がまだ十分ではない点や,標本抽出・標本設計の適切性を確保するための取り組みが必要な点を指摘できる.オルタナティブデータ研究の一段の活用促進に向けては,これらの課題の解決に向けての取り組みや,公的統計との間で互いの利点を取り込みつつ切磋琢磨していく展開が望まれる.
脚注1 具体的には,①クラウドサーバーや高性能端末など,大容量データを取り扱う情報インフラのキャパシティ増大,②人工知能(AI),機械学習,自然言語処理など,専門的なデータ分析をサポートする技術や知識の普及を指摘することができる.
脚注2 金融市場を対象とした分析では,個別銀行別かつ個別企業向け別の貸出債権データや,国債市場の銘柄別データなど,いわゆる高粒度データ(粒の細かいミクロデータ)を用いた研究が多い.金融市場分析も広い意味では経済研究と言えるが,別途サーベイとしてカバーする文献が膨大となるため,本稿の範囲外とした.
脚注3 公式統計でないという点では,サーベイ調査を基に(とくにインターネット経由で)集計されたデータも,一種のオルタナティブデータと解釈できるかもしれない.もっとも,サーベイ調査という収集方法自体は,伝統的なデータ入手経路の1つであることから,本稿の範囲外とした.
脚注4 頁数の都合上,取り上げることのできなかった研究が少なくないことを,予めお断りしておく.
脚注5 通信利用動向調査(総務省, 2024)によると,個人のスマートフォン利用状況は,10代~50代がいずれも9割前後となっている一方,60代は7割台,70代は4割台,80代は1割台にとどまっている.