行政と学の間で：自治体ビッグデータ分析の経験を振り返って

村舘 靖之

doi:10.24464/serviceology.5.2_8

1. はじめに

バズワードから読み解くと現代社会のパラダイムは，ビッグデータ解析からAI，シンギュラリティにシフトしているように理解できる(中島 2014)．

これまでWindows95やインターネットの普及から，iPhone Xに代表されるスマートフォンに到るまで，計算機の性能はムーアの法則の主張するように指数関数的に向上し，計算力，ネットワーク機能などが爆発的に成長してきた．

各種データベースの整備，機械学習アルゴリズムの実用化，クラウドコンピューティングの深化の恩恵を受けて，ビッグデータ解析が一時期バズワードになった(喜連川 2013)．

ビッグデータ解析のコア技術である機械学習技術は，人工知能の基礎技術と共通性が高い．さらに人間のこれまでの労働を人工知能に代表される機械が代替し，人間が技術的に失業する可能性や，その場合に生じる格差や所得補償の問題の重要性が議論されるようになってきている(井上 2017)．

そのような中で，もう一度ビッグデータ解析の社会的意義を，行政ビッグデータとサービス科学といった観点で考え直してみたい．

2. ビッグデータ解析におけるチーム体制の必要性

ビッグデータ解析とは，当初筆者は通常のパーソナルコンピュータや業務用の計算機資源では扱いきれないような大規模データを解析して，成果を出すこと（広い意味で社会に還元すること）だと考えていた．実際にビッグデータ解析のプロジェクトに関わって，現場の知としてビッグデータ解析について理解したことは，以下のようなことになる．

データベースの整備，構築．これはハード面である．データの収集，それに伴う法的契約の締結．実際のデータ提供に関わる実務．さらにデータ分析における各種機械学習技術やプログラミング技術．社会に解析結果を還元するためのプロジェクト統括の必要性．予算獲得．

これらの要素が複合的に全て必要となるため，本格的なビッグデータの解析は個人では難しく，チーム単位での協力が必要不可欠である．

中にはほぼ単独でスパコンを使って計算しプロジェクトを進める研究者もいるが，基本的にビッグデータ解析，およびそれに携わる分析者＝データサイエンティストは複数名が必要で，それに伴うチーム編成も，社会への責任ある還元を考えると必要不可欠になってくる^*2．

そもそも行政や企業などの社会組織は，単独の個によって構成されるネットワークというよりは，機械学習でいうところのクラスターによって構成されるレイヤーを含んで，重層的に構成されている．

ビッグデータ解析のチーム構成にあたっては，実際に解析を行うデータサイエンティストの他に，プロジェクト統括を行うリーダー（プロジェクト管理や予算獲得，プロジェクトの説明責任者）や契約にあたっての実務家や，法務担当者の協力が必要不可欠である．そもそも多様なビッグデータ解析を行う際に，単独では実行することは難しいので，複数名での文理融合的なチーム構成が望ましいことになる．

つまりビッグデータ解析はチームで機械学習の知見を生かして進めることが望ましく，またチームは文理融合的な編成が望ましい^*3．

3. 地方自治体におけるビッグデータ解析の役割

地方自治体においてもビッグデータ解析は重要な課題といえる．現在自治体が抱える課題や将来発生が予想される課題を解決するための有効な手段として，ビッグデータ解析には期待が寄せられているためだ．

行政にとっての問題は一種のフリーライダー理論といえる．つまり，行政のお財布は納税者一人一人にとって最終的には責任が持たれているので，結局はわたしのお財布の集まりなのだが，時に人はその事実を忘れて行動をしてしまうという側面がある．

言い方をかえると，社会の中で自分勝手な行動をとっても結局は納税者たる個人に問題は返ってくるのだが，一時的ないし慢性的に人はその事実を忘れてしまう．

国保事業の累積赤字や財政健全化，さらに将来発生する生活保護受給者の抑制や徴税率の向上，少子高齢化社会への対応など自治体は待ったなしの現実に直面している．

自治体の行政サービスのあり方を考え直すことは，ビッグデータ解析の導入と重なる重要課題である．

経済学の理論にヒステレシス（履歴効果）理論がある (Blanchard and Summers 1986)．初期状態で問題を発生した時にすぐに対応すればリカバー可能であるが，時間が十分経過した後だと，慢性化してしまい，対策が難しくなる．これは経済学ではヨーロッパの長引く失業問題に対して提唱された．もともとは磁石と金属の関係のように，磁性を持たない金属も，ずっと磁石を近づけていると磁性が半永久的に発生してしまうこと，が履歴効果の理論の大元である．これは自治体の課題抑制型事業の考え方にも繋がると思い，紹介した．

これまで自治体の行政サービスはプル型が主体で，窓口に来た人に優先的に対応を行うのが基本であったが，それは次第にプッシュ型に移行した方がよいと考えられるようになった．

履歴効果理論を援用すると，はじめてハローワークを通じて失業保険を請求した時に，適切に窓口でプッシュ型サービスを提供し，例えば次の職のレコメンドや資格習得のプログラムを紹介して，失業状態が長引くことや，慢性化してしまうことを防ぐことが重要といえる．

また健康面でも，健康な時から，不健康状態へのシグナルを見逃さないこと．つまり定期的な検診受診，もっと踏み込んで健康生活維持のための食生活や運動のレコメンドなどが，生活習慣病抑止のためには行政サービスとしても重要ではないかといえる．

個人の健康管理も，自分の健康を管理するのは自分の問題ということもできる．しかし，一度健康管理に失敗し，慢性的に生活習慣病に掛かると国保を通じて，行政に負担を掛けてしまい，その負担は納税者たる個人に再帰的に返ってきてしまう．

このような事実を考えると，地域社会単位で健康維持活動（ラジオ体操など）を行い，地域の健康を改善していくという姿勢は，実は重要なのではないかといえる．

行政という公的主体がプッシュ型サービスを行うことや，過去にはなかったビッグデータ解析サービスを行い，行政として課題抑制というスタイルを取る背景には，将来の市民の問題を今から時間を掛けて取り組む，未然に無駄な費用の発生を抑えるという根拠が与えられる．ビッグデータ解析を利用した社会課題の解決は，みんなのためであり，翻ってわたしのためでもある．

4. ビッグデータ解析に必要な多様な専門知識

筆者は東京大学および千葉市，国立情報学研究所と所属を替えて研究を継続して，現在，内閣府計量分析室というところに所属している．どの職場でも研究・業務の目標は経済予測および試算，つまり時系列データの計量分析・モデル作成が大きな課題であった．

東京大学と産総研，および鳥取県の共同研究に関わっていた時も，求められたのは2020年の鳥取県の経済予測，国立情報学研究所の時はクレジットカードデータとPOSデータを用いた延滞予測モデルの作成，そして内閣府でも日本経済の中長期試算である．

このような研究業務にとって必要なツールは統計学，計量経済学，ミクロおよびマクロの経済理論，機械学習の知識である．

ビッグデータ解析は，データを一種の資源とみなして，そこから探索することで利益をあげることが目標である．そのようなデータ資源を獲得するには，法律的な交渉が必要不可欠である．個人情報保護法や匿名化技術の知識も必要である．さらにデータが利用可能になった時には，データベースの構築，分析システムの運用が重要となる．このフェーズでは現代のクラウドコンピューティング技術の恩恵を受けることになる.

5. 実際に明らかになった知見

鳥取県の経済予測の研究に関わった時，そこで使われたのは情報幾何という数学理論を応用した機械学習技術（予測技術）と産業連関表という産業構造を記述した表であった．この時は，まだ産業連関表の可視化技術を身につけていなかったため，アウトプットとしては産業ごとの波及効果の可視化に止まっていた(森岡，津田 2014を参照)．

千葉市との共同研究に関わるようになって，新しく導入した可視化技術はネットワーク理論に基づく産業構造の可視化技術である．SNSの友人のつながりを可視化する技術を，産業構造の可視化に応用した(村舘 2015a)．

さらに産業構造の可視化技術だけではなく，疾病構造の可視化の研究にも取り組んだ．国民健康保険のレセプトのデータベースから主病名と第二病名のリンク構造を取り出すと，疾病構造のネットワークが可視化できる．このような可視化によって，疾病構造ネットワークの中心には高血圧が位置していることが確認できた(村舘 2015b)．

疾病構造ネットワークをクラスター分析すると，眼の疾患と糖尿病が同じクラスター，脳神経系の疾患が同じクラスターに分類され，本来医学的知識を持たない計算機が，機械学習によって，医学的な知見と矛盾しない知識構造を獲得する可能性を示すことができた．

6. 結びにかえて：ビッグデータ解析の社会科学的意義のためにチーム体制が必要

行政とサービス科学という視点からビッグデータ解析の社会科学的意義を再考する．サービス科学は，産業構造のサービス化に伴い，サービス産業やその実態について科学的に考察することで，従来の経験と勘やノウハウといったものを可視化・共有することで，生産性の向上に寄与することが一つの目標と考えられる．また行政の視点からみたサービスとは市民への還元であり，より高い市民の厚生の獲得にあるといえる．

ただデータサイエンティストが行政の現場に入って，分析し，知見をまとめ論文を書いても，不十分で，政策パッケージに纏め上げる必要がある．そのような意味で，ビッグデータ解析の社会的意義は，ただ研究や行政のプロパガンダだけで終わるものではなく，市民への政策的な出口戦略が重要となる．市民への行政サービスの向上につながらないと，どのような行政ビッグデータ解析であっても評価にはいたらない．

ビッグデータ解析が単なるバズワードで終わるか，それとも社会の中でデータに基づく政策立案が根付くかは大きな分岐点にある．ビッグデータ解析からAI・コグニティブ技術に社会の注目がシフトしつつある中，社会的意思決定，政策決定にどれだけビッグデータ解析の知見を盛り込めるか，政策立案担当者，データサイエンティストなどの現場に求められているのではないだろうか．

著者紹介

村舘　靖之

内閣府計量分析室，博士（社会情報学）2015年3月取得．

*1 本稿は研究者としての個人の見解をまとめた内容であり，所属機関の公式見解とは異なる．

*2 スパコンを使ったビッグデータ解析の経済物理の立場からの代表的な研究として(大西 2013)を参照．

*3 経済学の立場からのビッグデータ解析，計量経済学の立場からの機械学習に関する解説論文として (Varian 2014)と (Mullainathan and Spiess 2017)を参照．Varian(2014)ではまずRで簡単な解析をしてから，Pythonでモデルを実装する流れが説明されている． Mullainathan and Spiess (2017)では計量経済分析と関係ある基本的な機械学習アルゴリズムが解説されている．

参考文献

Blanchard, O. J., and Summers, L. H. (1986). Hysteresis and the European unemployment problem. NBER macroeconomics annual, 1, 15-78.
Mullainathan, S., and Spiess, J. (2017). Machine learning: an applied econometric approach. Journal of Economic Perspectives, 31(2), 87-106.
Varian, H. R. (2014). Big data: New tricks for econometrics. Journal of Economic Perspectives, 28(2), 3-28.
井上智洋(2017). 第二の大分岐─ 汎用人工知能が経済に与える影響─. 人工知能, 32.
大西立顕(2013). 経済ネットワークの数理. 横幹, 7(2), 100-107.
喜連川優(2013). ビッグデータの潮流とデータエコシステム. 情報管理, 55(10), 705-711.
中島秀之(2014). 人類と ICT の未来：シンギュラリティまで 30 年？： [人類はどう生きるべきか？ IT はどうあるべきか？] 7.1 シンギュラリティの向こうにあるもの. 情報処理, 56(01), 32-33.
村舘靖之(2015a). 47都道府県地域産業ネットワーク構造の可視化. 情報学研究・調査研究編: 東京大学大学院情報学環, 31, 49-87.
村舘靖之(2015b). N-014 ネットワーク理論による疾病データの可視化 (N 分野: 教育・人文科学, 一般論文). 情報科学技術フォーラム講演論文集, 14(4), 407-408.
森岡涼子，津田宏治 (2014). 情報幾何的分解に基づく地方産業連関表の将来推計 (統計多様体の幾何学の新展開).

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）