2015 年 58 巻 3 号 p. 166-175
「データからニュースを発見する」「データから発見したニュースをわかりやすく表現する」手段として,データジャーナリズムと呼ばれる,データを活用する報道手法が,日本をはじめ,世界各国の報道機関に急速に浸透している。データジャーナリズムの手法を取り入れた取材活動は,スクープを生み出し,政治や行政を動かす,あるいは社会に大きな影響を与えるなど,すでに大きな成果を上げ,さらにはニュースの概念をも変えている。本稿ではデータジャーナリズムについて概説したうえで,世界的な広がりをみせる背景とその影響について言及する。
データを活用した報道手法「データジャーナリズム」が世界各国の報道機関で実践されるようになった。データジャーナリズムは既存の報道手法に取って代わるものではなく,補完する手段であり,その適用シーンは「データを分析してニュースになるファクトを発見する」「データをもとにニュースの内容を検証する」「データを利用してニュースをわかりやすく表現する」など幅広い。データジャーナリズムへの取り組みは,当初は資本力のある大手報道機関が先行していたが,いまや地域メディアや新興メディア,新興国や開発国の報道機関においても,有効な報道手法となってきている。
本稿ではデータジャーナリズムについて概説したうえで,世界的な広がりをみせる背景とその影響に言及する。
2010年から2011年にかけ世界中を席巻したWikiLeaksにまつわる一連の報道は,データジャーナリズムのエポックメーカーとして記憶に新しい1)。英紙The Guardianや米紙The New York Timesが中心となり,「アフガン紛争関連資料」(約7万5,000点),「イラク戦争の米軍機密文書」(約25万点),「アメリカ外交公電」(約40万点)など,WikiLeaksで公開された70万点を超えるデジタルドキュメントデータを分析し,それをもとに数々の重大なニュースを報道した事例は,データジャーナリズムの真骨頂といえる。
データジャーナリズムは,主にインターネット上に公開されているデータを,取材や編集,ニュース配信など,報道のプロセス全般に生かす試みで,WikiLeaks報道以降,欧米メディアを中心に実践されはじめ,いまや多くの編集現場にとって,なくてはならないものとなった。国内でも,2013年末の参議院選挙報道を皮切りに,朝日新聞,毎日新聞,NHKをはじめとする報道機関のWebサイトではデータジャーナリズムによる報道を目にする機会が確実に増えている。2014年に開催されたソチ・オリンピックやブラジル・ワールドカップは,メディア各社によるデータジャーナリズムの腕を競い合う場となり,さらにはこれまでみることのなかった,データを活用した多様なニュースが生まれる場ともなった。
データジャーナリズムの歴史はまだ浅く,試行錯誤の段階にはあるが,データジャーナリズムの手法を取り入れた取材活動がスクープを生み出し,政治や行政を動かす,あるいは社会に大きな影響を与えるなど,すでに大きな成果を上げ,ニュースの概念をも変えている。
データジャーナリズムを実践する目的は「ニュースを発見する」そして「ニュースをわかりやすく表現する」の2つに集約される。
「ニュースを発見する」では,データからニュース性のあるファクトを見つけ出すことに主眼が置かれる。インターネット検索サービスの検索動向から全国のインフルエンザ感染状況の把握を試みるYahoo! JAPANビッグデータレポートチームによる取り組み2)や,Twitterに投稿される膨大な量のツイートを分析することにより選挙期間中の世論を把握しようとする毎日新聞の取り組み3)など,いわゆる「ビッグデータ分析」から社会を把握する試みが活発だ。2014年のブラジル・ワールドカップの準決勝で開催国ブラジルがドイツに1-7で惨敗した要因を,選手やボールの動きを表すデータをもとに分析したハフィントンポスト日本版による事例4)をはじめ,サッカー,野球,テニスなど,スポーツ分野にもデータから新たなニュースを発見する試みも徐々に浸透してきている。ほかにも,2012年の米大統領選で米非営利団体FactCheck.org(http://www.factcheck.org/)が,オバマ,ロムニー両候補者の発言内容をデータによって検証し,誤りを指摘した「ファクトチェック」の試みなど,データから「ニュースを発見する」試みは多岐にわたる。
一方,「ニュースをわかりやすく表現する」では,データを可視化することで,読者に対してニュースをわかりやすく伝えることに主眼が置かれる。昨年話題となった全国地方自治体の人口減少予測データを,地図に落とし込み,自治体ごとの状況を提示した日本経済新聞の『人口減少地図』5)や,御嶽山(おんたけさん)が噴火した当時の様子を3Dグラフィックと登山者が撮影した写真で表現したNHKによる『御嶽山「噴火の証言」』(図1)6)に見られるように,地図を活用する手法は浸透してきている。こうしたグラフィックを活用した表現には「理解しやすい」「記憶に残る」「コミュニケーションを促進する」といった効果が認められ,数値を単に並べる,あるいは記事中にちりばめるだけの表現に比べ,圧倒的に読者のニュース理解を促す。データジャーナリズムの発表媒体には,新聞やテレビと比べ,表現上の制約が少ないWebサイトが選ばれることが多く,たとえば太平洋戦争中に多くの市民が巻き込まれた沖縄戦の様子を伝えた沖縄タイムスの『地図が語る戦没者の足跡』7)(図2)や,独自の方法論でプロ野球選手を目指す高校球児の1年間をインフォグラフィックやインタビュー動画を組み合わせて伝えたウォール・ストリート・ジャーナル日本版の『Breaking Ball―野球の栄光求める父子の挑戦』8)にみられるような,記事,写真,グラフィック,動画,アニメーションなどを複合的に組み合わせた表現は,ニュースを立体的に表現する手法として注目されている。ニュースの表現方法は現在でもテキストと写真の組み合わせが主流だが,データジャーナリズムの広がりとともに,地図,チャート,インフォグラフィック,アニメーション,アプリケーションなど,多様な表現技法を組み合わせることができるようになり,ニュースは単に「読む」だけのものではなくなってきている。
The New York Timesによる全米の水質汚染状況を明らかにしたデータジャーナリズム『Toxic Waters(汚染水域)』9)は,米社会に大きな影響を与えた。ピューリッツァー賞の受賞歴もあるCharles Duhigg氏が率いたToxic Watersの取材班は,500回を超える情報開示請求によって米政府が把握していた水質に関するデータを取得する一方,民間の水質調査機関から実際の水質状況を示す2,000万件ものデータを入手し,両方のデータを比較することで,米政府が水質汚染の状況を把握できていなかった事実,さらには汚染水を垂れ流していた施設を突き止めた。「水の安全性」という,人の命にかかわる重大な事実を伝えるために,取材班は新聞で大々的に報道する一方,自社サイトの特設ページに,データ分析によって特定したすべての汚染源をプロットしたインタラクティブな地図10)を用意し,読者1人ひとりが自分の住むエリアの汚染源を確認できるようにした。水質汚染を「自分ごと」としてとらえ始めた読者からの反応は大きく,「これは報じられなくてはならない」「続報が読みたい」「この記事が行政に変化をもたらすことを期待する」など,2,000件以上のコメントが集まった。そして2010年3月,一連のキャンペーン報道が実を結び,アメリカ環境保護局は全米の飲料水に関する規制の強化を決定するに至った。
一連の報道で鍵を握っていたのは,膨大な量のデータの分析や,データ分析によって判明したファクトの提供手段となったWebアプリケーションの開発を担った,アナリストやグラフィックデザイナー,アプリケーションエンジニアなど,これまでほとんど編集現場にかかわることのなかったジャーナリスト以外の人たちだ。中でも,データを使いやすく加工する(データ・ユーティライゼーション)「データエンジニア」と呼ばれる人たちは,データの収集や正規化,変換,加工を通して,異なるスキルをもつ人たちのハブとして重要な役割を担った。
データジャーナリズムを実践するには,「データを収集・正規化する」「データを分析する」「データを可視化する」などデータを扱うためのスキルが不可欠となることから,近年,こうしたスキルをもつ人たちを編集現場に取り込む動きが加速している。The New York Timesの編集現場には,筆者が取材した2013年9月当時,およそ1,200人のスタッフが働いていたが,その中には,データ・ビジュアライゼーション(データ可視化)を含めたグラフィックデザインを担当する30名程度の「グラフィックチーム」や,データ分析を担当する20名程度の「C.A.R.チーム(Computer-Assisted Reporting)」,データ処理やアプリケーション開発を担当する20名程度の「インタラクティブ・ニュース・チーム」が編成され,データジャーナリズムの実践を支えていた。
多様なスキルを編集現場に取り込む動きはThe New York Timesとともにデータジャーナリズムを牽引(けんいん)するThe Guardianや英TV局BBCでもみられ,データジャーナリズムの重要性の高まりとともに,今後も継続すると考えられる。
世界各地の報道機関に所属する編集者らで構成されるコミュニティーGlobal Editors Network(GEN)の主催で,2012年に初開催されたデータジャーナリズム作品を表彰するイベントData Journalism Awardsには,欧州,北米,南米,アフリカ,アジア,オセアニアなど世界51か国から286のデータジャーナリズム作品が集まった11)。Googleが協賛するこのイベントには,各国の大手メディアだけでなく,新興メディア,NPOやNGO,個人からの出品もあり,データジャーナリズム実践者の多様性がみえてくる。Data Journalism Awardsは2012年以降毎年開催され,出品数は年々増加し,2014年は500を超えるデータジャーナリズム作品が世界中から集まった。
国内の動きも活発化している。2015年1月,筆者が所属する日本ジャーナリスト教育センターはオンライン上の革新的なジャーナリズム作品を表彰するイベント「ジャーナリズム・イノベーション・アワード」(http://jcej.info/jia/)を開催したが,ここでもデータジャーナリズムは存在感を示していた。表1に示すように,NHK,朝日新聞,毎日新聞など大手報道機関のほか,沖縄タイムス,神戸新聞などの地方新聞社,ハフィントンポスト日本版,弁護士ドットコムなどの新興メディア,そしてNPOや個人などから,2014年を代表する37のジャーナリズム作品が出品されたが,このうち,データジャーナリズムによる作品は18を数えた。最優秀賞も,首都大学東京・渡邉英徳研究室によるデータジャーナリズム作品『台風リアルタイム・ウォッチャー』12)(図3)が受賞した。国立情報学研究所が提供する台風の情報と,ウェザーニュースが集約する減災リポートをGoogle Earthに重ね合わせることで,台風の位置や被害状況をリアルタイムに把握できるようにしたこの作品は,データジャーナリズムのさらなる可能性を示した。そのほか,イベント当日の参加者による投票で選ばれた上位5作品のうち,『台風リアルタイム・ウォッチャー』を含む3作品をデータジャーナリズム作品が占めるなど,データジャーナリズムは読者からの支持も得ている。
こうしたデータジャーナリズムの広がりの背景には,「データ」「コンピューティング環境」,そして「教育機会」の充実がある。
No | 作品名 | 出展者(社) | データ ジャーナリズム 作品 |
---|---|---|---|
1 | 東京電力が一等地不動産を続々売却 現地で確認・マップを作成 〜データ・ジャーナリズムで見えてくる巨大電力会社の姿〜 |
NPO法人アイ・アジア | ○ |
2 | 「台湾・香港で見たアジアの民主化運動」ドキュメンタリー取材 | 岸田浩和 | |
3 | Tokyo Graphic Recorder | 清水淳子 | |
4 | 都知事選後に「リベラル」が向き合うべき「表現の自由」と「コミケ」 | ふじいりょう | |
5 | 地図が語る戦没者の足跡 | 沖縄タイムス戦後70年取材班 | ○ |
6 | 感染症データランキング | 株式会社IIJイノベーションインスティテュート+株式会社ジェイ・キャスト | ○ |
7 | 衆院選における得票データビジュアライズ | 朝日新聞デジタル編集部とE2D3 | ○ |
8 | 待機児童問題 | 朝日新聞・待機児童取材班 | ○ |
9 | 悪質バイラルメディアにはどう対処すべき? BUZZNEWSをフルボッコにしてみた | ヨッピー+有限会社ノオト | |
10 | 未来歴史学研究室へようこそ! | 未来歴史学研究室 | |
11 | ASK NIPPON 2014 | NPO法人YouthCreate+Yahoo! JAPAN | ○ |
12 | 人生のお悩み一望図 | 舞田敏彦 | ○ |
13 | 阪神・淡路大震災 on Yesterscape | 神戸新聞社+QOOQ | ○ |
14 | 電子絵本「ひかりのりゅうとぼくのくに」 | 原発絵本プロジェクト | |
15 | 気になるアレを大調査ニュース「しらべぇ」シェアされた記事TOP10 | しらべぇ | |
16 | NPOと研究者の協働による民間で完結した無業社会の実態調査と政策提言 | 認定NPO法人育て上げネット+西田亮介(立命館大学特別招聘准教授) | |
17 | 生きづらさを焦点に当てたWEBマガジンPlus-handicap | 一般社団法人プラス・ハンディキャップ | |
18 | パラリンピックにみる取材者の倫理とその問題点 | 矢萩邦彦 | |
19 | ドラッグストアとジャーナリズム | kuri | |
20 | 政治山・衆院選2014「マニフェスト・公約比較表」 | 政治・選挙プラットフォーム【政治山】 | ○ |
21 | 人口減少地図 統計でみる市区町村のすがた | 日本経済新聞 電子版 | ○ |
22 | タブーなき表現に挑む | 弁護士ドットコムニュース | |
23 | NHKインタラクティブニュース | NHKネットデータファクトリー | ○ |
24 | 2014―2015 ネットをめぐる10の潮流:ブログ「新聞紙学的」より | 平和博 | |
25 | 甲子園球児に見る出身地と出場校の関係 | ワイズ・スポーツ株式会社 スポーツナビ編集部 | ○ |
26 | 毎日新聞『インターネットと政治』報道〜2013―2014〜 | 毎日新聞『インターネットと政治』取材班+西田亮介(立命館大学特別招聘准教授) | ○ |
27 | 台風リアルタイム・ウォッチャー | 首都大学東京 渡邉英徳研究室 | ○ |
28 | 2014ブラジルワールドカップ・インフォグラフィックス | THE PAGE | ○ |
29 | 次期監督は誰?名前があがった75名には意外なあの人も! | 國枝至(電通パブリックリレーションズ) | |
30 | Yahoo! JAPAN ビッグデータレポート | 「Yahoo! JAPAN ビッグデータレポート」チーム | ○ |
31 | ポリタス(「東京都知事選2014」を考える/「沖縄県知事選2014」から考える/「総選挙」から考える日本の未来) | 有限会社ネオローグ | |
32 | 池上彰氏コラム掲載拒否 30人超の朝日記者がツイッターで異議 | 一般社団法人日本報道検証機構 | |
33 | 「世界価値観調査」の視覚的表現 | structure-and-representation.com | ○ |
34 | なぜ今、熱海はロケ地に選ばれるのか | 松尾雄介(電通パブリックリレーションズ) | |
35 | サイボウズ ワークスタイルムービー「大丈夫」「パパにしかできないこと」 | サイボウズ株式会社 | |
36 | 市民動画投稿型ニュースサイト「8bitNews」 | NPO法人8bitNews | |
37 | ワールドカップ ブラジル大敗の理由は?「ベロオリゾンテの悲劇」を演出したドイツの策略をデータで読み解く | ハフィントンポスト日本版 伊藤大地 | ○ |
※参照URL http://jcej.info/jia/works.html
報道機関にとってデータジャーナリズムを不可欠なものにしているのが,政府,地方自治体,公共機関,国際機関が公開する統計データや調査データを中心とした公的なオープンデータの存在である。中でも政府や地方自治体が公開するデータの種類は豊富で,教育,医療・健康,環境,経済,犯罪をはじめ,報道の基礎情報となる統計データが数多く提供されることから,社会問題の発見や権力の監視などの目的で,いち早く利用されるようになった。米国や英国などデータ公開が進んでいる国々では,公的なオープンデータをもとに政治家の汚職や,行政サービスの不備,地域による教育格差を指摘するなど,社会にインパクトを与えるニュースも出てきている。国内でのオープンデータ活用事例はまだ多くはないが,内閣府が中央省庁や地方自治体が公開するオープンデータのカタログサイトDATA.GO.JP(http://www.data.go.jp/)が公開され,アクセスしやすい環境は整いつつあり,今後は活用されるようになると考えられる。
他方,民間企業が保有,あるいは公開するデータにも注目が集まる。ブログやSNSに代表されるソーシャルメディア,検索サービス,ポータルサイト,スマートフォンやタブレットのアプリケーションなど,私たちが普段利用しているインターネットサービスから得られるデータを活用するケースも増えてきている。
5.2 コンピューティング環境の充実データを活用する報道手法は以前からあったが,データ処理に必要なソフトウェアや計算機のコストが高く,それらを扱うには高い専門性が要求されていたことから,選挙時の勝敗予測など,適用範囲は限定されていた。しかし,近年のオープンソースの浸透に伴う安価で,かつ高性能なソフトウェアの普及,計算機の処理性能の向上や低価格化の恩恵を受け,状況は急激に変わってきている。表2はデータジャーナリズムでよく利用される,データの収集,分析,可視化,共有のためのツールをまとめたものだが,一部を除きほとんどが無料で利用できるものとなっている。Googleが提供するソフトウェアが目立つが,前述したようにData Journalism Awardsに協賛するなど,同社はジャーナリズムの分野に力を入れており,少なからず影響を与えている。また,『The New York Times』や後述する米調査報道NPO ProPublicaをはじめ,報道機関が自社で開発したデータジャーナリズムのソフトウェアをオープンソースとして公開する動きもみられ,データジャーナリズムを実践するための環境は着実に整備されてきている。
ツール分類 | ツール名 | URL |
---|---|---|
データ収集 | Scraper Wiki | https://scraperwiki.com/ |
データ分析 | Excel | https://technet.microsoft.com/ja-jp/office/default.aspx |
R | http://cran.md.tsukuba.ac.jp/ | |
Google Trends | https://www.google.com/trends/explore#cmpt=q&tz= | |
Google Fusion Tables | https://support.google.com/fusiontables/answer/2571232 | |
データ可視化 | Tableau | http://www.tableau.com/ja-jp |
D3.js | http://d3js.org/ | |
E2D3 | http://e2d3.org/?lang=ja | |
Google Maps | https://www.google.co.jp/maps | |
OpenStreetMap | https://www.openstreetmap.org/#map=5/51.500/-0.100 | |
Google Charts | https://developers.google.com/chart/ | |
Google Public Data Explorer | http://www.google.com/publicdata/directory | |
データ共有 | Google Sheets | https://docs.google.com/spreadsheets/u/0/ |
データジャーナリズムは新しい分野ではあるが,急速な学習ニーズの高まりとともに,MOOC(Massive Open Online Courses)と呼ばれるオンライン講座に注目が集まるようになった。米テキサス大学オースティン校ナイト・センター・フォー・ジャーナリズムが2013年8月に開校したデータジャーナリズムの無料オンライン講座Data-Driven Journalism: The Basicsでは,データジャーナリズムの第一線で活躍する講師から実践的な手法を学べることもあり,世界135か国から3,654人の受講者が集まった。筆者を含む日本人45人が受講したこの講座では,データをグラフィックで可視化するための方法や,Webアプリケーションの組み込み方法,Excelの活用方法,情報公開請求の方法などが教えられた。
一方,大学も少しずつ対応をみせている。米CUNY(The City University of New York,ニューヨーク市立大学)や米コロンビア大学,英シティ大学をはじめ,一部の先進的な大学では,報道機関と連携し,プログラミングやデータビジュアライゼーションなど,データジャーナリズムの手法を実践的に学べるカリキュラムを整備している13)。国内での教育機会はまだ少ない状況にあるが,データジャーナリズムに対するニーズの高まりとともに,勉強会やハッカソンを開催する動きが広がってきている。日本ジャーナリスト教育センターが2013年11月に主催したハッカソン「データジャーナリズム・キャンプ&アワード」には,32名のジャーナリスト,エンジニア,デザイナー,アナリストが集まり,腕を競い合った14)。
データジャーナリズムは,ニュースの制作プロセスにおいて,さまざまな形のコラボレーションを生み出している。
1つは,冒頭で紹介したWikiLeaks報道の事例にみられるような,世界各国の報道機関が単一のデータセットをもとに協力して取材を進めるケースだ。2013年4月,タックスヘイブン(租税回避地)への金の流れを示す250万件もの大量のデータを入手した国際調査報道機関ICIJ(The International Consortium of Investigative Journalists)は,これをデータベース化したうえで,各国の報道機関に取材協力を要請した15)。これに応えた米国や欧州の報道機関が中心となり,タックスヘイブンを利用した税逃れの実態を明らかにし,世界中に大きな衝撃を与えた。ICIJは2015年に入り,今度は6万件に及ぶスイスにあるプライベートバンクの利用実態を示すデータを各国の報道機関に共有し,同様の手法で税逃れの実態解明にも取り組んでいる16)。ニュースバリューのあるファクトは国によって異なり,また,それぞれの国の報道機関の方が裏付け取材も進めやすいことから,こうした連携は今後ますます不可欠なものとなるはずだ。
国内の報道機関同士が協力するケースもある。米調査報道NPO ProPublicaは全米各地の学力を示すデータを収集・分析することで全米の教育機会の格差を浮き彫りにするとともに,収集したデータの検索機能をWebサイト上に公開した17)。『The Opportunity Gap(教育機会の格差)』と名付けられたこのプロジェクトでは複数の米地方メディアが反応し,データをもとに取材を進め,地域ごとの教育事情を明らかにした。ProPublicaは40人程度の陣容ながら,エンジニアやアナリストの採用を進め,この事例のようにテクノロジーを活用することで報道にレバレッジを効かせ,設立からわずか6年でピューリッツァー賞を2度受賞するなど,すでに大きな功績を残している。
そしてもう1つ,クラウドソーシングにより,報道機関が読者の協力を得るケースがある。The Guardianは2010年,英国会議員の金の使い道を調査するため領収書に目をつけた。同社は領収書をスキャナーで取り込んだだけで構造化されておらず,その確認には膨大な時間がかかる。そこで同社はクラウドソーシングで領収書をチェックする仕組みを開発し,読者の協力のもと領収書の分析を進め,最終的に国会議員による無駄遣いの実態をつきとめた18)。こうした読者と報道機関によるクラウドソーシング型の分業は,その後,ProPublicaやアルゼンチンの新聞社ラ・ネシオンなども実践し,大きな成果をあげている。
限られたリソースのもと,膨大な量のデータを分析し,発見したファクトについて1つひとつ裏取り取材をするのは困難を極める。しかしながら,先進的な編集現場では,データを中心に据え,テクノロジーを活用し,役割分担を洗練させることで対処している。さらには,そこからさまざまなコラボレーションの形が生まれ,多くのニュースが「共創」されるようになってきている。
データジャーナリズムが社会に与えている影響の1つは,データが示すファクトの重要性があらためて見直されるようになった点にある。2012年末のアメリカ大統領選では,評論家や批評家が「経験や取材に基づく」予想を軒並み外す中,全州の勝敗を「データ」によってすべて的中させた統計学者Nait Silver氏がクローズアップされた。これ以降アメリカの選挙報道では,データに基づくファクトが重要なものと位置づけられるようになった。科学の世界とは異なり,ニュースの世界ではこれまでデータの活用範囲は限定されていたが,データジャーナリズムによってその潮目が変わってきている。
データジャーナリズムが社会に与えているもう1つの影響は,ニュースを「読むもの」から「体験するもの」に変えつつある点だ。本稿でも紹介した読者に「操作」を促すインタラクティブなニュースは,これまでのニュースの概念を覆した。ニュースは読者に「自分ごと」としてとらえてもらわなければ,その意義は半減する。データジャーナリズムで開発された,無味乾燥なデータに命を吹き込むさまざまな表現方法は,ニュースを「自分ごと」としてとらえてもらうための強力なツールとしても期待されている。
日本ジャーナリスト教育センター運営委員,報道機関システムエンジニア。データジャーナリズムの黎明期から事例研究を進め,セミナーやハッカソンを企画・運営するなどデータジャーナリズムの普及活動に携わる。