情報管理
Online ISSN : 1347-1597
Print ISSN : 0021-7298
ISSN-L : 0021-7298
記事
ビッグデータを用いた観光動態把握とその活用:動体データで訪日外客の動きをとらえる
相原 健郎
著者情報
ジャーナル フリー HTML

2017 年 59 巻 11 号 p. 743-754

詳細
著者抄録

本稿は,携帯電話や位置に基づくサービス等で取得される動体データを用いて,その解析に基づく観光動態把握と活用に関して,分析事例なども交えて概説する。まず,観光分析の観点を整理したうえで,携帯電話基地局における動体データ,スマートフォンアプリケーションを用いた動体データ,および,SNSデータ等の性質などを紹介する。次に,観光庁の訪日外客の動態調査で行われた分析事例を紹介する。加えて,分析における問題も指摘する。さらに,目的地性指標を用いた動体データの分析結果を示し,人間の行動モデルの一つであるLevy Flightモデルと一致することを紹介する。

1. はじめに

外国から日本を訪れる1年間の来訪者数(訪日外客数)は,日本政府観光局の調査1)によれば2013年に初めて1,000万人を超えて以降,2015年に約1,974万人に達し,2016年はすでに2,000万人を超えた。訪日外客の消費単価は,2015年の観光庁「訪日外国人消費動向」2)において17万6,000円余りとされており,2016年も訪日外客数の増加等から単純計算で3兆円を超える規模の消費が国内にもたらされることになる。

一方,日本人の国内旅行の実態については,訪日外客ほどの正確な数値を得るのは容易ではないが,観光庁「旅行・観光産業の経済効果に関する調査研究」3)によれば,国民1人当たりの宿泊旅行は年間約2.47回,日帰り旅行は約2.30回とされ,国内での観光消費は22.3兆円とされた注1)。各地域においては,それぞれの地域に適した効果的な観光振興施策を実施していくことが重要であるが,そのために,観光実態のより詳細な把握や,旅行者のもつ多様な期待や問題点等を的確にとらえていくことが不可欠となる。

本稿では,主に動体データの解析に基づく観光動態把握に関し,事例なども交えて概説する。

2. 観光分析における観点

現状把握と次の観光施策立案に資する分析結果を得るためには,その施策立案の当事者の目的意識と合致した分析が必要となる。本節では,典型的な分析の観点を示す。流動把握は,地域外との関係性と,地域内での流動との2つを考える。

(1) 大局を知る(地域間流動)

地域外との関係性は,自地域の置かれている状況と,自地域の特徴をとらえるという視点になる。自地域への入り込み,他地域との比較評価,他地域と自地域との間での流動,自地域と特性の近い地域の検出と比較,などが典型的な観点となる。

(2) 立ち寄り場所と動線をとらえる(地域内流動)

地域内での流動においては,まず地域内での滞在場所を抽出し,その間を結んで軌跡としてデータを整理していくのが一般的である。滞在は,同一地点付近での滞留時間により判定されることが多い。滞在時間とその時間帯,および,地区の特性等から,宿泊や食事等の滞在目的の推定がしばしば行われる。滞在場所間の移動における交通手段の推定,把握も重要となる。

複数の旅行者の軌跡を集計することで,地域内の集客地点や地区,地点間や地区間の移動の傾向やパターン等の解析が可能となる。軌跡を残す旅行者の属性がわかる場合は,さらにその属性ごとに分類して傾向を測ることになる。

(3) 興味,課題をとらえる

滞在場所での滞在を「立ち寄り」と見なし,その場所に旅行者の興味をひく観光資源があると仮定する。近傍の観光スポット情報と突き合わせることで,旅行者の興味対象を推定する。

(4) 機会損失や潜在性を測る

(3)とは逆に,立ち寄らずに通過してしまう,近くに来たのに寄ってくれない,などの動態を知る。立ち寄ってもらえていないという状況に潜む課題や可能性を,立ち寄られている場所と比較することで探る。

(5) 地域の特質を測る

その地域の特質を,他地域との比較で測る。たとえば,旅行者はその地域に何を求めているのか,似た特質の地域で評価の高いところとの違いは何か,補完し合える,もしくは,連携しうる近傍の地域はどこか,など。

(6) 変化の兆しをとらえる

旅行者のセグメントごとに訪問数が増えつつある(減りつつある),今後増えることが期待される,などの兆しを,訪問者数やソーシャル・ネットワーキング・サービス(SNS)上のトレンド等から測る。

3. 利用可能なデータと特徴

本章では,観光動態の把握に利用されてきたデータと,その性質について,代表的なものを取り上げて述べる。

3.1 移動に関するデータ

現時点で,観光の現状把握等に対して最も期待されているのはこの分類のデータになる。大きく2つに分けられる。1つは,携帯電話などが発する電波を基地局で捕捉するものである。基地局を設置し運用する通信事業者が,携帯端末から発せられる個体の識別コードを捕捉し,記録することで,基地局の位置情報と合わせて集計する。データ収集は比較的容易だが,大規模な設備をもつ通信事業者等に限られる。

もう1つは,携帯端末向けのモバイルサービスによってサービス側で収集するものである。端末自身が自らの位置を測位し通知することでデータ収集が可能となるため,比較的小規模の事業者やサービスでもデータを集められる可能性がある。

3.1.1 基地局での電波捕捉に基づくデータ

携帯電話の場合は,一般に1つの基地局が数百mから数km程度の範囲をカバーするとされていることから,その空間解像度での位置情報となる。基地局は住居等が存在しない山間部等を除くと全国を広くかつ間断なくカバーしているため,個体ごとの継続的な移動を捕捉できると考えられる。

たとえば,NTTドコモ社(ドコモ)の携帯電話ネットワークにおける運用データに基づく「モバイル空間統計」は,各個体の位置情報を,回線ごとの契約地域もしくは契約事業者国・地域(海外ローミングの場合)の情報と合わせて統計データにして提供する。ドコモの普及率(人口に対する契約者数)等も考慮して,各エリアにおける人口の時間推移が推計されている。あるエリアにおける来訪者推計数の時間推移を,その居住地(契約地域)ごとに出力することができるため,広域にわたるエリア間での移動や,比較的長い期間に対する移動傾向などをとらえられると期待される(1)。

一方,無線LAN等の場合は,その通信範囲が数十m程度となるため,空間解像度は携帯電話に比べて高いが,基地局が設置されている場所が交通機関のエリアや商業地周辺に偏るため,移動把握は間欠的で,かつ,それらが電波を発信する状態であることが前提となる。

図1 モバイル空間統計の作成手順(海外ローミングの場合)

3.1.2 位置情報サービスの利用に基づくデータ

携帯通信端末を用いたモバイルサービスには,TwitterやFacebookなどのSNSや,位置情報に基づき情報提供を行うサービス(例:店舗情報,経路検索サービス),ゲームなど,さまざまなものがあるが,サービス利用の際に利用者の位置を取得するものが多い。

これらサービスを通じた動体データ取得の優位点の一つは,サービス利用者の属性の取得や,場合によっては直接アンケート等の回答を利用者に求めることが可能な点にある。動体データに,より詳細な利用者像を付与できることで,ターゲットを絞った観光施策の立案も可能となる。

本項では,これらの中で,取得した利用者の位置やサービス利用の情報を基に,利用者の動向を提供しているものを取り上げる。

(1) 位置情報に基づき情報提供を行うサービス

位置情報に基づき情報提供を行うサービスの中で,比較的利用者が多く,また,そこでの収集データが分析に利用されるものの中から,KDDI社のサービス(Location Trends)ならびに,ナビタイムジャパン社のサービス(ナビタイム)を取り上げる。

KDDI社は,特定のプログラムに参加するスマートフォン契約者の基地局での位置情報取得に加え,アプリケーションサービスの利用者の中で情報取得とその利用に同意した利用者の位置情報を取得し,それらを用いた観光動態調査や商圏分析レポート「Location Trends」を提供している。「モバイル空間統計」よりも利用者規模は絞られるが,GPSに基づく移動情報も対象に含まれ,また,利用者属性が一部付加されるという,特色をもつ。

一方,ナビタイムは,経路検索やナビゲーションに特色を有するサービスを提供しており,そこで取得したデータの動態分析への活用を進めている。ナビゲーションの利用データは,利用者の移動における立ち寄り地や目的地,および,経路や移動手段の実態把握への活用が期待される。また,経路検索の利用ログは,観光地への近未来の来訪予測などでの活用が考えられる。

上記2社を含む多くの国内在住者向けサービスについては,日本人による国内旅行の行動が反映していると考えられるが,一般に,これらサービスの利用者は東京等の大都市圏に多く,また,世代等にも偏りがあると考えられ,特に地方における動態分析においてこれらデータを用いる場合は注意が必要となる。

さらにナビタイムは「NAVITIME for Japan Travel」(英語)という外国人向けのスマートフォンアプリケーションを通じて,訪日外客の国内での経路検索等の行動を支援するとともに,位置情報の取得を進めている。月当たりの利用者数7万程度のうち,観光分析目的での位置情報の利用を許諾し,かつ,日本国内での利用が確認されている利用者は1万を超えるとされている(2016年3月時点)。また,利用者から,国籍や訪日回数,訪日目的等の回答も得て,分析に活用している。

このナビタイムの外国人向けサービスは,利用者の属性や訪日目的等も付与された移動データを取得するという点で,訪日外客の国内での動向を探るのに適したデータとして期待される。ただし,利用者に国・地域ごとの偏りがあること,個人旅行客に比べて団体客やパッケージツアー客の利用者が少ないと思われること,さらなる利用者の確保や大幅な利用者増に関する課題があること,などを考慮する必要がある。

(2) 無線LAN接続サービス

アプリケーションサービスの利用によって分析の基となる利用者の位置情報等を得るためには,利用者が継続的にサービスを利用するための動機付けが必要となる。

たとえば,訪日外客の日本滞在時の不満の一つとして,外出先での通信の不便さ(無償での無線LAN利用)が知られている。ワイヤ・アンド・ワイヤレス社(Wi2)は,この点を突いて利用者の獲得を図るサービスを提供している。Wi2は,全国規模で無線LANアクセスポイントを提供する事業者である。Wi2が提供する「TRAVEL JAPAN Wi-Fi」サービスでは,利用者の位置の捕捉と利用者属性の取得を可能にしている専用アプリケーションのインストールと使用が,利用者が無償で無線LANサービスを利用する条件になっているため,それに参加する明確な動機付けとなっている。Wi2によれば,2014年12月のサービス開始から10か月で100万を超えるダウンロードを達成し,これらがすべて訪日外客によって国内で利用されたとすれば,訪日外客を対象としたサービスとしては比較的大きな利用者数を有するといえる。

3.2 興味,評価,消費等を反映するデータ

前節までのデータは,主に旅行者の位置を取得するものだが,旅行者の興味や評価・消費等が反映されているデータは,施策を考えるうえでは重要である。

3.2.1 交通系ICカード,電子マネー,クレジットカード

交通系ICカード(例:JR東日本Suica,PASMO)の交通機関や店舗などでの利用データは,利用者の乗降記録に基づく移動情報だけではなく,店舗やサービスなどを利用したという行為をも記録することになる。そのため,場所に応じたサービス利用の分析に活用することが今後期待される。

一方,他の電子マネーやクレジットカードの利用データは,以前から消費動向の把握とマーケティングに活用されてきた。都市部に比べ,地方部や小規模店舗等においてこれらの決済方法が利用できないことが多く,訪日外客の不満の一つになっているだけでなく,データを取得する機会を損失しており,今後の課題といえよう。

3.2.2 SNS

消費を直接的にとらえられるわけではないが,各種サービスや商品等の利用・購買や,それらへの興味,評価,および,不満等を反映するデータとして,SNSが挙げられる。たとえばTwitterは,公開投稿が前提であり,投稿者の属性情報も一部公開されている。また,数は極めて少ないが,位置情報付きのコンテンツも存在する。位置が明示されていない投稿コンテンツの場合は投稿内容(テキスト)に基づく投稿対象の推定や,投稿対象に対する評価(好意的か,否定的か,など)の推定(評判分析)等が行われる。

Twitterのような短文投稿SNSは,その投稿コンテンツが短文であるがゆえ,自然言語処理技術による位置や評判の推定精度は必ずしも高くないため,うまく抽出できたものを「参考情報」として利用することが適切と考えられる。また,これらの精度が今後向上したとしても,そもそもこれらの投稿者にどのような偏りがあり,また同一投稿者においても投稿行為にどのような偏りがあるかが不明である注2)。したがって,たとえば意見の多寡で判断する,件数等で順位を付ける,肯定的意見と否定的意見の数を比較する,などを安易に行ってはならない。

一方で,SNSは,その投稿が他の観光客に影響を及ぼす可能性もあるため,これまで何も投稿がなかった場所についての新たな投稿は,その後の観光客来訪の兆しやきっかけになる可能性がある。たとえば,瀬戸内の大久野島でのウサギに関係する投稿の急激な増加がとらえられたとすると,それが呼び水となって,この後来訪者が増えるかもしれない。SNS上でのトピックの抽出やトレンドの分析などは,着眼点を見つける有効な手だてとなるかもしれない。

なお,SNS個々の盛衰も激しく,近年では短文投稿からインスタグラム等の写真投稿SNSに急速に移行しているという指摘もあり,たとえば地域に対する評判の経時変化をみる場合などは注意が必要である。

4. 分析事例

4.1 分析にあたって

前章で述べたように,観光動態の把握のために利用可能なデータは増えてきており,また,今後も増えていくと考えられる。データを取り扱ううえで,まずその諸元を整理し把握しておくことは,データ活用の大前提として欠かせない。以下は,最低限押さえておくべき諸元である。

(1) 取得に関して

(A)取得方法: 基地局での電波捕捉,位置情報サービスの利用,アンケート回答,など。

(B)取得条件: 通信可能なエリアにいる場合のみ,GPSで測位できる場所のみ,など。

(C)欠損やエラー等: 通信不能なエリアの部分は欠損となる,内部に××時間分だけ蓄積できるがそれ以上は古いものから削除される,など。

(2) サンプル抽出に関して

(A)条件: 対象者

(B)サンプル数

(C)母集団における位置付け:年代,国籍等への偏り,など。

(3) データおよび分析結果の利用の条件

2は,得たデータは母集団のどのくらいを網羅しているか(カバー率)と,データから得られる分析内容の多さ(深さ)で,各データの特性を示したものである。法務省の出入国管理統計は,基本的に全訪日外客をカバーするが,出入国場所における国籍とその数しかわからない。一方,観光庁の訪日外国人消費動向調査は,訪日目的や訪日回数など,訪日外客の詳細な動向の把握に有用だが,聞き取り調査であるため,調査サンプル数は限定的である。現状では,カバー率が高く,また詳細な分析が行える,コストをかけずに取得できる理想的なデータは存在しない。したがって現実には,多様なデータを集めてそれらを1つに織り上げて,不足する部分は分析者の見識で補間するなどして,観光動態を把握することになる。このとき,各データの特性と諸元を正確に把握したうえで,データ間の関係性などを明らかにして取り扱う必要があり,出入国管理統計や訪日外国人消費動向調査のデータは,参照データとして有用だと考えられる。また,解析対象のデータがこれら参照データとの比較でどのような傾向があるかを,事前に明らかにしておくことが重要である。他に利用可能な統計調査データとしては,旅行・観光消費動向調査,宿泊旅行統計調査,観光地域経済調査(いずれも観光庁)などがある。

図2 利用可能なデータの特性(カバー率と分析内容の深さ)

4.2 訪日外国人動態調査における分析

本節では,実際の分析例として,2015年度に観光庁が実施した「ICTを活用した訪日外国人観光動態調査」(以下,訪日外国人動態調査)4)を取り上げる。

訪日外国人動態調査では,3に示す3種類のデータを用いて分析が行われた。また,利用されたデータのサンプル数比較を1に示す。これによると,携帯電話基地局での電波捕捉に基づくローミングデータは訪日外客(約1,969万人)の約1/8に相当する約250万台のサンプル数を有し,全体の傾向を偏りなくとらえるデータとして期待される。位置情報サービスの利用に基づくGPSデータは,2万5,000 人程度であり,国・地域別の偏りも大きい。全般に,欧米や東南アジア等の利用は相対的に多いが,中国や韓国などにはサンプル数の面で課題がみられる。TwitterやSina Weibo等のSNSデータは,さらに対象国・地域が絞られ,また偏りも大きい。したがって,たとえばSNSデータを定量的に分析し,訪日外客全般の「傾向」を把握する目的での利用は適当とはいえず,GPSデータやSNSデータは,国籍別に分けて論じるのが望ましいといえよう。

これらを踏まえ,訪日外国人動態調査では,ローミングデータから,全国規模での国籍別の集中・分散や,季節ごとの変動等が測られた。一方,GPSデータからは,主に局所的な動線等について分析が行われ,その地域での旅行者の移動事例として抽出された。また,SNSでの外国人の投稿を対象に,日本での観光に関する興味や評価等の抽出が図られた。さらに,これらのデータを重ね合わせて分析することで,都道府県や市町村等をまたがって行われる広域観光周遊や,いわゆる「ゴールデンルート」における流動や周辺への派生等の実態などの分析が行われた。

図3 観光庁「ICTを活用した訪日外国人観光動態調査」(2015年度)の概要
表1 「ICTを活用した訪日外国人観光動態調査」(2015年度)で利用した,データのサンプル数比較

4.2.1 分析例: ゴールデンルート派生分析

ゴールデンルートは,明確な定義が定まっていないが,一般に東京から大阪までの東海道新幹線の通るエリアを指すことが多い。訪日外客の訪問先がここに偏るとされているエリアであり,ここから他エリアへの誘引は,広域観光施策では重要視されている。そのため,この調査では,東海道新幹線通過都府県をゴールデンルートと仮定し,ローミングデータから広域流動の実態把握を図るとともに,GPSデータから,着目する地域における移動例等が抽出された。

4は,広島を例にとり,広島エリアを訪れた(滞在したと見なされる)訪日外客の,ゴールデンルート(左図)および福岡方面(右図)との流動を,ローミングデータから示したものである。これによれば,ゴールデンルートから広島エリアを訪れた後に再びゴールデンルートに戻る旅行者数(7万292人)が,東行き(2万6,267人)もしくは西行き(2万7,603人)の一方向の移動者数に比べて多いことがわかる(左図)。また,広島エリアと福岡エリアとの間の流動(右図)をみると,福岡エリアから広島エリアへの往復は少数(3,828人)で,片方向の流動が一定(東行き6,427人,西行き1万2,167人)程度みられる。

一方,5は,広島エリアを訪れた訪日外客の,その訪問前後の行動をGPSデータを基に可視化したものである。左図は広島エリア訪問前の行動を,右図は訪問後の行動をそれぞれ表す。両者を比較すると,訪問前よりも訪問後の方が広島以北や広島以西,九州方面での行動の広がりがより多く認められるとともに,瀬戸内海を挟んで四国北部までの流動が見て取れる。

さらに,中国,台湾,香港,韓国,米国の各国・地域で利用者の多いSNS(Twitter,Sina Weibo,Plurkの3つのマイクロブログと,ブログ,フォーラム)を対象に,瀬戸内周辺の主要な観光地における投稿を分析した結果を6に示す。

これらの結果(46)を重ね合わせてみると,ゴールデンルートから広島エリアまで多くの旅行者が訪れ,その中で四国や九州などにも足を延ばす人がいること,そして瀬戸内では大久野島のウサギや直島のアート作品などの観光スポットが,訪日外客に好意的に受け入れられていることなどが浮かび上がってくる。一方で,山陰方面や四国の南側等への誘引に関し,交通手段等も含めて課題などがみえてくる。これに対し,たとえば,広島-松山間や愛媛-大分間で一部みられる船舶での移動を充実させ,四国南部や九州方面等を船舶を活用して周遊するルート等の開発などもアイデアとして浮かんでくる。このように,旅行者の流動と興味対象等を可視化し,重ね合わせて解釈することで,観光施策の検討などに活用できると考えられる。

図4 ローミングデータの解析例:広島エリアにおける流動
図5 GPSデータの解析例:広島エリア来訪前後における行動
図6 SNSデータからの投稿分析例(瀬戸内海周辺)

4.3 観光行動モデルの分析

ここでは,観光行動を抽象化する分析例として,筆者による目的地性指標を用いた例5)を紹介する。目的地性指標は,各軌跡データにおいて,軌跡中の各点に定義されたスコアによって与えられる。スコアは,軌跡の開始点と終了点に「高さ」を想定し,線形補間によって軌跡上の各位置に割り当てられる。開始点と終了点の「高低差」は,軌跡での移動に要した時間によって与えられる。開始点の時刻をt0,終了点の時刻をtDとしたとき,時刻tにおけるスコアht)は次式で算出される。

地理グリッドごとに各軌跡におけるスコアを累積し,目的地性指標とする。グリッドi における目的地性指標Ei は,全N個の軌跡において,各軌跡j の当該グリッドiのスコアhij により次式で与えられる。

各軌跡の中間時刻の点ではスコアが0となるため,目的地性指標0付近は,データが取得できていない場所と,出発と到着に関して偏りの少ない場所等となる。遠くからの目的地となる場所は目的地性が高くなり,その起点となる場所は負の値をとる。7は,ある時期の北海道におけるナビタイムデータを用いて,地域メッシュコード(JISX0410)における第2次地域区画(10kmメッシュ)に対して目的地性を算出し,正値は青,負値は赤とし,それぞれ絶対値が大きいほど濃い色となるように可視化したものである。濃い青で示されたグリッドは,遠くから時間をかけて来た旅行者がいた場所として認識されるため,それらグリッド周辺をより詳細に分析することで,旅行者をひきつけた理由などの推測につながることが期待される。この例では,ニセコや美瑛などの主要な観光地は青が強く表れており,また網走も濃い青となっていることがわかる。人数で可視化した場合は,多くの旅行者が利用する新千歳空港周辺や札幌,函館などが強く出てしまい,他の地域が不明瞭になってしまうが,特徴的なところが浮かび上がることが期待される。

また,この目的地性指標と,単純な人口統計(各グリッドにおける旅行者の多寡)との相関をとると,相関係数が0.67となり,来訪者が多い地域ほど目的地性指標が高いという傾向がみられた。言い換えれば,ある地域のランドマークに遠くからやって来て,その後近傍に分散していく傾向がある。この行動傾向は,人間の観光行動のモデルとして説明に使われることのあるLevy Flightモデルとも合致している。Levy Flightモデルはランダムウォークの一種で,進行方向は常にランダムに選択されるが,まれに,非常に長い距離の移動が行われる。散策行動において,近傍のある領域を探した後,時々長距離を移動し,その移動先で再び近傍の散策を行う,という動き方となる。ランダムウォークに比べ,効率のよい探索が行われることが示唆されており,捕食行動,散策行動などを説明するとされる6)

観光行動においても,その行動パターンがLevy Flightモデルに従うならば,観光施策立案への積極的・戦略的な活用も考えられる。観光行動では,自動車や列車である一定距離を移動した後,その周辺を散策し,しばらくするとまた移動し,その先で散策を行う,という動き方に相当すると思われる。仮に,長距離移動の目的地がそのエリアのランドマークであり,そこを中心としてその後散策行動を行うとするならば,旅行者に対してそのエリア全体の魅力をうまく伝えて周遊先として選択してもらえるようにし,また,そのランドマークへのアクセスを改善することが重要となるであろう。前出の目的地性指標の大きい場所がそのランドマークとなっているとするならば,これら旅行者の行動データからランドマークと周辺エリアの同定等が行えることになる。データに反映される観光実態から,施策上の観光エリアを形作っていくことが可能となる。

図7 目的地性指標の例

4.4 バイアスの排除

ここでは,データの解析に関して,これまで述べてきたもの以外の注意すべき事項について述べる。

1つは,実験者バイアス(experimenter bias)の排除である。実験者バイアスとは,実験結果や,データ,もしくは実験への参加者に対して,実験者が持つ「期待する望ましい結果」が無意識のうちに影響をもたらしてしまうことをいう。データ分析においては,「こうであってほしい」「こうに違いない」という思いが,データ分析の過程においてそれを支持する側面を強調し,また,都合の悪い面を排除してしまおうとする作用として表れる。ゆがんだ分析結果を根拠に観光施策が進められることは,従来の「経験と勘」に基づくよりも,「もっともらしい客観的根拠」がある分だけたちが悪い。受け入れやすいものに飛びついたり,受け入れがたいものから目をそらしたりしてはいけない。

また,解析データに関しては,プライバシー保護について十分配慮がなされなくてはならない。各サービスの利用者に対して,行動ログ等の取得と,分析利用について丁寧かつわかりやすく説明をし,承諾を得ておくことが必要となるとともに,取得したデータの匿名性の担保には十分に気をつける必要がある。特に,特定の国籍等に分けての分析や,地方部等の比較的データの少ない地域では,匿名性維持が分析上の制約となることも多く,それがバイアスとなることもある。さらに,国・地域によっては,その国民のデータ取得そのものを問題にするところもあるため,常にプライバシー保護の動静には注意を払い,適切な対応をしていく必要がある。

5. おわりに

観光ビッグデータの分析は,実世界のデータを取得し,分析して,実社会へのフィードバックに生かしていくサイバーフィジカルシステム7)の具体例と見なせる。筆者は,サイバーフィジカルシステムにおいては,データ解析手法の技術的課題と同程度以上に,種々のデータを分析可能な形に整え,また,それを正確に取り扱えるような環境を整えることがより重要であると考えている。本稿でも,どのようなデータをどう扱うかという点に重きを置いて述べた。

もちろん,画像処理や自然言語処理,機械学習等をSNSや投稿写真等からの情報抽出に利用することは有用であり,それらを適切に利用していくことは必要である。今後,多くのユーザーからデータを取得できるようになり,またそれらの密度が上がっていけば,統計モデルに基づく各種解析や機械学習等の技術の適用範囲が広がっていくであろう。

執筆者略歴

  • 相原 健郎(あいはら けんろう) kenro.aihara@nii.ac.jp

東京大学大学院 工学系研究科博士課程修了。博士(工学)。文部省学術情報センター助手(1997年),国立情報学研究所助手(2000年)を経て,2004年より准教授。情報工学,特に,人間-機械インタラクション,創造性支援,実世界でのコンテキストアウェアに関する研究などに従事。近年は,観光分野におけるICT活用の研究,実践等に携わるとともに,観光庁「ICTを活用した訪日外国人観光動態調査検討委員会」座長等を歴任する。

本文の注
注1)  なお,観光庁 “旅行・観光消費動向調査:2010年度以降調査結果(調査拡充後): 「2015年1~12月期(確報)」集計表”(http://www.mlit.go.jp/kankocho/siryou/toukei/shouhidoukou.html)によれば,消費単価は,それぞれ5万520円(宿泊旅行),1万5,758円(日帰り旅行)とされている。年間の国内での観光消費は,国内宿泊旅行:15兆8,120億3,300万円,国内日帰り旅行:4兆5,969億7,300万円,海外旅行の国内消費分:1兆9,005億5,700万円を合計した22兆3,095億6,300万円となる。

注2)  ある投稿者が,行動すべてを一貫して投稿するわけではなく,どんなときに投稿し,またどんなときにしないのかがわからないため,「投稿がなされていない」ということの扱いが定まらない。データがないということは,そこには何も存在しないということとは異なる。

参考文献
 
© 2017 Japan Science and Technology Agency
feedback
Top