データ分析の理論と応用
Online ISSN : 2434-3382
Print ISSN : 2186-4195
論文
非対称クラスター分析法を用いたGPSデータの分析
—横浜観光エリアにおける観光行動の把握—
横山 暁有馬 貴之冨田 裕也
著者情報
ジャーナル フリー HTML

2023 年 12 巻 1 号 p. 17-31

詳細
要旨

本研究では,横浜市西区・中区における2019年と2022年の4月および5月の土日祝日の来訪者のGPSデータを用いて,横浜観光エリアの観光行動の分析を行った.分析対象エリアを観光エリアごとに18に分割し,訪問者の位置情報データからエリア間の遷移データ作成し,k-medoids法および非対称性を考慮したクラスター分析法を用いて分析した.その結果,k-medoids法の分析では,2019年と2022年共に,隣接エリアを中心としたクラスター構造が得られた.非対称性を考慮した分析では,2019年のデータにおいては,比較的近接するエリアによってクラスターが形成されたのに対し,2022年のデータにおいては,新港を中心としたみなとみらいエリアから山下公園周辺までの幅広いエリアで構成される特徴的なクラスターが出現し,観光行動の違いがみられる結果となった.加えて,データの非対称性を用いた分析を行うことにより,エリアの流出入を考慮した観光行動の方向性に基づく解釈が可能となる結果となった.

Abstract

The purpose of this paper is to understand tourism behavior in Yokohama by analyzing the tourist’s behavior on weekends and holidays in April and May of 2019 and 2022 using GPS data of visitors in Nishi and Naka wards of Yokohama City. The area was divided into 18 areas by tourist area, the transition data between areas were generated from the tourist movement, and these data were analyzed by the k-medoids method and Asymmetric Cluster analysis.

Analysis of the k-medoids method provided cluster structures centered on adjacent areas for both 2019 and 2022. In the asymmetric cluster analysis, clusters were constructed by relatively close areas in the anaylsis of the 2019 data, but in the analysis of the 2022 data, a characteristic cluster consisting of a wide range of areas from the Minato Mirai area to the Yamashita Park area centered on Shinko area appeared. It is shown that these results show differences in tourism behavior between the two sets of data. In addition, because of the analysis that considers asymmetry, the results allow for interpretation based on the directionality of tourisum behavior, which takes into account the inflows and outflows of the areas.

1. はじめに

観光地に対する施策や事業を検討する上では,現状その観光地がどのように利用されているのかを把握することが求められる.言い換えれば,観光者の行動の把握であり,そのために既に多くの調査が行われ分析手法が用いられている.しかし,観光行動の把握は容易ではなく,過去には参与調査やアンケート調査が主たる手段であった.今日でも国や自治体による観光行動の多くはアンケート調査が主たる調査方法となっている(例えば,観光庁, 2022a, b; 東京都, 2020; 横浜市文化観光局, 2022).また,分析手法においてもアンケート調査ゆえに集計やそれに伴う検定,また因子分析を始めとする多変量解析などの一般的なアンケート調査の分析手法が用いられてきた.一方,今日では携帯電話・スマートフォンの基地局との通信や端末そのものの位置情報によりGPSデータの収集が行われ,各種の多変量解析や機械学習的手法,また空間的自己相関やカーネル密度推定による分析などが実施されている(例えば,岩田・桑原・石塚・倉又・清原・中田, 2021;柴田・岩本・小森・多賀・鈴木, 2021; Majewska, 2017; 松井・住谷・笹尾・中田, 2021).特に近年では,ルート軌跡をk-means 法を用いて分類したものや(Liu, Wang, Yang, Mou, Zheng,Zhang,&Yang, 2022),訪問箇所の順序をシーケンス解析にて分類したもの(Choe, Lee, Choi,Kim,&Sim, 2022)などがある.ただし,上記の分析手法を含めて,GPSデータによる観光行動の分析は,その膨大なデータ量ゆえに未だ途上と認識されており(Rout, Nitoslawski, Ladle, & Galpern, 2021; Schm¨ucker&Reif., 2022),データや分析目的によって適切な分析法を検討する必要があろう.

本研究では,観光者の回遊行動(以下,観光行動)が頻繁にみられる横浜中心部の観光エリアを対象に,観光行動を把握することを目的に分析を行った.2021年には2,536万人の観光者が訪れた横浜市では,本研究で対象とする横浜中心部の観光エリア(西区・中区)が観光の中心地区となっている(山口, 2022).東京都心部に比べると,訪日外国人数や宿泊者数の割合は少なく,東京を含めた近隣地区からの日帰り観光が軸である.加えて,横浜駅周辺,みなとみらい,新港,関内,山下公園,元町・山手といった,直線距離で北西から南東方向に約5km,北東から南西方向に約2.5kmの比較的狭い地区に特徴のある観光エリアをもっている.観光者は現地まで公共交通機関等で移動し,横浜中心部を徒歩やバス等で移動し,飲食やショッピング,文化財などの観覧を行なうことが多い(横浜市文化観光局, 2022).また,赤レンガ倉庫前広場や横浜スタジアム,劇場やコンサートホールなどで実施される各種イベントも横浜の観光資源であり,ここでのイベントを目的に来訪する観光者もいる.本研究における分析では(株)Agoop(以下,Agoop社)が提供する「流動人口データ提供サービス」によるGPSデータより2019年と2022年の4月および5月の土日祝日に横浜市西区・中区に訪問・滞在したデータを利用する.このデータより,横浜の観光エリア間の2019年と2022年それぞれにおける観光客の遷移データを作成し,クラスター分析法を用いて観光エリアをクラスター分けすることで,2年間の差異を含む訪問者の観光行動の把握を行う.特に遷移データは,あるエリアから別のエリアへの遷移の数とその逆の遷移の数が異なる非対称データであるため,Okada and Yokoyama (2015)で提案された非対称クラスター分析法を用い,非対称性を生かした分析を行うことにより,観光エリア間の方向性をもった観光行動の把握を試みる.これらの分析によって,観光エリア間における観光行動をこれまでよりも意味をもった形で把握することができる.そしてこの結果は自治体等ステークホルダーが施策の設定や評価を行う際に貢献することが期待される.

2. 分析に用いるGPS データについて

2.1. データの概要

本研究で用いたデータはAgoop社が提供する各種のスマートフォン向けアプリケーションから得られる位置情報等のデータであり,分析には横浜市西区・中区の2019年4月6日,7日,5月3日~6日,25日,26日,2022年4月9日,10日,5月3日~5日,28日,29日(いずれも土日祝日,合計15日)のデータを利用した.これらの分析対象日の選定にあたっては,1年の中で比較的観光行動がしやすい春~初夏の時期とし,加えて2019年と2022年でなるべく条件が揃うよう,気象庁の過去の気象データ・ダウンロード1より過去の天気概況を確認した上で選定している.

データは,ID,GPSデータの緯度・経度(世界測地系),データが取得された日時(年・月・日・時・分),曜日,端末のOS情報(Android, iOS),GPSの精度(m),移動速度(m/s),当該端末を所持している人の推定居住国や推定居住地(市区町村単位),推定勤務地(市区町村単位),性別,年代(15歳未満,15歳から69歳まで5歳刻み,70歳以上)等で構成されている.

データの仕様書によれば,移動速度はスマートフォンのセンサーから取得した移動速度(m/s)であり,IDはユーザー・端末に日ごとに割り振られる値で,同一ユーザー・端末でも別の日には別のIDが付与される.また,位置情報データの取得のタイミングはスマートフォンのOSやアプリケーションの種類や起動状況により異なっており,アプリケーションが起動している際に一定間隔で位置情報を取得する場合,アプリケーションを操作したタイミングで位置情報を取得する場合,ある地点から大きく移動をした場合に位置情報を取得する場合等が混在している.そのため,例えばあるIDにおいて12時00分に横浜駅周辺で位置情報が取得された時,その次に取得されたデータが13時00分に横浜駅から離れた中華街であることも考えられる.また,用いたデータの制約上,本分析対象エリアである横浜市西区・中区をいったん離れ再び戻ってきた場合においては,その間の位置情報データは取得できていない.位置情報データの分析に関する研究,例えば,岩田他(2021)松井他(2021)柴田他(2021)で用いられているタクシーのプローブデータ2では,「GPS時系列データは平均で40秒に1回程度の間隔で取得されて」(岩田他, 2021, p.75)いるため,移動そのものを把握することや,特定地点・地域での滞在に関するデータを取得し分析に利用することが可能であるが,本研究で用いたデータは前述のように必ずしも連続的にデータが取得できていないため,滞在時間を用いた分析は困難であることに注意が必要である.

2.2. 分析対象エリア

横浜市西区・中区における観光行動を分析するにあたり,図1の薄い赤色で表す西区と中区を主要な18の観光エリアに分割し(表1および図1の青色),これらのエリアおよびエリア間における観光行動を分析対象とすることとした.このエリアの分割は著者によってなされたものであるが,町丁目の区分けや幹線道路,鉄道,河川によって分割することを原則として,公園に関してはそのエリアと隣接する道路等,ふ頭に関してはその部分,また,商店街や横浜スタジアムはそのエリアを設定している.加えて山口(2022)の図10に示された横浜の観光資源・施設の分布を参考に,近隣の同じ属性の観光資源はなるべく同じエリアになるようにも調整している.なお,表1の主な観光資源・施設は,山口(2022)における観光資源・施設を参考に,本分析で分析対象としているエリアにおける資源・施設や新たに開業した施設等の分類を筆者により追加したものである.また,前節で述べたように,このエリアは北西から南東方向に約5km,北東から南西に約2.5kmのエリアで成り立っているため,エリアの端から端まで徒歩で1時間強,エリアの中心から隣接エリアの中心までは,おおむね徒歩15分以内で移動できる.

図1 横浜市西区・中区と分析に用いたエリア
表1 横浜西区・中区の主要18エリアの概要

ここで,各エリアについて表1に基づいて簡単に説明をする.横浜駅西側および横浜駅東側のエリアは,主にデパートを中心とする物品販売施設が立ち並んでいるエリアであり,西側には2020年6月にJR横浜タワーが開業している.また東側のエリアは子供向けの博物館等も含まれている.みなとみらい北側はオフィスビルが立ち並ぶエリアであるが,横浜駅に近い場所に2021年にプラネタリウムを含む複合商業施設(横濱ゲートタワー)が開業している.みなとみらい南側は物品販売や飲食を含む複合商業施設や宿泊施設が立ち並ぶエリアであり,臨港パークは国際会議場やホテルおよび公園で構成されるエリアである.新港は歴史的建造物である赤レンガ倉庫やワールドポーターズ等の物品販売や飲食を含む複合商業施設が中心となる横浜観光のシンボル的なエリアであり,2019年秋には複合商業施設である横浜ハンマーヘッドが開業している.関内周辺は神奈川県庁等の歴史的建造物や開港資料館等の文化・教育施設,人文観光資源が中心となるエリアである.日ノ出町周辺は伊勢山皇大神宮や桜木町駅西口にある野毛たべもの横丁が中心となるエリア,野毛山は野毛山動物園や公園で構成されるエリア,伊勢佐木町周辺は横浜・イセザキ・モール1-6St. と呼ばれる商店街が中心となるエリアである.横浜スタジアムはプロ野球横浜DeNAベイスターズが本拠地球場とするスタジアムおよび横浜公園で構成されるエリア,中華街周辺は横浜中華街で構成されるエリアである.山下公園周辺は,山下公園に加え,横浜マリンタワーや国の重要文化財である氷川丸があるエリアである.元町商店街はその名の通り元町商店街で構成されるエリア,山手町周辺には旧外国人居留地と,山手公園および元町公園などがある.港の見える丘公園は公園や隣接する神奈川近代文学館があるエリアである.また,大さん橋ふ頭は関内や山下公園に隣接するふ頭であり,客船ターミナル等がある.山下ふ頭は近年再開発が行われているエリアであり,2020年12月には18メートルの動くガンダムがあるGUNDAM FACTORYYOKOHAMAが開業している.

また,2021年4月には,桜木町駅(みなとみらい南側)と運河パーク(新港エリア)を結ぶロープウェイ「YOKOHAMA AIR CABIN」が開業し,はまレールウォーク(横浜駅周辺),キングモール橋(みなとみらい北側・臨港パーク間),さくらみらい橋(桜木町駅周辺)等が新設や整備されており,開発が進んでいる.

分析を行うにあたり観光行動の変化を把握する際には,これらエリアの特徴や新設された施設,また,2020年春からの新型コロナウイルス感染症の流行(以下,コロナ禍)に伴う影響に関して考慮することは必要である.なお,2022年の春は厚生労働省(2022)によれば第6波と第7波の間であり,比較的感染は落ち着いていた時期であることを付記しておく.

2.3. データ加工

2.2 節で示した18のエリアの間の観光行動に着目した分析を行うにあたり,以下のような手順でデータを加工した.

1. 各GPS データの緯度・経度情報からデータに図1表1に示すエリア名を付加する(エリア外のデータは「エリア外」とする)

2. GPSの精度が低いものは分析対象外とするため,精度が50mより大きいデータを取り除く

3. 推定居住地および推定勤務地が横浜市西区・中区であるデータを取り除く

4. 午前8時00分から午後11時59分までのデータを1日のデータとする(午前8時以前のデータを取り除く)

5. 移動速度が5m/sより大きいデータを取り除く

2に関しては,データの仕様書によると,多くのGPSの精度が50m程度以内に収まっていること,またWi-Fiによる位置測位がなされた場合に50mを超える数値が示されるとされているために50mと設定した.3に関しては,当該エリアへの観光での来訪者を分析対象とするため,居住および勤務であるデータを取り除くこととした.また4に関しても,観光行動を分析対象とするために深夜~早朝を除く朝から夜までのデータを利用することとした.5に関しては,観光行動を分析するにあたり,エリアに対象者が滞在し,他のエリアに移動したかどうかを判断する必要がある.2.1節で示した通り,本データから滞在時間を取得することは困難であるが,移動速度が小さいデータはそのエリアに滞在したとみなせる.反対に移動速度の大きいデータは車や鉄道での移動と考えられ,この場合はエリアを通過している可能性が考えられる.それらを分析対象外とするために,原則として徒歩や自転車での移動が想定される5m/sまでのデータを利用することとした.なおこの場合,エリア間の移動に車(バスを含む)や鉄道で移動すると移動中のデータは取得されず,結果として隣接しないエリアに遷移することがあり得る点には注意が必要である.

この加工によって得られたデータ数およびID数の集計結果について表2および表3に,各エリアの訪問回数の平均を表4に示す.分析対象エリアでは日々様々なイベントが開催されていることもあり,本分析で分析対象とする2019年の8日間,2022年の7日間のデータには各日でデータ数の差が存在する.例えば,横浜スタジアムをホームグラウンドにしているプロ野球の横浜DeNAベイスターズは分析対象日のうち2019年4月6日,7日,5月6日,25日,26日,2022年5月3日~5日に試合があった.分析にあたり,これらのイベント等の状況をそろえて分析することは現実的ではない.ただし,前述したように,天気概況等の情報は考慮して分析対象日を設定しているため,それぞれの年において同質の期間として考え,2019年の8日間,および2022年の7日間のデータを平均する形で分析を行うことで2019年と2022年の観光行動を把握することとした.なお,Agoop社によれば2022年は2019年と比較してGPSデータを取得するスマートフォンのアプリケーションが増えており,2019年よりも2022年でデータ数が増えている.1つのIDから取得されるデータ数も2019年は約15.7件,2022年は約28.4件と増えていることより,データ取得の粒度や性能が向上したと考えられるが,データ取得の条件が変化している点には分析や考察を行う点で注意が必要と考えられる.

表2 分析データのデータ・ID数
表3 分析データの日ごとのデータ数・ID数
表4 エリアごとのデータ数の平均

3. 分析

3.1. 分析手法と遷移データの作成

分析では,観光エリアの観光行動の特徴を把握するために,エリア間の遷移行動のデータ(以下,遷移データ)を作成し分析を行う.エリア間の遷移行動は「似ているエリア間を行き来する」という,ある種のエリア間の親近性を示すと捉え,遷移データを親近度データ(類似度データ・非類似度データ)とみなし,クラスター分析を適用する.これにより同一クラスターに分類されたエリアはそれぞれの遷移行動が多く,すなわち類似性のあるエリアと判断される.

分析に用いる遷移データは,前節で示した方法で加工されたデータについて,エリア外を含む19のエリア間の遷移回数をカウントし,19エリア×19エリアの遷移データとして集計されたものである.なお,2.3節でも述べたように,本研究では日別の観光行動を分析することは目的とはせず,2019年と2022年それぞれにおける遷移データの平均をとったものを分析に用いることとした.

また,分析ではエリア間の移動を対象すること,加えて2.1節で述べたデータの制約により滞在時間の把握ができないことより,遷移データの対角要素となる「連続して同じエリアにいたデータ」に関しては分析対象外とすることにした.加えて,あるエリアから「エリア外」への遷移および「エリア外」からあるエリアへの遷移も分析に用いないこととし,18エリア×18エリアの遷移データを分析に用いることとした.

なお,遷移データはあるエリアAからエリアBへの移動とエリアBからエリアAへの移動の量が異なる非対称データである.そのため,一般的なクラスター分析を行うことに加え,非対称データを分析できるクラスター分析法を用いて分析を行う.これらの分析によりGPSデータに対する非対称性を考慮した観光行動の考察を行うこととした.

分析に際し,遷移データに対してHarshman, Green, Wind, and Lundy (1982, p. 224)で用いられている基準化を適用した.これはマーケティングにおけるブランドスイッチングデータや併売データといった親近度データの分析でしばしば見られる方法であり(cf. Okada&Imaizumi,1987; Okada&Yokoyama, 2015; etc.),対象の規模の差(本研究の場合は訪問数の差)によってデータの各行および列の合計に大きな差がみられる場合に,移動そのものの構造的な要因をより明確にするために,規模の差を取り除いて分析するという観点に基づいたデータの基準化方法である.具体的には,ある対象の行と列の合計がすべての対象において等しくなるように各行および各列ごとに定数を乗ずるもので,対象の規模の差を取り除く(小さくする)ことができる.これにより,単に遷移回数が多いエリア同士が同じクラスターに所属するというわけではなく,各エリアの訪問(流入・流出)回数が一定とした下での遷移回数によってクラスター分けされることとなり,観光行動を明確にすることが可能となる.分析に用いたデータを表5および表6に示す3

表5 基準化後の2019年の遷移データ
表6 基準化後の2022年の遷移データ

3.2. k-medoids 法を用いた分析

本節では,表5および表6の遷移データに対し,k-medoids法を用いた分析の結果を紹介する.k-medoids法はKaufman and Rousseeuw(1987)によって提案された非階層クラスター分析法である.非階層クラスター分析法ではk-means法を用いることが一般的であると考えらえるが,k-means法は対象×変数の矩形データを分析対象とするため,本研究で分析に用いる対象×対象の正方行列形式の遷移データを分析した場合,行もしくは列どちらか一方の対象を元にした遷移情報から算出された距離を用いた分析になる点が問題となる.またk-means法ではクラスターの中心は所属する対象の重心で,必ずしも対象そのものにならないのに対し,k-medoids法ではクラスターの中心は必ず対象そのものとなる.本データのように対象に面積をもつ場合,k-means法におけるクラスターの重心が表すものが不明確となってしまう.加えて,次節で用いる非対称クラスター分析法とのアルゴリズムの類似性,結果表現の統一性より,本研究ではk-medoids法を用いることとした.

k-medoids法にて2019年と2022年のデータをそれぞれ分析した結果を表8および図2に示す.なお,クラスター数の決定に際し,エリア数が18 であるためクラスター数を多くしてしまうと,1つのクラスターに所属するエリアが少なくなり観光行動を捉えることが困難となるため,クラスター数を3~5で変更して分析を実施した.表7k-medoids法の各分析におけるシルエット係数の平均である.2019のデータの分析ではクラスター数5が,2022年のデータの分析ではクラスター数4が最良な結果となった.この結果および次節で述べる非対称クラスター分析法での結果との比較も考慮し,クラスター数4を最終的な結果とした.

表7 k-medoids法によるクラスターごとのシルエット係数の平均
表8 k-medoids法によるクラスター構造
図2 k-medoids法によるクラスター分け

表8をみると,2019年と2022年でハマスタの所属が異なる点を除き同一の結果になった.クラスター1(図2の青色,以下同じ)は横浜駅西側・東側,みなとみらい北側・南側と隣接する臨港,新港エリアで構成されるクラスター,クラスター2(赤色)は関内,中華街を中心としたエリアで構成されるクラスター,クラスター3(緑色)は日ノ出を中心とした南西側の内陸エリアで構成されるクラスター,クラスター4(黄色)は山手を中心とした南東側エリアで構成されるクラスター,と解釈することができる.なお,どのクラスターにおいても原則として隣接するエリアで構成されるクラスター構造が現れる結果であった.

この結果から各エリアの観光資源・施設を考慮して訪問者の観光行動を考えると,クラスター1は物品販売施設や飲食施設・複合商業施設の多い横浜駅,みなとみらい駅周辺や,臨港パーク,新港のいくつかのエリアをを回る観光行動を示し,クラスター2は関内や中華街を中心とした文化・教育施設や飲食施設を散策する観光行動を,クラスター3は野毛山動物園・公園を中心に文化・教育施設やレジャー施設を回る観光行動を,クラスター4は山手や港の見える丘公園等の人文観光資源等を散策する観光行動を示す結果となった.また,2019 年から2022 年では施設が新設され,またコロナ禍を経たが,クラスター構造に大きな変化が見られない結果であった.

3.3. 非対称クラスター分析法を用いた分析

本節では遷移データの非対称性を考慮したクラスター分析法を用いて分析を行うことで,非対称性を考慮した観光行動の把握を試みる.

非対称データを分析することのできるクラスター分析法は,Okada and Iwamoto(1996)Takeuchi, Saito, and Yadohisa (2007),Olszewski( 2011, 2012) などいくつか提案されているが,ここでは Okada and Yokoyama (2015) で提案された親近度データの歪対称性を利用した非対称クラスター分析法(Asymmetric CLUster analysis based on SKEW-symmetry; ACLUSKEW)を用いる.この分析法は類似度データS = [sij]に対して対称成分(sik + ski)および非対称成分(sikski)に対して,式(1)に示すGOF (Goodness Of Fit)を最大化するようなK個のクラスター中心およびクラスター構造を見つける分析法である.

ここでKは分析者が指定するクラスター数,Nkは対象Kがdominant objectであるクラスターの対象数,signumは符号関数である.またp, qは0以上のべき乗定数である.

この方法では,2つの対象i, j間の類似度sij, sjiにおいて,sij > sjiであれば,iからjへの流出がjからiへの流出より多いことになる.つまり,jiに対して支配的(原著論文では“dominant”と表現されている)であるとされ,このアルゴリズムにより,「支配的な対象(Dominant object)」を中心としたクラスター構造が得られることになる.これを遷移データに適用すると,あるクラスターにおいて相対的に流入が多い対象(地区)が「支配的な対象(地区)」に選ばれることになり,他の対象(地区)から「支配的な対象(地区)」への方向性を持った遷移行動があることが推察されることになる.

この方法を表5および表6の遷移データに適用して分析を行った.なお,(1)式におけるべき乗定数p, qは前節のk-medoids法のアルゴリズムに合わせてp = q = 1 として分析を行った.分析時のGOFの値を表10に示す.クラスター数は,2019年の分析ではクラスター数4と5のGOFの値が同一であること,2022年の分析ではGOFの増加分がクラスター数3と4より4と5のほうが小さいこと,また前節のk-medoids法と比較のため,クラスター数4を最終的な結果とした.その分析結果を表9および図3に示す.

図3 ACLUSKEWによるクラスター分け
表9 ACLUSKEWによるクラスター構造
表10 ACLUSKEWによるクラスターごとのGOF

2019年においては,クラスター1は横浜駅東を中心とする横浜駅およびみなとみらい駅エリア(図3の青色,以下同じ),クラスター2は新港を中心とする湾岸・関内エリア(赤色),クラスター3は伊勢佐木町を中心とする中華街周辺エリア(緑色),クラスター4山手町を中心とする山の手エリア(黄色),という構造となった.特に各エリアの観光資源・施設およびDominant objectを考慮すると,クラスター1ではみなとみらい駅側での複合商業施設や飲食施設での買い物から横浜駅方面に移動する行動が示され,クラスター2では関内や臨港パーク等の様々な施設から複合商業施設や物品販売施設の多い新港エリアへの行動が,クラスター3は港の見える丘公園から中華街周辺を通り伊勢佐木町方面への行動が,クラスター4は山の手エリアから山下公園・山下ふ頭方面への行動が示され,方向性もった観光行動を得ることが出来た.

一方で2022 年においては,クラスター1は新港を中心として臨港パークから山下公園まで広がる湾岸エリア(青色),クラスター2は日ノ出を中心とする内陸エリア(赤色),クラスター3は伊勢佐木町を中心とする関内・中華街周辺エリア(緑色),クラスター4は港の見える丘を中心とする南東エリア(黄色),というクラスター構造になった.同様にDominant objectを考慮すると,クラスター1では複合商業施設や飲食施設の多い横浜エリアやみなとみらいエリア,また文化・教育施設,人文観光資源の多い山下公園方面から複合商業施設や物品販売施設の多い新港エリアへの行動が示され,クラスター2ではみなとみらいにおける複合商業施設・飲食施設やレジャー施設のある野毛山から飲食施設等のある日ノ出エリアへの行動が,クラスター3では文化・教育施設や人文観光資源のある関内や飲食施設の多い中華街エリアから飲食施設があり関内駅も近い伊勢佐木町への行動が,クラスター4では人文観光資源のある山手町周辺から物品販売施設,飲食施設の多い元町商店街を通って港の見える丘公園に移動する行動がそれぞれ示された.つまり,2022年も方向性をもった観光行動が得られる結果となった.

前節のk-medoids法での結果と比較すると,非対称性を考慮することにより必ずしも近隣エリアでクラスターが構成されるわけではないことや,2019年における横浜駅東側や新港,2022年における新港や日ノ出のように,他のエリアに対するDominant objectが理解できることで,観光者が流入しているエリアを反映したクラスター構造が得られる結果となった.さらに非対称性を考慮した分析における2019年と2022年を比較すると,2022年のクラスター1は,横浜駅西側から山下公園まで北西から南東に広がる湾岸に沿った数多く幅広いエリアで構成されている一方で,それらの各エリアは2019年ではクラスター1とクラスター2に分かれてしまっていることが分かる.これは2022 年の新港が大きな「支配」力をもって近隣のエリアからの流入を招いた結果と考察する.つまり,2019年と比較して2022年は,この間に新たに開業した複合商業施設である横浜ハンマーヘッド等の影響や,コロナ禍を経た行動変容も相俟って,今まで以上にDominant objectである新港エリアに向かう観光客の流れが生じていると考察する.

4. まとめ

本研究では,横浜中心部の観光エリアにおけるGPSデータから算出された観光エリア間の遷移データに対し,k-medoids法によるクラスター分析と非対称性を考慮したクラスター分析の2つの分析を行い分析結果の違いを検討することを通して観光行動の考察を行った.

k-medoids法による分析は,2019年および2022年のどちらの分析でもほぼ同じクラスター構造であり,原則として隣接するエリアが同一のクラスターに所属する結果となった.これは隣接するエリアへの遷移行動はそれ以外への遷移行動よりも多いことを表しており,一般的に観光行動は隣接するエリアへの移動が多いと考えるため,この結果は妥当な結果であると考えられよう.

一方,ACLUSKEWを用いた非対称性を考慮したクラスター分析では,k-medoids法の結果と異なり,また2019年と2022年でも異なる結果となり,観光行動の違いを捉えることが出来た.また,Dominant objectを考慮した解釈を行うことで,特に2022年のデータ分析における新港エリアへの観光行動のように,観光行動の方向性を考慮した解釈が可能となった.この点において,非対称クラスター分析法を用いることは一定の有用性があったと考察する.

最後に,今後の課題や研究の発展性についていくつか述べる.まず,今回は観光行動の変容を見るために2019年と2022年の2年間のデータの分析を行ったが,今後継続的に分析を行うこと,また時期を変えて分析を行うことは必要と考えられる.加えて,アンケート調査等を行うことによって,観光行動の変容の原因の特定に関する研究も必要となると考えられる.また,今回は分析目的の関係上2020年と2021年のデータは扱わなかったが,これらのデータも同様に分析することでコロナ禍(緊急事態宣言中や行動制限下)の影響を調べることが出来ると考えられる.これらの点は今後の研究課題としたい.

分析手法の面では,本研究で実施した遷移行動からエリアの分類を行う場合,遷移データの作成の際に連続したエリアの遷移をとるだけではなく,3つ以上のエリアの遷移を考慮したデータ(多元データ)を作成することも可能であると考えられる.またエリアの分類においてエリアの重複性を考慮した分析法,いわゆるソフトクラスタリングの手法を用いることも可能であり,これらの分析を行うことで,より深い解釈や新しい視座が得られる結果を得る可能性が考えられ,研究の発展が期待される.

また,本研究では,2.1節で述べたように,利用したデータの取得の状況により,各エリアでの滞在時間に関する分析や,それに関連して遷移データにおける対角要素である同一エリアでの滞在に関するデータを用いた分析を行うことが困難であった.データやデータの加工によっては滞在時間等を考慮した分析を行うことも可能と考えられ,今後の課題としていきたい.

謝 辞

本研究は横浜市立大学戦略的研究推進事業(SK202108)およびJSPS科研費(20H04437,21H03717,JP21K01744)の助成を受けたものである.

本論文の執筆にあたり,立教大学名誉教授の岡太彬訓氏には貴重な助言を頂きました.また,3名の匿名の査読者からは細部にわたりコメントを頂きました.ここに深く感謝申し上げます.

脚注

脚注1 https://www.data.jma.go.jp/gmd/risk/obsdl/index.php

脚注2 このデータは経営科学系研究部会連合協議会主催令和元年度データ解析コンペティションで提供されたデータである.

脚注3 なお今後の分析の発展性を考慮し,両データとも非対角要素の合計が10万になるように定数倍している.

References
 
© 2023 日本分類学会
feedback
Top