マーケティングレビュー
Online ISSN : 2435-0443
査読論文
居住地選好アンケートデータを用いた住みたい街の圏域抽出
新井 優太相島 雅樹小出 佳世
著者情報
ジャーナル フリー HTML

2020 年 1 巻 1 号 p. 58-66

詳細
Abstract

現在の不動産ポータルサイトの多くは,沿線から駅と順に物件を絞り込んでいくような探索方法が主流である。しかしそれが,合理的に自分に合った居住地を探索する方法だとは限らない。たとえば,似た特徴を持った街の集団が分かっていれば,街の特徴から選択するような探索方法も可能である。そこで本研究では,住みたい街アンケート個票データから,住みたい街ネットワークを構築し,モジュラリティ最大化による手法を用いることで,空間的・心理的距離が近く,似た特徴を持つ街の集団を圏域として抽出することを試みた。その結果,首都圏を75の圏域に分割することができた。さらにコレスポンデンス分析を用いることで,各圏域についての特徴付けを行った。

Translated Abstract

Currently, the mainstream online search method used by many real estate portal sites is to show properties in the order of their distance from the nearest rail (including subway) station (i.e., the closest property first, etc.). However, this method does not necessarily enable a person to search for the place of residence that “fits” that person in a logical manner. For example, if it were known that certain community (town) “clusters” had similar characteristics, this would enable a search method whereby selection is made according to community characteristics. In the present study, a network of desirable communities was constructed from desirable residential-preference questionnaire data. Using a modularity optimization method, an attempt was made to extract area clusters having similar characteristics, with closely resembling spatial and psychological distances. As a result, the Tokyo metropolitan area could be divided into 75 such clusters. Each cluster was subsequently characterized using correspondence analysis.

I. はじめに

日本における圏域というものを考えたときの1つに「首都圏」や「関西圏」などの大きなくくりがある。今更言及するまでもないが,首都圏は1都7県からなっており,その中でも栃木県,群馬県,山梨県を除いた1都4県は東京周辺の生活圏(都市圏)として,「東京大都市圏」や「東京都市圏」,「東京圏」と呼ばれる。

また圏域の解像度をもう1段階上げて,東京という1つの都市についてみても,23区,26市,5町,8村という行政区から成り立っており,それぞれの行政区ごとに異なった特徴を持っている。そのような中で,例えば地方から東京都内へ進学・就職・転勤などを理由に引っ越しを行うような場合,自分にあった新たな居住地を探すことは非常に労力を伴う。

近年,引っ越しなどで新たな住居を探す際には,不動産ポータルサイトを利用することが一般的になってきており,瞬時に大量の情報を取得することが容易になった。現在の不動産ポータルサイトの多くでは,まずは沿線やエリアから駅へと候補地の範囲を絞っていく。その際に,地縁がないとまずは通学・通勤先への交通アクセスが良い「知っている街(駅)≒有名な街(駅)」から探すのが一般的ではないだろうか。

しかしながらこのような選択の仕方が,合理的に自らの条件に適合する街や住まいの探索方法だとは言い難い。例えば,有名な街だからといって探索者の趣味嗜好に合っているとも限らない。これが本研究の着想に至った動機である。

そこで我々は街の特徴からレコメンデーションできないかと考えた。しかしながら,ただ単にJaccard指数や何らかの類似度に基づいて特徴が似ている街をレコメンドする場合,駅前に商業施設が集積しているという理由で,水戸駅と大宮駅が同時にレコメンドされてしまう可能性がある。多くの人は,水戸駅と大宮駅のような遠く離れた場所を同時に提示されても困惑するだろう。そのため街の特徴が似ており,かつ,人が空間的・心理的に近いと認識している街の集団を抽出する必要がある。

ここではそのための第一歩として,住みたい街アンケート個票データを用いて,そのような街の集団抽出を試みる。このアンケートでは各回答者に3つの住みたい街を回答してもらっているが,このとき同時に選ばれる3つの街こそ,回答者にとって空間的・心理的に近い街だと考えた。また,同時に選ばれる街がそれぞれ全く異なった特徴になっているとも考えづらく,ある程度似た特徴を持つ街が選ばれると期待される。つまり,同時に選ばれやすい駅の集団が抽出できれば,その集団はそれぞれ空間的・心理的に近く似た特徴を持つと考えられる。

そこで本研究では複雑系ネットワークの手法を用いることで,街の集団(=圏域)抽出を行う。詳細は後述するが,このような手法を用いることで複数の回答者に同時に選ばれやすい街ほど,高確率で同一の圏域に所属するような抽出が可能となる。

また,本研究のマーケティングにおける貢献として,不動産領域におけるマーケットセグメントの推定がある。従来の不動産マーケットにおけるエリア分割は経験的なものであったが,本研究によってそのセグメンテーションを定量的・客観的に示せる。これによって,いわゆる街の不動産仲介会社が行うようなレコメンデーションをwebサイト上で行えるようになる可能性がある。

II. 先行研究

日本における広い意味での圏域抽出と考えられる都市圏の研究としては,Kanemoto and Tokuoka(2002)がある。そこでは,日本の都市圏定義に公式なものがないため,研究者が独自に都市圏定義を提案しているという問題点を指摘し,新たな都市圏と郊外の定義を提案している。しかし本研究では,都市圏や郊外のような分類ではなく,空間的・心理的に近いと認知されている街の圏域を抽出したい。

より街という単位に近い圏域の分析では,Kamoshida(2004)でパーソントリップ調査の「私事(買い物など)」の目的別流動データを用いた生活圏の圏域分析が報告されている。しかしながら,この分析では単純に大きな商業施設があるかどうかなどによって,圏域分けされてしまっている可能性があるし,街の特徴などについては言及されていない。

一方,街の心理的評価の地域的差異については,Tone(2009)で報告されている。そこでは,心理的評価の地域的差異と地域イメージの生成要因に関する分析を行っている。データとしてはリクルート社との共同調査のアンケート個票データが用いられており,住宅購入者を対象としている。この論文では,メディア・高級・洗練感に関する地域イメージ満足度に関して地域間の有意差があると報告されているものの,地域の区切りを沿線として与えている。本研究では似た特徴を持つ地域を,圏域として自動的に抽出したい。

また,地理空間と人の認知に関する研究分野の1つとして認知地図がある(Lynch, 1960)。特に認知地図研究を中心にした行動地理学におけるMDSの応用事例を紹介した論文としてWakabayashi(2006)がある。そこでは9ヵ所の地点間の認知距離データを収集し,現実の地図との乖離を示している。しかしこのような調査は,地点が増えるほど認知距離データの収集は困難であり,本研究のような広範囲では難しい。

III. データ

本研究では,不動産ポータルサイト「SUUMO」を運営する株式会社リクルート住まいカンパニーが行った「SUUMO住みたい街ランキング2019 関東版」の個票データを用いる。

この調査は,関東(茨城県,埼玉県,千葉県,東京都,神奈川県)在住の20歳~49歳の男女を対象に実施し,平成27年国勢調査の構成に合わせて,都道府県×性別×年代で表1のように割り付けてある。

表1

住みたい街調査の割り付け

また,同調査はインターネットによるアンケート調査であり,1番目~3番目に住みたい街までの3つを回答してもらっている。回答方法は,画面上にプルダウンリストを3つ設置し,都道府県→沿線→駅の順で選択肢を絞り込む形になっている。そのため,街というのは基本的に駅を示している。以下では,街という言葉で統一する。

さらに同調査では,住みたい街以外にも様々な設問がある。多くは本研究では使用しないため,これ以上の詳細は割愛するものの,関連する調査項目として「選んだ街に住みたい理由」がある。ネットワーク分析で街の圏域を推定したのち,この設問と組み合わせたコレスポンデンス分析を行うことで,圏域ごとの特徴付けを行う。

IV. 手法

1. ネットワークの構築

本研究では,前述したデータで選ばれた街をノードとして,ある回答者に同時に選ばれた街同士にリンクを張ることで,ネットワークを構築する。図1にネットワーク構築のイメージを示す。

図1

ネットワーク構築フロー(イメージ)

まず1人目の回答者が街1,街2,街3を住みたい街として挙げたとする。この時,同時に選ばれた街は空間的・心理的に近い街とみなし,それぞれの街間にリンクを張る。次に,2人目の回答者が街4,街5,街6を住みたい街として挙げたとする。これらの街間にも同様にリンクを張る。そして3人目の回答者が街1,街2,街5を挙げたとすると街1,街5と街2,街5の間にリンクが張られ,それぞれ別々のネットワークになっていた街1~3と街4~6が1つの大きなネットワークとしてまとまる。この手順を繰り返すことで,ネットワークを構築していく。

またこの時,街1と街2の間にはすでに1人目の回答者の段階でリンクが張られているため,2本目のリンクが張られることになる。この場合,重み2のリンクとみなすことで,ほかの街間よりも結びつきが強いとみなすことができる。そのため,複数人に重複して同時に選ばれる街ほど結びつきが強くなり,同一圏域として抽出されやすい。

アンケート設問では,1番住みたい街~3番目に住みたい街となっているが,ネットワーク構築を行う上ではこれらの順番は特に用いず,対等に扱う。このようにして構築したネットワークは,重み付き無向ネットワークとなる。

2. 圏域の抽出

(1) モジュラリティ

本研究では,冒頭で述べた「圏域」を抽出するために,Newman(2006)によって提案された指標であるモジュラリティQを用いる。モジュラリティは,ネットワークの与えられた分割に対して,圏域内にリンクが多く,圏域外へのリンクが少ない分割ほど高い値を示す。

(2) Fast Unfolding法

次に,モジュラリティQが最大となる分割を得る手法について説明を行う。モジュラリティQが最大となるネットワークの分割を厳密に得ようとすると,あらゆる分割パターンについて計算を行わなければならない。その分割のパターン数は街数が増えると爆発的に増加する。そのためすべての分割パターンを調べることは実質不可能である。そこで,モンテカルロシミュレーションによる確率的な手法を用いる。

代表的な手法として,貪欲アルゴリズム(Clauset, Newman & Moore, 2004)やスピングラス法に基づくアルゴリズム(Reichardt & Bornholdt, 2006)などいくつかあるが,本研究ではBlondel, Guillaume, Lambiotte, and Lefebvre(2008)によって提案されたFast Unfolding法と呼ばれる手法を用いる1)

本来この手法では,段階的に大きな圏域を求めるのだが,そのように求めた圏域の場合,モジュラリティQは最大化されるものの,関東で10個以下程度の大きな圏域になってしまう。本研究ではもっと細かい圏域を得たいため,最初の段階で得られた圏域を用いる。

また上述したように,Fast Unfolding法は確率的な手法であるため,最終的に得られる分割が異なる。そのため本研究では,10,000回計算を行い,最初の段階で最もモジュラリティの値が高い分割を用いる。

V. 分析結果

1. 住みたい街アンケートの回答傾向

まず初めに,住みたい街個票データの回答傾向を調べるために,回答者の最寄沿線と住みたい街の沿線の重複度合を調べた。その結果を表2に示す。

表2

最寄沿線と住みたい街の沿線重複度

2中の沿線重複数0は住みたい街3つ全てを最寄り沿線上にない街から選んでいるケースを表している。このことから,半数以上の回答者が最寄沿線と同一沿線上から住みたい街を1つ以上挙げていることがわかる。また今回の集計では駅と沿線の名寄せを行っていない。そのため,東京駅は山手線や京浜東北線をはじめとする多くの沿線が乗り入れているが,回答者が山手線の東京駅と挙げた場合は山手線としか扱っていないため,実際には沿線の重複度合としてはもっと高くなることが想定される。このことから,通勤や通学で利用する沿線上の,ある程度知っている街,つまり心理的距離の近い街が選ばれやすい傾向にあると考えられる。

次に,回答者の最寄駅と3つの住みたい街間の距離について調べた結果を図2に示す。まず,図2左をみるとわかるように,最寄り駅から直線10 km以内の住みたい街を選んでいる回答が約10,000件あり,全回答のうちの半数近くを占めることがわかる。直線距離で10 kmというのは,山手線だと上野-渋谷,中央線では東京-中野,京浜東北線では川崎-横浜間に相当する(ただし,いずれも若干10 kmには満たない)。

図2

最寄り駅と住みたい街の距離(左)と3つの住みたい街間の合計距離(右)

次に,図2右を見るとわかるように,3つの住みたい街間の距離関係としては10 km~20 kmの組み合わせが最も多く,3街間の距離関係が30 km以下の組み合わせで全回答の約半数を占める。

ちなみに,住みたい街TOP3である横浜,恵比寿,吉祥寺を選んだ場合,3街間の距離は約61 kmであり,3街間の距離が61 km以上となるような駅の組み合わせは全回答の25%に満たない。このことから,住みたい街としては,自分がよく利用する沿線上の空間的距離の近い街が選ばれる傾向にあると考えられる。

2. 住みたい街ネットワークの圏域

今回の個票データから得られた街の数は1,325,リンク数は21,000である。しかしながら,このネットワークは全ての街が連結しているわけではなく,全部で4つの連結成分に分かれている。なぜそのようなことが起こるのかというと,ある一人の回答者にしか選ばれなかった3つの街があると,その3つだけトライアングル構造のネットワークとして分離してしまう。ただし,そのような回答は非常に少ないため除外し,本研究では最も大きな街ネットワークを構成している1,318駅を対象にFast Unfolding法を用いて圏域の分割を行う。

得られた分割のモジュラリティQ値は0.44であり,75の圏域に分割された。すべての圏域を図示することはできないため,住みたい街上位10の街が所属している圏域を図3に示し,これら圏域のネットワーク特徴量を表3に示す。

図3

住みたい街上位10駅が所属する圏域(同一マーカーは同一圏域を示す)

表3

代表的な圏域に関するネットワーク特徴量

まず図を見るとわかるように,横浜圏域(横浜・武蔵小杉・鎌倉が所属),恵比寿圏域(恵比寿・新宿・品川が所属),吉祥寺圏域(吉祥寺・中野・三鷹が所属),大宮圏域(大宮・浦和が所属)の4圏域に分かれている。また,IV-1でも触れたように,同一沿線上の街は同じ圏域に所属する傾向はあるものの,県境で分断されている沿線も見られる。例えば東急東横線では新丸子駅~横浜側は横浜圏域に属しているように見えるが,渋谷~多摩川は別圏域となっている。

次に,表3をみるとわかるように,横浜圏域は所属する街の数が多いものの,リンク数が少ないために疎なネットワーク構造をしていることがわかる。逆に大宮圏域は所属する街の数こそ少ないものの,最もクラスター係数が高く,密度の高い構造が示唆されている。このことから,大宮圏域に所属する街に投票している回答者の多くは,似たような組み合わせで投票する傾向にあるとわかる。

3. 抽出された圏域の特徴付け

IIIで述べたように,本研究で用いたアンケート調査では,住みたい街を選んだ理由についての設問が37項目ある。そこで,これらを用いて得られた圏域についての特徴づけを行う。全項目を示すことは困難なため,抜粋した14項目について上記圏域ごとに選択された特徴の回答率を集計し,表4としてまとめた。表4から4つの圏域の中でそれぞれの強みを見てみると,横浜圏域は「緑や海,川などの自然が豊富」という項目の評価が高い。これは横浜圏域に鎌倉や逗子方面まで含まれているためだと考えられる。次に吉祥寺圏域では「緑や海,川などの自然が豊富」,「お祭りなど地域の交流が盛んである」がほかの項目に比べて高い。また,大宮圏域では「自然災害がすくなそう」,「小学校・中学校などの教育環境が充実している」といった項目が高く,それぞれ異なった強みを持っていることがわかる。

表4

代表的な圏域の魅力評価

表中の数値は圏域ごとに魅力だと回答された割合(%)を表す

ここまでは代表的な圏域についてのみその特徴をみてきたが,より俯瞰的に多くの圏域に関する特徴付けを行うため,住みたい街ランキング上位100以内に入る駅が所属する圏域について,住みたい理由37項目をそれぞれ集計し,コレスポンデンス分析を行った。その結果を図4に示す。なお,得られた結果に対するイナーシャの寄与率(二次元での累積)をみると約67%であり,ある程度の説明力を持ったモデルになっている。

図4

圏域に対するコレスポンデンス分析

図を見るとわかるように,コレスポンデンス分析を行ったことで,各圏域の特徴が明確に表れている。例えば,第1象限の印象は,「緑や海,川などの自然が豊富」,「今後発展しそう」などの近年開発されている郊外都市,第2象限の印象は,「物価が安い」,「自然災害が少なそう」,「公民館などの公共施設の使い勝手がいい」と言った昔からの郊外で暮らしのコストパフォーマンスが良いイメージ,第3象限は「どこに行くにも電車・バス移動が便利だ」,「歩く範囲で日常のものは一通り揃う」などの下町で暮らしの利便性が高いイメージ,第4象限は「資産価値がありそう」,「メディアによく取り上げられて有名である」などの心理的評価が高いイメージになっている。

実際,表3でも住みたい街上位である横浜,恵比寿,吉祥寺が所属する圏域では,交通利便や買い物などの日常利便だけでなく,資産価値やメディア露出などに関しての高評価が共通している。このことから,住みたい街で上位に選ばれるためにはこれらの項目が重視されていることがわかる。

VI. 考察

本研究では,住みたい街アンケート個票データに対して複雑系ネットワークの手法を用いることで,空間的・心理的距離が近い街の集団を圏域として抽出し,各圏域の特徴づけを行った。

まず同一沿線上の街ほど同一圏域として抽出される傾向が強いとわかった。しかしながら,単純に沿線で分かれているというわけでもなく,沿線によっては県境や川によって異なる圏域に分割されることがわかった。例えば不動産マーケットにおいて,県境や川によってエリアが分断されるというのは経験的に知られてきたことであるが,今回はそれを定量的に示すことができた。また,沿線によっては県境や川で県域が分断されないものもある。このように,県域で分断されてしまう沿線とされない沿線があることは非常に興味深い結果であり,圏域別の特徴をより詳細に分析することで,鉄道沿線イメージのブランディングやマーケティングへの応用が考えられる。

次に,得られた圏域についてコレスポンデンス分析を行い,圏域の特徴づけを行った。住みたい街上位の街が所属する圏域の多くは第4象限,もしくはその近くに位置しており,逆に上位の中でも比較的下位の街が所属する圏域は第2象限に位置している。このことから,住みたい街の特徴としては資産価値やメディア露出などが重視され,居住費や物価の安さ,行政サービスなどは重視されにくい傾向にあることもわかった。

1)  本研究における計算はR(version 3.5.1)とネットワーク分析用のライブラリであるigraph(version 1.2.2)を使用した。またFastUnfolding法については,igraphに用意された関数であるmultilevel.communityを使用した。

References
 
© 2020 日本マーケティング学会
feedback
Top