2025 年 33 巻 2 号 p. 50-58
Recent advancements in information and communication technology have led to remarkable progress in the availability of urban spatial data. Among them, GIS data on population based on the national census is particularly well-developed. Urban planning practitioners, in particular, need to select the appropriate spatial unit(e.g., 250 meters, 500 meters, or 1 km)and criteria when examining changes in population density in a municipality. To this end, we develop a method for determining the appropriate grid square size for making histograms of population density based on computing the Akaike Information Criterion(AIC). Results of an empirical case study in Chiba prefecture show that histograms based on 1 km grid square is the best model of population density distribution in a municipality.
近年の情報通信技術の進展はめざましく,都市空間に関するデータの整備が進んでいる.なかでも国勢調査に基づく人口のGISデータは充実しており4種類(小地域と3種の地域メッシュ統計データ)が公開されている.このようにGISデータは種類が多く,どれを選べばよいか判断に窮する.
例えば自治体の都市計画の実務者について考えてみよう.都市計画の実務に取り組むにあたり,最初に市町村全域の概観を試みるであろう.最も基本となる人口のデータを用いて,所管する地域における人口密度の多い/少ない場所やその変化を把握する場合,GISデータの種類と基準を選択する問題に直面する.教科書や手引き,学術論文などにも,地域の人口分布を概観する場合に参考になるものは知られていない.
人口密度の分布は自治体によって異なる.地域全体の概観を試みるにあたり最適なメッシュサイズも異なることが予想される.そこで,本稿はGISに十分に精通しているわけではない者が直面するであろう「国勢調査のGISデータのメッシュ次数(以下,「次数」)の選択の問題」に対して,最適な次数の選択方法を提案する.対象領域における人口密度の平面分布を画像と見なし,その性質を記述する数学モデルを「画像モデル(以下「モデル」)」とよぶことにする(高木・下田,2004).単一の領域に対して複数のデータがあるということは複数のモデルがあるということである.それらからそれぞれの目的に最も適切なものを選択することが求められる.
このように,「概観する」ことを目的とするため,少ない自由度でより適合するモデルを選択するべきであろう.代表的な指標にAIC(Akaike Information Criterion:赤池情報量規準)がある.AICは期待平均対数尤度の不偏推定量の近似値に基づく規準である(坂元ほか,1983;坂元,1985).その値は最大対数尤度および自由パラメータ数で与えられる.通常,同一の確率分布に従うモデルの選択を行う場合は共通項を無視した簡便な式を用いて値を計算する.一つの対象領域のうち最も小さいAICをMAICE(Minimum AIC Estimation:最小AIC推定値)と呼び,その値を与えるモデルが最適であると考えられる.ところが,後述するように,地域全体の人口密度分布を概観する際に,次数の異なる複数の地域メッシュ統計データからAICに基づき最も良い次数の選択を試みた既往研究は存在しない.
以降,次章では既存の関連研究を整理し本稿の新規性を示す.第3章では理論的検討として本稿で取りあげる統計学的指標とその計算方法を詳説する.次数の異なる複数の地域メッシュ統計データから使用するものを選択するための指標としてAICを用いる.第4章ではケーススタディとして千葉県の市町村を取りあげる.最後に第5章において,本稿で得られた知見成果を簡単にまとめ,今後の課題について述べる.
本稿は人口に関する地域メッシュ統計を取りあげる.総務省統計局「地域メッシュ統計について」1)によると,日本を緯度・経度に基づいてほぼ同じ形状に分け,それぞれについて国勢調査の人口を編成したものである.
基準地域メッシュ(第3次地域区画,以降「3次メッシュ」または「3次」.他の次数についても同じ.)は東西方向・南北方向とも概ね1 kmのほぼ正方形で,4次はそれを東西方向・南北方向にそれぞれ2分割,5次は更に2分割ずつした区画である.1960年代から区画が固定されている.市町村程度の広さを扱う際は同じ次数であれば実用上同じ形状とみなすことができるなどの特徴があり,広く活用されている(佐藤,2019).
2.2 可変単位地区問題に関する既往研究地域全体の人口分布を概観する際の次数選択の問題は「可変地区単位問題」(伝統的には「集計単位問題」(青木,1998))の一例である.小地域や本稿で取りあげる3種のメッシュのように,対象とする地域が同じでも集計する空間単位が異なると,データの視覚的な印象や分析結果が異なってしまう現象である(Openshaw, 1984;貞広,2003;中谷,2015;石井,2018).既往研究として,1 kmメッシュと500 mメッシュのサイズの違いと任意の不定形領域における人口推定誤差及び施設への平均距離の関係を明らかにしたもの(腰塚・栗田,1984),空間相関分析により空間変動の周期とメッシュサイズの関係を考察したもの(青木ほか,1986),土地利用の同質性や都市認識に関するアンケート調査から算出した因子スコアを例に,連続量で表される属性を表示するメッシュのサイズをAICに基づいて場所により変化させたもの(玉川,1987;樋口ほか,1988),そして行政区域による集計単位の違いと道路距離計測の誤差の関係を明らかにしたもの(讃岐ほか,2010)がある.
本稿は,地域全体の人口密度分布を概観する際に,複数の地域メッシュ統計データからAICに基づき最も良い次数を選択することを試みている.樋口ほか(1988)のように手法の汎用化を重視しているのではなく,対象となる属性データを人口密度に設定し,都市計画実務を具体的に想定して階級幅を固定し,実用性を重視していることに新規性がある.
本稿の検討対象は,対象となる市町村を過不足なく被覆する3次メッシュ(以下,対象地域)とそれらを分割して得られる4次及び5次メッシュの人口分布である(図1).

議論が不必要に煩雑になることを避けて見通しを良くするために以下の仮定を置く.
[仮定1]データがないメッシュの人口を0人とする.
[仮定2]同じ次数のメッシュの面積の違いは,対象地域内では実用上無視しうるほど小さい.
[仮定3]水面などの非可住地が含まれていても,人口密度の計算には当該メッシュ全体の面積を用いる.
定式化に用いる記号を以下のように定義する.対象地域のm次(m=3,4,5)のメッシュ総数をNmとし,メッシュの面積をAmとする.メッシュ・コード(JIS X 0410-1976)の順に並べたときにk番目のメッシュの人口をPm,kとし,人口密度をρm,kとする.
3.2 人口密度の階級幅の検討前述の通り,本研究は都市計画の実務者が,所管する地域の人口分布を概観する場合について考える.都市計画で用いられる人口密度の基準の例を表1にまとめた.すべて20人/haの倍数である.地域を概観するに当たり,それぞれのメッシュが表1に示される基準による区分のどれに属するのかがわかることが望ましい.そのため,本稿における人口密度の階級幅は20人/haとする.
3.3 AICの導出
ここではメッシュの人口密度を度数分布表に整理したものを多項分布とみなし2),階級数をCmとし,下からc番目の階級の観測度数(すなわち,その階級に入るメッシュの数)をnm(c)とし,その確率をpm(c)とする.それぞれの観測度数からなる集合{nm(c)│c=1, ・・・, Cm}が得られる確率は
| \[ \begin{split} &\text{Prob}\left(\left\{n_{m}\left(c\right)\right\}|\left\{p_{m}\left(c\right)\right\}\right) \\ =&\frac{N_{m}!}{\prod _{c=1}^{C_{m}}n_{m}\left(c\right)}\prod _{c=1}^{C_{m}}{p_{m}}\left(c\right)^{{n_{m}}\left(c\right)} \end{split} \tag{1}\] |
で与えられ,対数尤度は次式で表される.
| \[ \begin{split} \mathcal{\ell}\left(\left\{p_{m}\left(c\right)\right\}\right)&=\sum _{k=1}^{N_{m}}\log k-\sum _{c=1}^{C_{m}}\log \Gamma \left(n_{m}\left\{c\right\}+1\right) \\ &+\sum _{c=1}^{C_{m}}n_{m}\left(c\right)\log ~ p_{m}\left(c\right) \end{split} \tag{2}\] |
使用する次数を選ぶのは階級cの確率の集合{pm(c)}をパラメータとする複数のモデル
| \[ \begin{split} \mathrm{MODEL}\left(m\right)&\mbox{:}{p_{m}}\left(c\right)=\theta _{m}\left(c\right) \\ \mbox{ただし }{c}&{=}{1}\text{, ・・・, }{C_{m}} \end{split} \tag{3}\] |
から一つを選ぶモデル選択問題とみなすことができる.これらは
| \[ \sum _{c=1}^{C_{m}}\theta _{m}\left(c\right)=1 \tag{4}\] |
の制約を持つので,m次メッシュの度数分布を表すモデルに対応するAIC(m)は次式で表される.
| \[ \begin{split} \mathrm{A}\mathrm{I}\mathrm{C}\left(m\right)=-2\left[\sum _{k=1}^{N_{m}}\log k-\sum _{c=1}^{C_{m}}\log n_{m}\left(c\right)!\right. \\ \left.+\sum _{c=1}^{C_{m}}n_{m}\left(c\right)\log \frac{n_{m}\left(c\right)}{N_{m}}\right]+2\left(C_{m}-1\right) \end{split} \tag{5}\] |
階乗の近似式として次式が知られている(Robbins, 1955).
| \[ \sqrt{2\pi n}\left(\frac{n}{e}\right)^{n}\mathrm{e}^{\frac{1}{12n+1}}\leq n!\leq \sqrt{2\pi n}\left(\frac{n}{e}\right)^{n}\mathrm{e}^{\frac{1}{12n}} \tag{6}\] |
これを(5)式に代入して整理すると
| \[ \begin{gathered} \sum\nolimits _{c=1}^{C_{m}}\frac{2}{12n_{m}\left(c\right)+1}-\frac{1}{6N_{m}}\leq \text{AIC}\left(m\right)+f \\ \leq \sum\nolimits _{c=1}^{C_{m}}\frac{1}{6n_{m}\left(c\right)}-\frac{2}{12N_{m}+1} \end{gathered} \tag{7}\] |
ただし
| \[ \begin{split} f&=\log N_{m}-\sum _{c=1}^{C_{m}}\log n_{m}\left(c\right) \\ &-\left(C_{m}-1\right)\left(2+\log 2\pi \right) \end{split} \tag{8}\] |
である.1≤nm(c)≤Nmだから
| \[ -\frac{1}{6}-f\leq AIC\left(m\right)\leq \frac{C_{m}}{6}-f \tag{9}\] |
を得る.相乗平均≤相加平均であるから
| \[ f_{1}\left(C_{m},N_{m}\right)\leq AIC\left(m\right)\leq f_{2}\left(C_{m},Ns_{m}\right) \tag{10}\] |
を得る.ただし
| \[ f_{1}\left(C_{m},N_{m}\right)=-\log N_{m}+\left(C_{m}-1\right)\left(\log 2\pi +2\right)-\frac{1}{6} \] |
| \[ \begin{gathered} f_{2}\left(C_{m},N_{m}\right)=\left(C_{m}-1\right)\log N_{m} \\ +C_{m}\left(\log 2\pi +\frac{13}{6}-\log C_{m}\right)-\left(\log 2\pi +2\right) \end{gathered} \tag{11}\] |
ここで
| \[ \left\{ \begin{array}{l} \frac{\partial f_{1}}{\partial C_{m}}=\log 2\pi +2>0\\ \frac{\partial f_{1}}{\partial N_{m}}=-\frac{1}{N_{m}}<0 \end{array} \right. \left\{ \begin{array}{l} \frac{\partial f_{2}}{\partial C_{m}}=\log \frac{2\pi N_{m}}{C_{m}}+\frac{7}{6}>0\\ \frac{\partial f_{2}}{\partial N_{m}}=\frac{C_{m}-1}{N_{m}}>0 \end{array} \right. \] |
であるから,Cmが増加する場合は式(10)の上限値も下限値もともに増加するのでAIC(m)も増加することが予想される.
3.5 次数がモデル選択に与える影響について前節までの検討から,対象地域が同じで次数の異なるデータがある場合に,最も次数の小さいモデルが選択される可能性が大きいと予想される.一般に面積が増加する場合には人口密度は平滑化されるので,本稿のように階級の幅を固定している場合はCmが減少しAIC(m)も減少すると考えられるためである.
逆に次数の大きいモデルが選択されることはあるか,m次とm+1次を比較する場合を考えよう.
次数が3次から5次の場合,定義からm次のメッシュはm+1次のメッシュ4つで構成されている.m+1次のメッシュがすべて2つの階級aとbのみに属しているとするとm次のメッシュはそれらを4つ組み合わせて生ずる階級に属する.これらの組み合わせの数は2種類のものを4つ組み合わせる重複組み合わせ2H4=5で求められる.aとbの差が階級幅よりも十分に大きければ,これらの組み合わせはすべて異なる階級に属する(図2).

理解しやすくするため,たとえばaを人が住んでいないメッシュ(0人/ha),bを高層住宅地(200人/ha)とすると,この対象地域はm次メッシュでは0人/ha,50人/ha,100人/ha,150人/haの4階級,m+1次メッシュでは0人/ha,200人/haの2階級で構成されている.この場合は
| \[ \begin{cases} \quad\text{AIC}\left(m\right)\sim 9.44\\ \text{AIC}\left(m+1\right)\sim 5.19 \end{cases} \tag{12}\] |
であり,次数の大きなm+1次メッシュが選択される4).
すなわち,次数が小さいメッシュが選択される場合と同様に次数が大きいメッシュが選択される場合が具体的な例として示された.それは,m+1次のメッシュが属する階級の数が少なく,それらの組み合わせとなるm次のメッシュが属する階級の数が多い場合であることが示唆される.
理論的な検討を実証するため,ここではケーススタディとして千葉県の市町村を取りあげる.「千葉県は日本の縮図(熊谷,2023)」といわれるように,わが国の都市圏である首都圏の一部を構成し,人口密度が極めて高い地域とそれに準ずる都市部から郊外部までのすべてを含んでいるためである.地理的に見ても関東平野の起伏が比較的緩やかな市街地のみならず,沿岸部の漁村から中山間地域の山村までバラエティに富んでいる.わが国の状況を的確に捉えることができる事例と言える.
4.2 AICによるモデル選択3次から5次を対象としているので地域メッシュ統計の定義から
| \[ 16N_{3}=4N_{4}=4N_{5} \quad A_{3}=4A_{4}=16A_{5} \tag{13}\] |
| \[ P_{3,k}=\sum _{i=4k-3}^{4k}P_{4,i}\quad P_{4,k}=\sum _{i=4k-3}^{4k}P_{5,i} \tag{14}\] |
| \[ \rho _{m,k}=\frac{P_{m,k}}{A_{m,k}}\quad 3\leq m\leq 5,~ 1\leq k\leq N_{m} \tag{15}\] |
である.したがって,次式を得る.
| \[ \begin{gathered} \text{AIC}\left(m\right)=2N_{m}-2\sum _{i=1}^{N_{m}}\log i+2\sum _{c=1}^{C_{m}}\sum _{i=1}^{n_{m}\left(c\right)}\log i \\ -2\sum _{c=1}^{C_{m}}n_{m}\left(c\right)\log n_{m}\left(c\right)+2\left(c_{m}-1\right) \end{gathered} \tag{16}\] |
千葉県の全ての市町村についてAIC(3)からAIC(5)を計算し,市町村の人口及び面積とともにまとめた(紙面の制約により表2に市だけを抜粋したものを示す).千葉県では全ての市町村で3次メッシュが選択された.3.5節において,理論的検討による「次数の小さいモデルが選択される」という予想と実例による「次数が大きいモデルが選択される」場合の両方が示されたが,千葉県の基礎自治体はすべて前者であり,理論的検討に基づく予想が当てはまる場合は多いことが示唆された.
例として柏市を過不足なく被覆する地域の3次から5次メッシュによる人口密度分布図(図3)を示す.人口密度の極大値を示す場所は他の次数と概ね一致するなど,対象地域の人口分布を概観するという目的は3次メッシュにより十分に果たされていると考える.

また表2から同じ市町村であればCmが大きいとAIC(m)も大きいことも読み取れる.前章の予想は裏付けられたと言える.
一方で20人/ha未満の階級の度数が卓越する市町村が3次から5次の全てで多いなど,次数が異なっていても同じような傾向を持つことが明らかとなった(図4).以後,この階級の度数が当該市町村の度数全体に占める割合を20人/ha率と呼ぶことにし,見通しを良くするため3次メッシュに絞って議論を続ける.

C3と20人/ha率を比較すると強い負の相関が見て取れる(図5).20人/ha率が高いのは他の階級のメッシュが少ないことの裏返しである.当然の結果であろう.

次に20人/ha率とDID面積率を見てみよう(図6).総務省統計局「人口集中地区に関するQ&A(回答)」5)によると,DIDの定義における人口密度の基準は上述通り40人/haであるが,それだけでなく連たん性や都市的施設を面積から除外するなどの条件が加えられている.人口密度の高い地区を直接代表する指標ではなく,都市的地域を示す指標として作成されているからである.したがって20人/ha率とDID面積率は必ずしも相補的な関係にあるわけではない.しかし実態としてここでも強い負の相関が示された.

したがってC3とDID面積率も相関を持つことが示唆される.実際に見てみると(図7),正の強い相関を持つことが示されている.

4次および5次メッシュの場合も同様の傾向を持つことを考え合わせると,市町村全体を概観する場合にはほかの指標の値に関わらず,DID面積率の大小により次数を選択することが,度数分布表を作成しAICを計算して値の大小を比較するという精緻ではあるが煩瑣な作業の代わりとなり得ることが示唆される.
本稿は都市計画の実務者が予見に捉われることなく,所管する地域全体の人口分布を概観する際のデータ選択についてとりあげ,モデル選択の指標としてAICを適用する場合の計算方法と性質について検討した.千葉県の市町村を事例に検討した結果,すべての自治体で3次メッシュが選択されたとともにAICによる精緻な議論のかわりにDID面積率が簡便な指標となり得る可能性が示された.これには自治体が所管する地域全体を概観するという目的と,都市計画業務を想定して度数分布表の下限と階級を固定していることが強く影響していると考えられる.たとえば階級数が増加するのは結果として人口密度の最大値が大きくなる場合である.逆に20人/ ha未満の階級の度数が圧倒的な市町村が多いなど,人口密度が低いメッシュの影響も極めて大きいことも示された.
今後の課題として,階級の下限と幅を次数に応じて柔軟に変える場合,都市計画区域外などの20人/ haのメッシュが圧倒的に多いと想定される場所を除いて都市計画区域のみや市街化区域のみに対象を限定する場合などの検討が必要であろう.
また本稿で考慮したのは人口密度のみである.他の属性,あるいは,連たん性や集塊性などの位置・形状を考慮する場合の検討なども望まれる.
本論文に有益な示唆を賜りました匿名の査読者に感謝申し上げます.
1) 総務省統計局(発行年不明)地域メッシュ統計について〈https://www.stat.go.jp/data/mesh/m_tuite.html〉(閲覧日:2025年8月9日)
2) メッシュの人口密度の度数分布は住民の居住地の地理的分布によって定まる.したがって多項分布とみなすことが適切ではない場合もありうる.しかし,本稿では対象地区の情報が十分に得られていない.また度数分布表に関する検討で多項分布を仮定するのは一般的である.
3) 総務省(発行年不明)「人口集中地区とは」〈https://www.stat.go.jp/data/chiri/1-1.html)(閲覧日:2025年8月9日),国土交通省都市局都市計画課(2022),東京都都市整備局(2022)を参考にした.
4) m次メッシュ相互の位置関係やm次メッシュ内でのm+1次メッシュの配置はモデルの選択に影響を与えないことに留意されたい.図2は単なる例示であり,bの配置が鍵型になっていることに特段の意図は無い.また,階級についても図2から例示できるもののみとした.
5) 総務省統計局(発行年不明)人口集中地区に関するQ&A(回答)〈https://www.stat.go.jp/data/chiri/qa/qa-1.html〉(閲覧日:2025年8月9日)
6) 総務省統計局「国勢調査/都道府県・市区町村別の主な結果/都道府県・市区町村別の主な結果」〈https://www.e-stat.go.jp/stat-search/files?statinfid=000032143614〉,国土交通省国土地理院(2023)「全国都道府県市区町村別面積調」を利用した.
7) MAICEを与えるAICを赤太字で示した.