抄録
1 はじめに
本研究では,斉藤ほか(2006)で有効性が実証された,データマイニングの一つであるDecision tree を用いた,地すべり発生流域推定モデルの可搬性について検討を行った.
2 解析手法
対象地域は赤石山脈であり,EOS-Terra/ASTER の連続する2 シーンでほぼカバーされる.2 シーンには赤石山脈の南側と北側がそれぞれ含まれる.斉藤ほか(2006)では,南側シーンを用いて地すべり発生流域推定モデル(以下,「モデル」と表記)を構築し,10-fold cross validation(Witten and Frank,2005,以下「X-val」と表記)による正解率71% を得ている.本研究では,南側シーンで構築したモデルを北側シーンに適用して地すべり発生流域を推定することで,モデルの可搬性について検討を行う.また,北側シーンで構築したモデルを南側シーンに適用することも試みる.
使用したのは,ASTER 画像より得られる数値標高モデルと地質データ,及び既存の地すべり地データである.斉藤ほか(2006)と同様の手法で,流域を単位としてDecision tree によるモデルを構築した.ここで,説明変数は数値標高モデルより算出される地形量(標高,傾斜,Profile Curvature,PlanCurvature,浸食高,未浸食高)と地質データである.また,流域面積に占める地すべり地の面積が5% 以上の流域を地すべり発生流域と定義し,目的変数及び学習/検証データを地すべり発生流域か否かとした.
3 結果
南側シーンで構築したモデル(斉藤ほか, 2006)を用いて北側シーンの地すべり発生流域を推定したところ,正解率41% が得られた.
4 考察
得られた正解率は41% と低い.しかし,南側シーンはほぼ全域が赤石山脈であるのに対し,北側シーンには赤石山脈のほかに甲府盆地や八ヶ岳といった地域も存在している.また北側シーンの推定結果では,主に北東の地域が過抽出(OverEstimated)となっている.この地域は甲府盆地及び八ヶ岳と対応する.つまり,南側シーンににはほとんど存在しない沖積地や火山の地域が正確に推定できていないと考えられる.よって,これらの地域を除外し,赤石山脈の流域のみに南側シーンのモデルを適用した.結果,正解率62% が得られた.
一方で,北側シーンを用いてモデルの構築を行ったところ,X-val による正解率81% が得られた.このモデルを用いて南側シーンの地すべり発生流域を推定したところ正解率60% が得られた.このように赤石山脈の南側と北側のシーンを用いて,互いにモデルの構築と検証を行った結果,どちらも正解率60% 以上を得ることができた.つまり,推定する地域の代表的な地形や地質が含まれる一部の地域でモデルを構築することにより,全体を推定できるモデルが構築できると考えられる.
また,Decision tree は推定過程がtree 構造として明示される特徴を持つ.モデルのtree 構造からは,地すべりが主に第三紀の地質に分布することや,地すべりが頻発する地域は緩やかで小起伏な斜面であるといった,従来から指摘されてきた地すべり地と地質・地形との関係が示された.
データマイニングの一つであるDecision tree を用いることで,赤石山脈における地すべり発生流域を推定するための有用なモデルを構築することができた.またDecision tree は明示的なモデルを構築することが可能であり,地すべり未対策地の予察的な調査に有効な手段であると考えられる.
文献一覧
斉藤 仁・中山大地・松山 洋2006. データマイニングによる地すべり流域の推定とその検証–ASTER データを用いて–. 日本地理学会発表要旨集69:97.
Witten, I. H., and Frank, E. 2005. Data mining – practicalmachine learning tools and techniques, second edition.Oxford:Elsevier.