2019 年 59 巻 1 号 p. 67-78
形態情報に基づいた系群識別や雌雄判別では,各個体から得られる形態測定値を必要とする.しかし,鯨類では座礁や漂着に遭遇する機会が少なく採集捕獲にもコストがかかるため,一般に調査できる標本数が少ない傾向にある.ゆえに,形態の計測項目を増やすことで,取得する情報量を増やす解析戦略を取る場合が多いが,標本数に対して計測項目が高次元となる「小標本下での解析」では適用できる手法が限られるほか,少ない情報下での変数選択を余儀なくされる場合がある.そこで本研究では,従来の判別解析に加え,機械学習法を導入した場合の判別解析の予測精度の向上を統計的に評価し,各手法の有用性を検討した.日本周辺海域で採集された雌雄各6個体のシャチOrcinus orca頭骨から得られた18部位の形態計測データを用いた雌雄判別を行った.シミュレーションの結果,従来型の判別解析では,標本数に対し計測項目の多いデータに対応するため変数選択を行う必要が生じ,判別規則が過学習となる可能性が示唆された.一方,機械学習法の一種であるRandom forestsを用いた解析では過学習となる可能性が低く,小標本の場合であっても高次元情報を生かした判別規則の導出が可能であることが示された.また,実データに適用した結果ではおよそ75%の予測正答率でシャチ頭骨の雌雄を判別できた.