計算機統計学
Online ISSN : 2189-9789
Print ISSN : 0914-8930
ISSN-L : 0914-8930
2変量正規乱数データによるIP-OLDFの評価
新村 秀一垂水 共之
著者情報
ジャーナル フリー

2000 年 12 巻 2 号 p. 107-123

詳細
抄録

本論文では, 整数計画法(IP)を用いて, 標本誤分類数(率)を最小化する最適線形判別関数(IP-OLDF)を導出し, さらに, この定式化を少し変えることで, 誤分類されたケースの判別境界点からの距離の和を最小化するLP線形判別法を開発した.誤分類数を最小化する基準は, これまでの確率分布を前提に多くの成果を得てきた統計理論になじまない危惧がある.しかし, 本手法では, 誤分類数が標本に対し一意に決まり, 打ち切り基準を用いない変数増加法(上昇基本系列という事にする)で誤分類数は単調減少するという優れた特徴をもっている.さらに, 本手法は正規分布のような特定の分布を仮定していないので, 多くのダーティな現実データの判別に適していると期待できる.これまで, フィッシャーのアイリスデータと医学データを用いて, これらをFisherの線形判別関数(線形判別関数)と2次判別関数とで比較評価を行った.今回は, 標準サイズ100の2変数の正規乱数データを4組作成した.うち2組を内部標本(G1, G2)とし, 残り2組をそれらに対応する外部標本(G3, G4)とした.さらに, G1とG3群を0度, 30度, 45度, 60度, 90度回転させ, G2群とG4群は23組の整数値をこの2変数に加え平行移動した.この回転と平行移動の組み合わせで得られる115組(=5×23)の内部標本(G1, G2)に対して, IP-OLDF, LP線形判別関数, 線形判別関数と2次判別関数を求め, 得られた判別式を外部標本(G3, G4)に適用しExternal Checkを行った.これらの結果を, 誤分類数としてまとめ, 平均値の差の検定と回帰分析で各種判別手法の比較評価を行った.誤分類数の平均値の大小順は, 内部標本ではIP-OLDF, 2次判別関数, 線形判別関数, LP線形判別関数の順に大きくなった.外部標本では, 2次判別関数, IP-OLDF, 線形判別関数, LP線形判別関数の順になった.平均値の差の検定から, 外部標本のIP-OLDFと線形判別関数のみ差がないことが分かった.相関係数は, いずれも0.967以上と高かった.医学データと異なり2次判別関数による誤分類数も, IP-OLDFで良く回帰できた.また各判別手法の誤分類数をIP-OLDFで回帰した回帰直線を比較しても, 差の検定と同じ結果になった.層別箱ひげ図で検討すると, 回転の影響より, 平行移動の影響が強いことが分かった.以上から, IP-OLDFは現実のデータでも乱数データでも, 従来の判別関数に劣らない結果を得た.LP線形判別関数は, 計算時間が少ないことから, IP-OLDFを補完するものと期待したが, 判別関数として利用するには不適切である事が分かった.

著者関連情報
© 2000 日本計算機統計学会
前の記事 次の記事
feedback
Top