本稿では,マークセンス試験データを用いて判別分析の問題点を議論する.試験は10択100問である.正解と不正解を1/0の値に変換し,自明な線形分離可能な合否判定の2群判別の説明変数として用いる.また中間試験は9項目,期末試験は6項目の設問群の合計得点を説明変数として判別分析する.
フィッシャーの線形判別関数(LDF),二次判別関数とロジスティック回帰分析を,誤分類数最小化(MNM)基準による最適線形判別関数(改定IP-OLDF)と比較する.
100個の説明変数の判別では次の問題点が発見された.逐次変数選択法は28変数から54変数を選んだが,改定IP-OLDFは6変数から32変数で線形分離可能である.また二次判別関数は一方の群の全員が誤分類されることがある.線形分離可能な場合,ロジスティック回帰の係数の推定値は不安定になった.9変数と6変数の判別では,改定IP-OLDF では合否判定できるが,LDFと二次判別関数は合否判定できなかった.ロジスティック回帰分析は合否判定できたがロジスティック回帰係数は必ず不安定になった.
抄録全体を表示