本論文では,1)数量化II類において馬蹄効果は存在するか.もし存在するならばどのような形に現れるか.2)馬蹄効果の影響を受けずに判別分析を行うにはどうすればよいか,という2つの問題について検討した.説明変数の相関が高い場合と低い場合を想定して,説明変数が1次元構造をもつ人工データを生成して数値的検討を行い,馬蹄効果が存在するという結果が得られたため,その影響を受けずに分析する方法として,説明変数のカテゴリーを適切なタイプの対応分析(CA)(大隅他,1994)を用いて数量化した後,線形判別分析(LDA)を行う2段階線形判別分析法を提案した.対応分析の方法としては想定した2つの場合に適すると考えられる2種類の偏正準相関分析(偏対応分析)こ基づく方法を提案したが,その他,考えられるいくつかの方法もとりあげた.人工データに数量化II類と2段階線形判別分析法を適用した結果,トレーニングデータの判別性能はサンプルサイズが小さければ数量化II類,大きければ2段階線形判別分析法が優れる.優劣の分岐点は説明変数のカテゴリー数Kに依存し,Kが大きくなるとサンプルサイズNの分岐点も大きくなった.テストデータでの判別性能はサンプルサイズによらず2段階線形判別分析法が優れる結果となり,1次元構造をもつという情報を分析に取り入れる方が判別性能が高くなることが示された.また,実際のデータ解析ではテストデータは存在しないが,0.632ブートストラップ推定を応用して判別性能を評価したところ,かなり高い精度でテストデータにおける優劣が推測できることがわかった.
抄録全体を表示