回帰診断においては,回帰分析の結果に及ぼす個々の観測値の影響力を調べること(single-case)が基本であるが,複数個の観測値が同時に及ほす影響力を調べること(multiple-case)も重要な問題である.代表的な診断統計量であるCookの距離は,single-caseのとき,てこ比および残差の関数として表現されるので,影響の原因をてこ比および残差との関係で捉えることができる.しかし,multiple-caseのCookの距離は,てこ比や残差だけの関数として表現することはできないので,これらの関係は明確ではない.本論文では,multiple-caseで用いられるCookの距離が,残差の意味での外れ値をどの程度うまく検出するのかという観点から,その性質について調べる.特に2つの観測値のサブセットの診断を例に,その検出力の性質について検討する.さらに,multiple-caseにおけるスチューデント化残差に基づく通常の外れ値の検定統計量と比較し,それらの違いを明らかにし,Cookの距離の挙動が不安定であることを示し,その不安定性の原因についても,具体的なデータ例を基に検討する.
抄録全体を表示