2023 年 53 巻 1 号 p. 91-110
標本サイズに対して共変量の数が比較的大きな場合,Lassoのようなスパース正則化法は標準的な解析手法の1つとなっている.ところが,共変量が標本サイズより指数的に大きな超高次元データに対しては,パラメータの推定精度や計算負荷の観点から,スパース正則化法を直接適用するよりも,あらかじめ重要な変数をスクリーニングすることが有効である場合が多い.本稿では,そのような超高次元データに対するスクリーニング手法の1つを提案する.具体的には,まず,共変量の成分ごとにモデルを当てはめる周辺回帰モデルに対して,回帰係数をスパースに推定するためのLasso型の罰則を付加した正則化法が,共分散に基づくスクリーニング手法と等価であることを述べる.次に,この方法が高い確率でターゲットとなるモデルを含むという性質を持つことを示す.さらに,正則化法の調整パラメータを選択するために,仮説検定に基づく方法を考え,そのときに選択されるモデルがそれほど大きくはならないことを説明する.最後に,いくつかの数値実験と実データへの適用例について述べる.