応用統計学
Online ISSN : 1883-8081
Print ISSN : 0285-0370
ISSN-L : 0285-0370
特集:学力試験データの統計解析
Random Forestを用いた欠測データの補完に基づく大学入試センター試験科目間得点差
石岡 恒憲
著者情報
ジャーナル オープンアクセス

2011 年 40 巻 3 号 p. 193-209

詳細
抄録
Breimanによって提案された分類や非線形回帰のための集団学習の方法の一つであるRandom Forest(RF)が,欠測を多く含む大量データに対して安定してかつ精度のよいデータ補完(imputation)を実施することを示す.本報告では,RFによるデータ補完の方法について解説し,ある年度のセンター試験の理科および社会の科目間難易比較についての応用例を示す.説明変数が全て同等もしくは同列ではなく,幾つかの説明変数がグループにまとめられ,またそのグループの中から一つが排他的に選択されるような場合には本報告の手順は有効であろう.
著者関連情報
© 2011 応用統計学会
前の記事
feedback
Top