2019 年 34 巻 3 号 p. 159-164
教育においてデータを活用して教育施策に活用する動きが近年盛んになっており,多くの教育に関するデータが雑誌や本,WEB上で公開されている.本研究では大学入試に関するデータを用いた大学の入試難易度序列の決定手法を提案する.各高校の公開している大学合格実績データは高校の実力と大学入試の難易度に依存する系統的な欠損である.この系統的な欠損は高校がターゲットとする大学のみ合格率が高い性質を持つ.ここで,高校からの合格率の高い大学の入試難易度が似ていると考えると,合格率の高い部分にのみ注目することで系統的な欠損のあるデータで入試難易度を比較できる.この点から,距離を用いた並び替え手法,合格率を用いた並び替え手法,レイティングを用いた序列決定手法の3つの手法を作成した.得られた序列を塾が公開する偏差値による序列との順位相関で評価した結果,各手法での順位相関は0.83,0.85,0.89という値になった.今後は精度向上を目指して,同じ順位に分類された大学の更なる序列付けをする手法を検討していく.