2016 年 12 巻 1 号 p. 55-75
近年,大学入試や人事考課,学習評価などの様々な評価場面において,受験者の実践的かつ高次な能力の測定を目指すパフォーマンス評価が注目されている.パフォーマンス評価では,受験者を複数の課題に取り組ませ,その過程や成果物を複数の評価者で採点することが一般的である.しかし,このようなパフォーマンス評価では,評価の信頼性が課題や評価者の特性に強く依存する問題が指摘されてきた.この問題を解決する手法の一つとして,評価者と課題の特性を考慮して受験者の能力を推定できる項目反応モデルが多数提案され,その有効性が報告されてきた.これらの項目反応モデルでは,考慮される評価者や課題の特性がモデルごとに異なるため,評価場面の特性に合った適切なモデルを選択することが信頼性の改善において重要となる.そこで,本論文では,評価者と課題の特性を考慮した既存の項目反応モデルについて,それらの特徴を比較し整理する.さらに,その結果に基づき,評価場面の特徴に応じた適切なモデルの選択法について述べる.また,本論文では,実際のパフォーマンス評価への適用例を通して,これらの項目反応モデルが評価の信頼性改善に与える影響について評価する.