応用統計学

特集：学力試験データの統計解析

項目反応理論を利用した項目関連構造分析

橋本貴充

2011 年40 巻3 号 p. 125-140
発行日: 2011年
公開日: 2012/03/26

DOIhttps://doi.org/10.5023/jappstat.40.125

ジャーナルオープンアクセス

抄録を表示する抄録を非表示にする

テストの項目の依存関係を調べるために，竹谷 (1980) の項目関連構造（IRS）分析がしばしば用いられる．IRS分析では，ある項目に誤答し別の項目に正答した受検者の数を，二項目が独立な場合の期待度数と比較して，項目間の順序関係の有無を検討している．しかしIRS分析には，(1)依存関係の有無の閾値に明確な基準がないため，閾値によって結果の解釈が異なる，(2)独立な内容を問う二項目でも，受検者の能力を強く反映していれば依存関係が検出される可能性がある，という問題がある．本稿では，期待度数の計算にChen and Thissen (1997) の方法を利用することで，閾値を統計的に決定でき，かつ受検者の能力の影響を考慮できるIRS分析法を提案した．数値実験により提案手法と従来のIRS分析を比較した結果，提案手法は，様々な閾値の従来手法と比べて，依存関係の誤検出だけでなく，依存関係の検出漏れも少ないことがわかった．しかし，統計的に統制できるはずの誤検出の割合が十分に統制できていないことも同時に明らかになった．また，実データに適用した結果より，依存関係が多いテストでは解釈に注意が必要な結果が得られてしまう可能性が示唆された．

抄録全体を表示

PDF形式でダウンロード (695K)
Local Dependence Model in Latent Rank Theory

Kojiro Shojima

2011 年40 巻3 号 p. 141-156
発行日: 2011年
公開日: 2012/03/26

DOIhttps://doi.org/10.5023/jappstat.40.141

ジャーナルオープンアクセス

抄録を表示する抄録を非表示にする

In test data analysis, it is often important to examine the inter-item dependency structure underlying the test data. However, this structure often varies according to the academic ability level of the examinees. In this paper, a latent rank theory (LRT) model incorporating a Bayesian network model is proposed. Although the conventional LRT model is formulated under the assumption of local independence among test items, the proposed LRT model supposes local dependence among test items. The proposed model can be used to efficiently analyze the data of math and science tests in which inter-item dependency relationships among items are not negligible.

抄録全体を表示

PDF形式でダウンロード (718K)
合否判定データによる判別分析の問題点

新村秀一

2011 年40 巻3 号 p. 157-172
発行日: 2011年
公開日: 2012/03/26

DOIhttps://doi.org/10.5023/jappstat.40.157

ジャーナルオープンアクセス

抄録を表示する抄録を非表示にする

本稿では，マークセンス試験データを用いて判別分析の問題点を議論する．試験は10択100問である．正解と不正解を1/0の値に変換し，自明な線形分離可能な合否判定の2群判別の説明変数として用いる．また中間試験は9項目，期末試験は6項目の設問群の合計得点を説明変数として判別分析する．
フィッシャーの線形判別関数（LDF），二次判別関数とロジスティック回帰分析を，誤分類数最小化（MNM）基準による最適線形判別関数（改定IP-OLDF）と比較する.
100個の説明変数の判別では次の問題点が発見された．逐次変数選択法は28変数から54変数を選んだが，改定IP-OLDFは6変数から32変数で線形分離可能である．また二次判別関数は一方の群の全員が誤分類されることがある．線形分離可能な場合，ロジスティック回帰の係数の推定値は不安定になった．9変数と6変数の判別では，改定IP-OLDF では合否判定できるが，LDFと二次判別関数は合否判定できなかった．ロジスティック回帰分析は合否判定できたがロジスティック回帰係数は必ず不安定になった.

抄録全体を表示

PDF形式でダウンロード (703K)
Prologを用いたXMLパーザによる統計情報の分析と表示

大津起夫

2011 年40 巻3 号 p. 173-191
発行日: 2011年
公開日: 2012/03/26

DOIhttps://doi.org/10.5023/jappstat.40.173

ジャーナルオープンアクセス

抄録を表示する抄録を非表示にする

大学入試センター試験は，毎年約50万人の受験者が参加する大規模な試験である．事業の内容を把握し，試験の運営と内容の改善を行うためには，各種の統計情報の把握が必要になる．これらに係わるデータ分析を行うにあたっては，入力データの精査や作表などの基本的ではあるが煩雑な操作が必要になる．近年，構造化されたデータをXMLを用いた形式にて表現し交換のため利用する傾向が，教育に係わる統計の利用において増えつつある．XMLで表現されたデータの処理および有向非巡回グラフに基づく多重分割表の取り扱いに，論理型の記号処理言語(Prolog)が有用であることを示す．

抄録全体を表示

PDF形式でダウンロード (796K)
Random Forestを用いた欠測データの補完に基づく大学入試センター試験科目間得点差

石岡恒憲

2011 年40 巻3 号 p. 193-209
発行日: 2011年
公開日: 2012/03/26

DOIhttps://doi.org/10.5023/jappstat.40.193

ジャーナルオープンアクセス

抄録を表示する抄録を非表示にする

Breimanによって提案された分類や非線形回帰のための集団学習の方法の一つであるRandom Forest（RF)が，欠測を多く含む大量データに対して安定してかつ精度のよいデータ補完(imputation)を実施することを示す．本報告では，RFによるデータ補完の方法について解説し，ある年度のセンター試験の理科および社会の科目間難易比較についての応用例を示す．説明変数が全て同等もしくは同列ではなく，幾つかの説明変数がグループにまとめられ，またそのグループの中から一つが排他的に選択されるような場合には本報告の手順は有効であろう．

抄録全体を表示

PDF形式でダウンロード (804K)

J-STAGEへの登録はこちら（無料）