2025 年 74 巻 J-STAGE-1 号 p. 26-36
検定とは,標本から抽出したデータを基に,ある確率を使って推定した母集団の特性を,バラツキの影響を考慮して統計的に判断することをいう。差の検定では,t検定や分散分析のようなパラメトリック法では,母平均の差について評価を行い,Mann-Whitney U検定やWilcoxonの符号順位検定などのノンパラメトリック法では順位を基に二変量間の差について検定を行う。また,等分散性の検定では標準偏差などのバラツキの大きさについて検定する。差の検定の手順は,帰無仮説(H0)として「等しい」という仮説と対立仮説(H1)「異なる」という2つの仮説を設定し,各検定方法の統計量を求め,統計量が設定した有意水準を上回った場合には,帰無仮説(H0)を棄却し,対立仮説(H1)を採用するという方法がとられる(背理法)。仮説が真であることを証明するのは難しいが,仮説が正しくないことを証明するのは可能であるため,背理法を用いる。また,検定では,その検定法を適用するための前提条件があり,使い方を誤ると最良の結果が得られないため,必要な前提条件を確認したうえで実行することが求められる。本章では,各種統計手法について,理論と具体的な例題を挙げて解説する。
2つの群の分散に違いがないかを調べるのが等分散の検定である。t検定は,検定しようとする2つの群の分散に差があるとはいえないことを前提としているので,t検定に先立って等分散の検定を実施する。実施方法は,得られた2群の分散の比を取ることで等分散性を評価する(Figure 1)。同一の正規母集団から抽出したものであれば等分散の統計量F値は1.0に近い値を取る。しかし,異なる母集団から得られた場合は,F値は大きな値となる。
二つの標本の分散比を求め,F値を算出する。得られたF値と有意水準に対する各標本数から求めた自由度(df)から求めたF値を比較して,判定を行う。
もし,F検定で「等分散でない」と判定された場合は,二標本t検定ではなく,Welch法やMann-Whitney U検定で検定することになる。注意点として,等分散性の検定の前提条件として,各群が正規分布であることが挙げられる。正規性を判断するためには,一般的にデータ数が30以上必要とされる。少数のデータで正規性が確認できず,等分散の検定ができない場合には,最初からノンパラメトリック法を使用すべきという考え方がある。ただし,過去に得たデータなどから正規性が確認できている時は実施可能である。なお,正規性の検定を実施して,正規分布であることを確認することまで求められない。
2. 等分散性の検定手順a)仮説の設定
帰無仮説(H0):「2群間の分散に差はない(等分散である)」と仮定する。
対立仮説(H1):「2群間の分散に差がある(等分散ではない)」と仮定する。
b)統計量を求める
2群の分散
各群の自由度
c)判定
F ≤
F >
F分布はイギリスの統計学者ロナルド・フィッシャーが2群の分布のバラツキについて検定するために開発した分布である。2つの自由度によって形が異なる分布で,非対称の分布である。Figure 2は分子の自由度
2つのメーカーの簡易血糖測定装置の測定値のバラツキの差について検討を行ったところ次のような結果が得られた。メーカー間にバラツキの差はあるだろうか(Table 1)。
No. | A社のデータ(mg/dL) | B社のデータ(mg/dL) |
---|---|---|
1 | 183 | 180 |
2 | 180 | 179 |
3 | 180 | 178 |
4 | 184 | 177 |
5 | 182 | 180 |
6 | 185 | 176 |
7 | 176 | 182 |
8 | 181 | 180 |
9 | 181 | 175 |
10 | 186 | 179 |
11 | 179 | 178 |
12 | 184 | 182 |
13 | 178 | 181 |
n | 13 | 13 |
平均 | 181.5 | 179.0 |
SD | 2.90 | 2.16 |
分散 | 8.44 | 4.67 |
CV | 1.6 | 1.2 |
先ずFigure 3のようにグラフ化してデータ分布状況を確認する。つづいて,有意水準をp < 0.05として,検定の手順に従って進める。
a)仮説の設定
帰無仮説(H0):2つのメーカーの簡易血糖測定装置間の分散に差がない。
対立仮説(H1):2つのメーカーの簡易血糖測定装置間の分散に差がある。
b)統計量を求める
2つの群の分散は
F分布統計表の上側確率5%の値を見ると
Fの有意水準
c)判定
参考としてTable 2にMicrosoft Excelの分析ツールを使った結果についても記載する。
A社のデータ(mg/dL) | B社のデータ(mg/dL) | |
---|---|---|
平均 | 181.5 | 179.0 |
分散 | 8.44 | 4.67 |
観測数 | 13 | 13 |
自由度 | 12 | 12 |
観測された分散比 | 1.81 | |
p(F ≤ f)片側 | 0.159 | |
F 境界値 片側 | 2.69 |
F検定:2標本を使った分散の検定
表中のp(F ≤ f)片側から有意水準α = 0.05より大きな値であることから有意であるとは言えない。
2群間の検定では,独立群間の検定と関連2群間の検定があり,それぞれパラメトリック検定とノンパラメトリック検定が存在する。パラメトリック検定であるt分布を用いる検定法には,独立2群間の検定のStudentのt検定と関連2群間の検定のペアードt検定の2つがある。一方,ノンパラメトリック検定には,2つのt検定に対応したMann-Whitney検定,Wilcoxon検定がある。
1. Studentのt検定等分散と見なせる正規母集団から標本データをn1個とn2個取り出し,その平均値
適用条件として次のようなものがある。
①間隔尺度で測定されたデータ
②両群は,ともに正規分布とみなせる
(極端値を含まない)
③両群の分散は等分散である
1) Studentのt検定手順a)仮説の設定
帰無仮説(H0):「2群は同じ正規母集団から得られた標本である」と仮定する。
対立仮説(H1):「2群は同じ正規母集団から得られた標本ではない」と仮定する。
b)統計量を求める
計算方法は,下式に示すように,分子において2つの平均値の差を求め,分母ではs1とs2から合成標準偏差sを算出し,標準誤差を計算するために2群データ数にルートをかけたもので割って統計量tを求める。
c)判定
自由度(df
t値が有意水準αから求めた境界値(
等分散性の検定 例題を使ってStudentのt検定について解説する。はじめにA社とB社の度数分布図を作成し(Figure 4),正規分布から著しく乖離するようなデータがないかを確認する。等分散の検定は事前に済んでおり,2つの群に有意な差があるとは言えないことが分かっているため,前提条件はクリアしている。
a)仮説の設定
帰無仮説(H0):「2つのメーカーの簡易血糖測定装置の平均値に差がない」と仮定する。
対立仮説(H1):「2つのメーカーの簡易血糖測定装置の平均値には差がある」と仮定する。
b)統計量を求める
自由度
c)判定
有意水準
A社のデータ(mg/dL) | B社のデータ(mg/dL) | |
---|---|---|
平均 | 181.5 | 179.0 |
分散 | 8.44 | 4.67 |
観測数 | 13 | 13 |
プールされた分散 | 6.55 | |
仮説平均との差異 | 0 | |
自由度 | 24 | |
t | 2.45 | |
p(T ≤ t)片側 | 0.01 | |
t境界値 片側 | 1.71 | |
p(T ≤ t)両側 | 0.02 | |
t境界値 両側 | 2.06 |
t検定:等分散を仮定した2標本による検定
p(T ≤ t)両側よりp = 0.02から有意水準α = 0.05より大きな値であることから有意でないことが分かる。
この検定は独立2群の差を検定するときのノンパラメトリック法で,順位に注目して統計量を求める方法である。Studentのt検定のときのような適応用件を基本的に必要としない。したがって,分布が分からないときや正規分布を仮定できない場合,極端値が存在する場合,さらに測定限界以上や測定限界以下があるデータなどに対して適用する方法である。具体的事例で解説する。
1) Mann-Whitney U検定の手順a)仮説の設定
帰無仮説(H0):「2群間には差がない」と仮定する。
対立仮説(H1):「2群間に差がある」と仮定する。
b)統計量を求める
Mann-Whitney U検定では統計量Uを求める。統計量Uの求め方は,一方の群のそれぞれの点に注目して,他方の群の個々の点の大きいデータ数を数える(Figure 5)。例えば,サンプルAとサンプルBの2群があるとき,サンプルA側に着目すると,a,bより大きい値はサンプルBにはないのでaとbは0ポイントとなる。cは同順位のため,「相手側よりわずかに大きい値」と「相手側よりわずかに小さな値」を想定してその平均値をとり,0.5となる。d,eより大きい値は1つで,それぞれ1ポイントとするとMann-Whitneyの統計量Uは2.5となる。一方,サンプルB側に着目するとaは同順位であるので平均をとる。その他b~dは5ポイントずつとなるので,統計量Uは17.5となる。統計量Uを求めるときには,値の小さい方に注目するので,この例ではA側に着目する。
相手より少しだけ大きい場合と,相手より少しだけ小さい場合を想定して,その平均個数を計算する。
Aを基準とした場合 U = 0 + 0 + 0.5 + 1 + 1 = 2.5
Bを基準とした場合 U = 2.5 + 5 + 5 + 5 = 17.5
c)判定
小数例の場合(本例題)
n1 ≤ 20かつn2 ≤ 20のとき,目的の有意水準のMann-Whitney検定表よりU値の有意点を求め,その有意点よりも大きなU値のときに有意とする。
U ≤ Uα(p ≥ α)のとき帰無仮説を棄却できない。
U > Uα(p < α)のとき帰無仮説を棄却し,有意差ありと判定する。
本例題では有意水準
n1またはn2の一方が20より大きいときは,Uの分布は近似的に正規分布するため,次の式を使用して平均値と標準偏差を算出しz値を導き出す。
判定:z ≤ zα(p ≥ α)のとき,帰無仮説を棄却できない。z > zα(p < α)とき,帰無仮説を棄却し,有意差ありと判定する。
関連2群の検定は同じ個体(同じ人,同じ動物)で2つの条件を比較する方法である。すなわち,条件の違いで計測値に変化があるかどうかを検定する。例えば,投薬前後のコレステロール値の変化などで使用される(Table 4)。
No. | 投薬前のTC | 投薬後のTC | 差 | |
---|---|---|---|---|
1 | 120 | 112 | −8 | 10.9 |
2 | 230 | 202 | −28 | 278.9 |
3 | 180 | 194 | 14 | 640.1 |
4 | 165 | 160 | −5 | 39.7 |
5 | 205 | 175 | −30 | 349.7 |
6 | 197 | 180 | −17 | 32.5 |
7 | 147 | 156 | 9 | 412.1 |
8 | 178 | 154 | −24 | 161.3 |
9 | 182 | 176 | −6 | 28.1 |
10 | 167 | 149 | −18 | 44.9 |
平均 | 177.1 | 165.8 | −11.3 | 199.8 |
a)仮説の設定
帰無仮説(H0):「2群間に差がない」と仮定する。
対立仮説(H1):「2群間は差がある」と仮定する。
b)統計量を求める
各ペアの差dを求め,この平均値
tは自由度n − 1のt分布
c)判定
新しいコレステロール降下剤によるコレステロールの変化について,投薬前後の値を調査した(Table 4, Figure 6)。
投薬前後のデータについて,投薬前を一手にまとめ変化量(d)として捉える。
a)仮説の設定
帰無仮説(H0):「コレステロール値に変化はない」と仮定する。
対立仮説(H1):「コレステロール値に変化がある」
b)統計量tを求める
c)判定
有意水準
投薬前のTC | 投薬後のTC | |
---|---|---|
平均 | 177.1 | 165.8 |
分散 | 935.7 | 660.2 |
観測数 | 10 | 10 |
ピアソン相関 | 0.874 | |
仮説平均との差異 | 0 | |
自由度 | 9 | |
t | 2.40 | |
p(T ≤ t)片側 | 0.02 | |
t境界値片側 | 1.83 | |
p(T ≤ t)両側 | 0.04 | |
t境界値両側 | 2.26 |
t検定:一対の標本による平均の検定ツール
Wilcoxonの順位和検定では,個々のデータが0の値からどれだけ離れているかを符号付きで検定する。非対称分布や,差に極端な値が存在する場合には,一標本Wilcoxon 順位和検定を利用する。
1) 統計量の求め方両ペアの差dを計算する。差が0のペアを除外し,dの絶対値が小さいものから順に並べる。
その後,dの符号(+と−)によって順位を分けて符号の数が少ない方の順位を足して統計量Tとする。
2) Wilcoxonの順位和検定手順a)仮説の設定
帰無仮説(H0):「2群間に差がない」と仮定する。
対立仮説(H1):「2群間に差がある」と仮定する。
b)統計量を求める
小データの場合
データ数nがn ≤ 25のときはWilcoxonの検定表からt値がそれ以上極端となる確率pを求める。
c)判定
T ≤ Tα(p ≥ α)のとき帰無仮説(H0)を棄却できない。
T > Tα(p < α)のとき帰無仮説(H0)を棄却し,対立仮説(H1)を採用する。
大データの場合
データ数nがn > 25のとき,t分布は近似的に正規分布する。次式から平均値と標準偏差を出してz値を算出する。
投薬前のTC | 投薬後のTC | 差 | |d|の順位にもとの符号をつける |
---|---|---|---|
120 | 112 | −8 | −3 |
230 | 202 | −28 | −9 |
180 | 194 | 14 | 5 |
165 | 160 | −5 | −1 |
205 | 175 | −30 | −10 |
197 | 180 | −17 | −6 |
147 | 156 | 9 | 4 |
178 | 154 | −24 | −8 |
182 | 176 | −6 | −2 |
167 | 149 | −18 | −7 |
177.1 | 165.8 | −11.3 |
マイナス側を青矢印,プラス側を赤矢印で示す。
4番目と5番目が赤となっているので,統計量Tは9となる。
n ≤ 25なので,Wilcoxon検定表からT0.05を求める。表を見るとn = 10のとき,p < 0.05のTの有意点は8となる。統計量T = 5 + 4 = 9より帰無仮説(H0)を棄却できず,今回のデータでは,2群間に差があるとは言えない。
実験の統計分析上重要なのが分散分析である。群数が三つ以上ある場合に,群間変動と群内変動にバラツキを分解して,群間分散/群内分散の比率から群間の変動が有意に大きければ「群間に差がある」と判定する方法である。検定する際には,分散分析表(Table 7)を作成し,分散比Fと群間の自由度
変動要因 | 変動(平方和) | 自由度 | 不偏分散(平均平方) | 分散比F |
---|---|---|---|---|
群間変動 | Sb | dfb = k − 1 | Vb = Sb/dfb | F0 = Vb/Vw |
群内変動 | Sw | dfw = n − k | Vw = Sw/dfw | |
全体(総変動) | St = Sb + Sw | dft = n − 1 | Vt = St/dft |
k:群の数,n:全データ数,ni:各群のデータ数,
なぜこのような方法を取るかというと,5群の検定を二群ずつ二標本t検定(有意水準をp < 0.05に設定)を実施した場合,その組み合わせは
独立多群の検定の前提条件として「各群の分散が等しい」という条件がある。各群の分散が等しいかどうかは,Bartlett検定を用いて行う。もしBartlett検定で各群の分散が等しくないと判断されたらKruskal-Wallis検定を使う。
k:群の数,n:全データ数,ni:各群のデータ数,
例題として,白血球数(WBC)の施設間差の例について解説する。Table 8は白血球数について一つの検体をA~Eの5施設で複数回測定した結果で,Figure 8はデータの分布である。施設間に差はあるだろうか。
施設 | A | B | C | D | E |
---|---|---|---|---|---|
1 | 5.6 | 5.2 | 5.6 | 5.8 | 5.7 |
2 | 5.6 | 5.4 | 5.6 | 5.8 | 5.6 |
3 | 5.4 | 5.5 | 5.5 | 5.7 | 5.5 |
4 | 5.5 | 5.4 | 5.8 | 5.8 | 5.7 |
5 | 5.6 | 5.5 | 5.8 | 5.8 | 5.7 |
6 | 5.5 | 5.4 | 5.5 | 5.8 | 5.8 |
7 | 5.5 | 5.1 | 5.4 | 5.6 | 5.6 |
8 | 5.5 | 5.3 | 5.9 | 5.8 | 5.6 |
9 | 5.4 | 5.3 | 5.6 | 5.8 | 5.6 |
10 | 5.5 | 5.3 | 5.7 | 5.9 | 5.6 |
11 | 5.6 | 5.4 | 5.7 | 5.5 | |
12 | 5.6 | 5.2 | 5.6 | 5.5 | |
13 | 5.3 | 5.3 | 5.6 | ||
14 | 5.5 | 5.1 | 5.5 | ||
15 | 5.6 | 5.3 | 5.5 | ||
16 | 5.5 | 5.6 | |||
n | 16 | 15 | 12 | 10 | 16 |
平均 | 5.51 | 5.31 | 5.64 | 5.78 | 5.60 |
SD | 0.09 | 0.12 | 0.14 | 0.08 | 0.09 |
CV(%) | 1.6 | 2.3 | 2.6 | 1.4 | 1.6 |
赤いラインは平均値を示す。
はじめにデータを図示し,次いでBartlett検定で分散の均一性を検定する(Bartlett検定は統計用ソフトで実施する)。
2. Bartlett検定(分散の均一性の検定)原則的に分散分析は,各群の分散が等しいことを前提としているため,分散分析に先立って,分散の均一性の検定を行っておく必要がある。ただし,Bartlett検定にも前提条件があり,各群の分布が正規分布に従っている必要がある。今回の例では,Bartlett検定結果は,χ2 = 6.14,p = 0.19より,各群間の分散に有意な差があるとは言えないと判断される。よって一元配置分散分析を実行する。もし,Bartlett検定で有意な差があると判定された場合は,ノンパラメトリック法の多群間に比較法であるKruskal-Wallis検定を行う。
a)一元配置分散分析法の仮説の設定
H0:各施設の白血球数の平均値には差がない
H1:各施設の白血球数の平均値には差がある
b)統計量を求める(Table 9)
グループ | 標本数 | 合計 | 平均 | 分散 |
---|---|---|---|---|
A | 16 | 88.2 | 5.51 | 0.008 |
B | 15 | 79.7 | 5.31 | 0.016 |
C | 12 | 67.7 | 5.64 | 0.021 |
D | 10 | 57.8 | 5.78 | 0.006 |
E | 16 | 89.6 | 5.60 | 0.008 |
変動要因 | 変動 | 自由度 | 分散 | 観測された分散比 | p値 | F境界値 |
---|---|---|---|---|---|---|
グループ間 | 1.53 | 4 | 0.383 | 33.1 | 5.8−15 | 2.52 |
グループ内 | 0.74 | 64 | 0.012 | |||
合計 | 2.272 | 68 |
分散比を求める
分散比 F = 33.13(有意水準0.05(5%)の棄却域 > 2.52)
c)判定
確率 p = 5.8−15 有意水準5%より低値であるので,帰無仮説H0を棄却し,対立仮説H1を採用し,「今回のデータでは,各施設の白血球数の平均値に差がある」と判断される。
3. クラスカル・ワリス(Kruskal-Wallis)検定Kruskal-Wallis検定は,独立多群の差の検定法でノンパラメトリック手法を用いたものである。統計量Hを求める方法は,①群に関係なく全データに順位を付ける。②各群の順序値の合計(順位和Ri)を求める。③下の計算式によって統計量Hを計算する。群間に差がある場合にはHは大きな値を取り,差がない場合には小さな値(最小値は0)となる。
k = 3かつN ≤ 17のとき → Kruskal-Wallis検定表から求める。これ以外のときは,Hは近似的に自由度df = k − 1のχ2分布に従う → χ2分布表を参照する。なお,同順位は平均を割り当てる。
Table 10は,凍結乾燥タイプのコントロールの溶解方法の違いが測定結果Xに影響するかどうかを3人の技師A,B,Cで検討したものである。各自5本ずつ溶解し測定したところ,次のような結果であった。各技師間に平均値の差があるだろうか。データの分布図を見るとA技師には極端値があることがわかる(Figure 9)。また,Bartlett検定で有意な差があると判定されたことから,測定結果Xに順位を付け(Table 11),順位のグラフ化を行った(Figure 10)。
No. | A | B | C |
---|---|---|---|
1 | 106 | 104 | 102 |
2 | 100 | 103 | 100 |
3 | 98 | 105 | 101 |
4 | 97 | 107 | 103 |
5 | 96 | 106 | 102 |
平均 | 99.6 | 105 | 101.4 |
SD | 4.4 | 1.6 | 1.1 |
技師Aには,極端な値があることから一元配置分散分析は不適と考えられる。
No, | A | B | C |
---|---|---|---|
1 | 13.5 | 11.0 | 7.5 |
2 | 4.5 | 9.5 | 4.5 |
3 | 3.0 | 12.0 | 6.0 |
4 | 2.0 | 15.0 | 9.5 |
5 | 1.0 | 13.5 | 7.5 |
合計 | 24 | 61 | 35 |
a)仮説の設定
H0:測定値の配置に群間差がない。
H1:測定値の配置に群間差がある。
b)統計量Hを求める
c)有意点を求める
Kruskal Wallis 統計表から,n1 = 5;n2 = 5;n3 = 5 のときp < 0.05となる検定統計量H値の有意点は5.729である。
d)判定
統計量H = 7.3は,有意点5.729より大きいことから仮説H0を棄却し,対立仮説H1を採用し,「今回のデータでは,技師によって凍結乾燥タイプのコントロールの溶解方法の違いがある」と判断される。
統計処理全体の見通しを良くするために,検定法一覧(Table 12)と平均値と分散の検定フロー(Figure 11)を付記する。
パラメトリック検定 | ノンパラメトリック検定 | |
---|---|---|
比率などの検定 | 比率の検定 二項検定 Poisson分布による検定 |
|
関連多変数 | 比率の差の検定 McNemarのχ 2検定 |
|
独立多変数 | 2 × 2分割表(χ
2独立性の検定) l × m分割表 |
|
1標本(分布型の検定) | 尖度・歪度による正規性の検定 χ2適合度検定による正規性の検定 |
|
関連2群 | 1標本t検定 Welch法(不等分散時に使用) |
Wilcoxon検定 符号検定 |
独立2群 | 2標本t検定 正規検定 |
Mann-Whitney U検定 |
独立多標本 | 1元配置分散分析 | Kruskal-Wallis検定 |
関連多標本 | 2元配置分散分析(対応あり) 反復測定分散分析 2元配置分散分析(対応なし) |
Friedman検定 |
2変量 | Pearsonの相関係数 | Spearman順位相関係数 相関比 Cramer’s一致係数 |
本論文に関連し,開示すべきCOI 状態にある企業等はありません。