カイ二乗検定
カイ二乗検定(カイにじょうけんてい、カイじじょうけんてい、英語:Chi-square test)、または<math>\chi ^2</math>検定とは、帰無仮説が正しければ検定統計量がカイ二乗分布に従うような統計学的検定法の総称である。次のようなものが含まれる。
- ピアソンのカイ二乗検定:カイ二乗検定として最もよく利用されるものである(本項で述べる)。
- 一部の尤度比検定:標本サイズが大きい場合には近似的にカイ二乗検定となる場合がある。
- イェイツのカイ二乗検定(イェイツの修正)
- マンテル・ヘンツェルのカイ二乗検定
- 累積カイ二乗検定
- Linear-by-linear連関カイ二乗検定
これらはいずれも
- <math>\chi^2=\sum\frac{(\mathrm{observed}-\mathrm{expected})^2}{\mathrm{expected}},</math>
(ここで"expected" という語は期待値そのものではなく観測値から求められる期待値の推定量あるいは理論値を指すことが多い)
という形の統計量「カイ二乗(χ2)」を含む。
ピアソンのカイ二乗検定
ピアソンのカイ二乗検定(Pearson's chi-square test)は、カイ二乗検定のうち最も基本的かつ広く用いられる方法であって、「観察された事象の相対的頻度がある頻度分布に従う」という帰無仮説を検定するものである。この頻度分布は特定のものに限らない。すなわちこの方法はノンパラメトリック検定である。
事象は互いに排他的でなければならない(例えば「さいころの目」、「ある人が男か女か」など)。カイ二乗は各頻度の観測値と理論値の差を2乗し、各頻度の理論値で割って、合計したもの:
- <math> \chi^2 = \sum {(O - E)^2 \over E}</math>
である。ただしここでO = 頻度の観測値,E = 帰無仮説から導かれる頻度の期待値(理論値)である。
ピアソンのカイ二乗検定は2つのタイプの比較、適合度検定及び独立性検定に用いられる:
- 適合度検定
- 観測された頻度分布が理論分布と同じかどうかを検定する。例えば簡単な例として、標本として100人の人がいる場合に、「男と女が同数だけいる集団から、ランダムに抽出された100人である」という仮説を検定するには、男女の人数の観測値と理論値(50:50)とを比較すればよい。観測値が男45人、女55人ならば、
- <math> \chi^2 = {(45 - 50)^2 \over 50} + {(55 - 50)^2 \over 50} = 1</math>
- この場合の自由度は1である(2つの観測値と理論値の差は、一方を決めると他方も自動的に決まるから)。そこで自由度1のカイ二乗分布を見ると、男女の人数が等しい場合にこのような差(及び女がさらに多くなるような場合)が見出される確率は、おおよそ0.32である。この確率は普通用いる統計学的有意水準(0.05、0.01など)よりも高いから、「男女の人数が等しい」とする帰無仮説を棄却する理由がない。
- 独立性検定:
- 2つの変数に対する2つの観察(2x2分割表で表される)が互いに独立かどうかを検定する。例えば、「別の地域の人々について、選挙である候補を支持する頻度が違う」かどうかを検定する方法である。
カイ二乗の計算値は、確率分布が二項分布あるいは正規分布に従う集団に関しては正確にカイ二乗分布に従う。
期待値が二項分布:
- <math> E =^d \mbox{Bin}(n,p) </math>
(ただしここで、p = 帰無仮説の下での確率,n = 標本の観測値) に従う場合、カイ二乗は自由度1のカイ二乗分布に従う。なおこの二項分布は標本数が大きい場合には次のような正規分布で近似できる:
- <math> \mbox{Bin}(n,p) \approx^d \mbox{N}(np, np(1-p)) </math>
標準正規分布に従う<math>k</math>個の変数<math>Z</math>から、各二乗の合計を求めると、自由度<math>k</math>のカイ二乗分布:
- <math> \sum_{i=1}^k Z^2_i =^d \chi^2_k </math>
に従う。
しかし一般の頻度分布でもカイ二乗は「近似的には」カイ二乗分布に従うので、カイ二乗検定が適用可能である。期待値Eが小さい(標本数が小さい、または観測数が少ない)場合は、二項分布を正規分布ではうまく近似できないため、この場合には尤度比検定の1つであるG検定を用いるのがより適切である。全標本数が小さい場合は、二項検定、さらに2x2分割表で表される場合にはフィッシャーの正確確率検定を用いる必要がある。