カイ二乗検定のソースを表示
←
カイ二乗検定
移動先:
案内
、
検索
あなたには「このページの編集」を行う権限がありません。理由は以下の通りです:
要求した操作を行うことは許可されていません。
このページのソースの閲覧やコピーができます。
'''カイ二乗検定'''(カイにじょうけんてい、カイじじょうけんてい、[[英語]]:Chi-square test)、または'''<math>\chi ^2</math>検定'''とは、[[帰無仮説]]が正しければ検定統計量が[[カイ二乗分布]]に従うような[[統計学]]的検定法の総称である。次のようなものが含まれる。 * '''ピアソンのカイ二乗検定''':カイ二乗検定として最もよく利用されるものである(本項で述べる)。 * 一部の[[尤度比検定]]:[[標本 (統計学)|標本]]サイズが大きい場合には近似的にカイ二乗検定となる場合がある。 * [[イェイツのカイ二乗検定]](イェイツの修正) * [[マンテル・ヘンツェルのカイ二乗検定]] * [[累積カイ二乗検定]] * [[Linear-by-linear連関カイ二乗検定]] これらはいずれも :<math>\chi^2=\sum\frac{(\mathrm{observed}-\mathrm{expected})^2}{\mathrm{expected}},</math> (ここで"expected" という語は[[期待値]]そのものではなく観測値から求められる期待値の推定量あるいは理論値を指すことが多い) という形の統計量「カイ二乗(χ<Sup>2</Sup>)」を含む。 ==ピアソンのカイ二乗検定== '''ピアソンのカイ二乗検定'''(Pearson's chi-square test)は、カイ二乗検定のうち最も基本的かつ広く用いられる方法であって、「観察された事象の相対的頻度がある頻度分布に従う」という帰無仮説を検定するものである。この頻度分布は特定のものに限らない。すなわちこの方法は[[ノンパラメトリック検定]]である。 事象は互いに排他的でなければならない(例えば「さいころの目」、「ある人が男か女か」など)。カイ二乗は各頻度の観測値と理論値の差を2乗し、各頻度の理論値で割って、合計したもの: :<math> \chi^2 = \sum {(O - E)^2 \over E}</math> である。ただしここで''O'' = 頻度の観測値,''E'' = 帰無仮説から導かれる頻度の期待値(理論値)である。 ピアソンのカイ二乗検定は2つのタイプの比較、'''適合度検定'''及び'''独立性検定'''に用いられる: ;適合度検定 :観測された頻度分布が理論分布と同じかどうかを検定する。例えば簡単な例として、標本として100人の人がいる場合に、「男と女が'''同数だけいる集団から、ランダムに'''抽出された100人である」という仮説を検定するには、男女の人数の観測値と理論値(50:50)とを比較すればよい。観測値が男45人、女55人ならば、 :<math> \chi^2 = {(45 - 50)^2 \over 50} + {(55 - 50)^2 \over 50} = 1</math> :この場合の[[自由度]]は1である(2つの観測値と理論値の差は、一方を決めると他方も自動的に決まるから)。そこで自由度1のカイ二乗分布を見ると、男女の人数が等しい場合にこのような差(及び女がさらに多くなるような場合)が見出される[[確率]]は、おおよそ0.32である。この確率は普通用いる統計学的有意水準(0.05、0.01など)よりも高いから、「男女の人数が等しい」とする帰無仮説を棄却する理由がない。 ;独立性検定: :2つの変数に対する2つの観察(2x2分割表で表される)が互いに独立かどうかを検定する。例えば、「別の地域の人々について、選挙である候補を支持する頻度が違う」かどうかを検定する方法である。 カイ二乗の計算値は、確率分布が[[二項分布]]あるいは[[正規分布]]に従う集団に関しては正確にカイ二乗分布に従う。 期待値が二項分布: :<math> E =^d \mbox{Bin}(n,p) </math> (ただしここで、''p'' = 帰無仮説の下での確率,''n'' = 標本の観測値) に従う場合、カイ二乗は自由度1のカイ二乗分布に従う。なおこの二項分布は標本数が大きい場合には次のような[[正規分布]]で近似できる: :<math> \mbox{Bin}(n,p) \approx^d \mbox{N}(np, np(1-p)) </math> 標準正規分布に従う<math>k</math>個の変数<math>Z</math>から、各二乗の合計を求めると、自由度<math>k</math>のカイ二乗分布: :<math> \sum_{i=1}^k Z^2_i =^d \chi^2_k </math> に従う。 しかし一般の頻度分布でもカイ二乗は「近似的には」カイ二乗分布に従うので、カイ二乗検定が適用可能である。期待値Eが小さい(標本数が小さい、または観測数が少ない)場合は、二項分布を正規分布ではうまく近似できないため、この場合には[[尤度比検定]]の1つである[[G検定]]を用いるのがより適切である。全標本数が小さい場合は、[[二項検定]]、さらに2x2分割表で表される場合には[[フィッシャーの正確確率検定]]を用いる必要がある。 ==関連項目== * [[推計統計学]] {{DEFAULTSORT:かいししようけんてい}} [[Category:統計検定]] [[Category:数学に関する記事]]
カイ二乗検定
に戻る。
案内メニュー
個人用ツール
ログイン
名前空間
ページ
議論
変種
表示
閲覧
ソースを表示
履歴表示
その他
検索
案内
メインページ
コミュニティ・ポータル
最近の出来事
新しいページ
最近の更新
おまかせ表示
sandbox
commonsupload
ヘルプ
ヘルプ
井戸端
notice
bugreportspage
sitesupport
ウィキペディアに関するお問い合わせ
ツール
リンク元
関連ページの更新状況
特別ページ
ページ情報