中心極限定理
テンプレート:出典の明記 中心極限定理(ちゅうしんきょくげんていり、テンプレート:Lang-en-short)は、確率論・統計学における極限定理の一つで、次のように表現される。
大数の法則によると、ある母集団から無作為抽出された標本平均はサンプルのサイズを大きくすると真の平均に近づく。これに対し中心極限定理は標本平均と真の平均との誤差を論ずるものである。多くの場合、母集団の分布がどんな分布であっても、その誤差はサンプルのサイズを大きくしたとき近似的に正規分布に従う。
なお、標本の分布に分散が存在しないときには、極限が正規分布と異なる場合もある。
統計学における基本定理であり、例えば世論調査における必要サンプルのサイズの算出等に用いられる。
定理
期待値 μ, 分散 σ2 の独立同分布 ("i.i.d.") 確率変数 ("r.v.") 列 X1, X2, ... に対し、
- <math>S_n := \sum_{k = 1}^n X_k </math>
とすると、
- <math>P \Big( \frac{ S_n - n \mu }{ \sqrt{n}\sigma } \leqq \alpha \Big) \to \frac{1}{\sqrt{2 \pi }} \int_{-\infty }^{\alpha } e^{- \frac{x^2}{2}} dx </math>
つまり、i.i.d. r.v. 列の和を修正すると、期待値 0, 分散 1 の正規分布 N(0, 1) に分布収束する。
従って、n が十分大きいとき近似的に、標本平均 <math>[X_n]</math> と真の平均 μ との誤差 <math>[X_n]-\mu</math> をルートn倍したものは,平均 0, 分散 σ2/n の正規分布 N(0, σ2/n) に従う。
正規分布に収束しないケース
より一般化された確率理論(コルモゴロフの公理)では、中心極限定理は弱収束理論 (weak-convergence theories) の一部となる。それによると、独立で同一の確率分布(i.i.d.)にしたがう確率変数の分散が有限な場合は「確率変数の和の確率分布」は変数の数が多くなるにしたがい正規分布に収束し(古典的な中心極限定理が成り立つ)が、確率変数がしたがう分布の裾が |x|−α−1 ( ただし、0 < α < 2)のべき乗で減衰する場合(分布の裾が厚くなり分散は無限大に発散して)(正規分布には収束せず)特性指数α の安定分布に収束する。[1]
※なお安定分布は特性指数が 0 < α < 2 のとき分散は無限大となり、分布の裾が冪乗則にしたがうファットテールを有する。