尤度関数
尤度関数(ゆうどかんすう)とは統計学用語で、ある前提条件に従って結果が出現する場合に、逆に観察結果からみて前提条件が「何々であった」と推測する尤もらしさ(もっともらしさ)を表す数値を、「何々」を変数とする関数として捉えたものである。また単に尤度ともいう。
概要
B = b であることが確定している場合に、 A が起きる確率(条件付確率)を
- <math>P(A \mid B=b)</math>
とする。このとき、逆に A が観察で確認されていることを基にして、上記の条件付確率を変数 b の関数として尤度関数という。また一般には、それに比例する関数からなる同値類
- <math>L(b \mid A) = \alpha \; P(A \mid B=b)</math>
(ここで<math>\alpha</math>は任意の正の比例定数)をも尤度関数という。重要なのは数値<math>L(b | A)</math>自体ではなく、むしろ比例定数を含まない比<math>\frac{L(b_2 | A)}{L(b_1 | A)}</math>(尤度比)である。もし<math>\frac{L(b_2 | A)}{L(b_1 | A)} > 1</math>ならば、<math>b_1</math>と考えるよりも<math>b_2</math>と考えるほうが尤もらしい、ということになる。 <math>B</math>が与えられた場合には、それから<math>A</math>について推論するのには条件付確率<math>P(A | B)</math>を用いる。 逆に、<math>A</math>が与えられた場合に、それから<math>B</math>について推論するのには条件付確率<math>P(B | A)</math>(事後確率)を用いるが、これは尤度関数である<math>P(A | B)</math>あるいは<math>\frac{P(A | B)}{P(A)}</math>から、次のベイズの定理によって求められる:
- <math>P(B \mid A) = \frac{P(A \mid B)\;P(B)}{P(A)}</math>
ただし、尤度関数は後に示すように確率密度関数とは別の概念である。
簡単な例
コインを投げるときに、表が出る('H')確率が pH であれば、2回の試行で2回とも表が出る('HH')確率は pH2 である。 pH = 0.5 であれば、2回とも表が出る確率は0.25である。このことを次のように示す:
- <math>P(\mbox{HH} \mid p_H = 0.5) = 0.25</math>
これのもう1つの言い方として、「観察結果が'HH'ならば pH = 0.5 の尤度は 0.25である」、つまり
- <math>L(p_H=0.5 \mid \mbox{HH}) = P(\mbox{HH}\mid p_H=0.5) =0.25</math>.
と言える。一般には
- <math> L(p_H=x \mid \mbox{HH}) = P(\mbox{HH}\mid p_H=x) = x^2</math>
と書ける。 しかしこれを、「観察値が0.25ならば、1回投げて表の出る確率は pH = 0.5」という意味にとってはならない。 極端な場合を例にとると、「観察結果が'HH'ならば pH = 1 の尤度は1」とはいえる。しかし明らかに、観察値が1だからといって表の出る確率 pH = 1 ということはない。'HH'という事象は pH の値が0より大きく1以下のいくつであっても起こりうるのだ。 <math>L(p_H=x \mid \mbox{HH})</math>の値はxが1に近づくほど大きくなる(しかし現実にはpH はおよそ0.5である場合が多い)。観察はたった2回の試行に基づくもので、それからとりあえず「pH = 1 が尤もらしい」といっているにすぎない。 また尤度関数は確率密度関数ではなく、積分しても一般に1にはならない。上の例では pH に関する[0, 1]区間の尤度関数の積分は1/3で、これからも尤度密度関数を pH に対する確率密度関数としては解釈できないことがわかる。
母数を含むモデルの尤度関数
統計学では標本の観察結果から母集団の分布を表現する母数(パラメータ)を求めることが重要であるが、母集団の母数がある特定の値であることを前提条件として観察結果が得られると考え、統計学の問題に尤度の概念を適用できる。尤度関数は特に最尤法、尤度比検定で重要な意味を持ち、尤度を最大にするという原理により多くの統計学的推定法が導かれる。 次のような母数を含む確率密度関数族を考える:
- <math>f(x\mid\theta)</math>
ここで x が確率変数、 θ が母数である。尤度関数は
- <math>L(\theta \mid x)=f(x\mid\theta)</math>
ここで x は実験の観察値である。θ を定数として、 f(x | θ) を x の関数として見たときには、これは確率密度関数であり、逆に x を定数として θ の関数として見たときには、尤度関数である。 この場合も尤度を、観察標本が与えられたときに「この母数が正しい」という確率と混同してはいけない。観察結果はあくまでも少数の標本にすぎず、仮説の尤度を仮説の確率として解釈するのは危険である。
歴史
尤度に関する初期の考察はデンマークの数学者トルバルド・ティエレ(Thorvald N. Thiele)による1889年の著書にみられる。 尤度についての完全な考察が現れた最初の論文は、ロナルド・フィッシャーによる1922年の"On the mathematical foundations of theoretical statistics"である。ここでフィッシャーはまた「最尤法」(method of maximum likelihood)の語を初めて用いている。フィッシャーは統計学的推計の基礎として事後確率を用いることに反対し、代わりに尤度関数に基づく推計を提案している。