同時分布
確率論において、同時分布(どうじぶんぷ)または結合分布(けつごうぶんぷ, joint distribution)とは、確率変数が複数個ある場合に、複数の確率変数がとる値の組に対して、その発生の度合いを確率を用いて記述するもので、確率分布の一種である。
同時分布の表現方法として、離散型の確率変数にたいしては確率質量関数(確率関数ともいう)を用い、連続型の確率変数にたいしては確率密度関数を用いる。
定義
数学的には n 個の確率変数 X1, X2, …, Xn の同時分布は、これらの組 (X1, X2, …, Xn) を Rn 値確率変数とみたときの確率分布のことである。
同時分布は Rn 上の測度であり、記号
- <math>P_{X_1,X_2,\cdots,X_n}(\cdot)</math>
と書かれる。累積分布関数と確率密度関数、確率質量関数も同様に
- <math>F_{X_1,X_2,\cdots,X_n}(x_1, x_2, \cdots, x_n)</math>
- <math>f_{X_1,X_2,\cdots,X_n}(x_1, x_2, \cdots, x_n)</math>
- <math>f_{X_1,X_2,\cdots,X_n}(x_1, x_2, \cdots, x_n)</math>
のように書かれる。
離散型確率変数
複数の確率変数がとびとびの離散値をとる場合(離散型確率変数)、同時分布は同時確率関数(どうじかくりつかんすう)とも呼ばれる。例えば、1円硬貨と5円硬貨の表を1点、裏を0点とする。これらの2枚の硬貨を同時に投げる実験をし、X を1円硬貨の点数、Y を2つの値のうち大きいほうの点数とする。Y は X より小さくなることはない。1円硬貨が表(1点)で5円硬貨が裏(0点)なら、(X, Y) は (1, 1) となる。同じく1円硬貨が表(1点)で5円硬貨が表(1点)なら、(X, Y) は (1, 1) となる。この2変数のすべての組み合わせを考えると、(0, 0) が1、(0, 1) が1、(1, 1) が2で総計4となる。
| |||||||||||||||||||||||||
表1: 2確率変数の同時確率関数 |
このような2確率変数の同時確率関数を表にまとめると、表1のようになる。可能な事象は3つなので、2×2の表では (1, 0) の確率は0である。表の最終列と最終行は各々 X と Y の分布である。これを同時確率関数の周辺確率関数または周辺分布と呼び、行和や列和を計算して求めることができる。この周辺分布より、E (X) = 1/2、V (X) = 1/4、E (Y) = 3/4、V (Y) = 3/16、などが求められる。同時確率関数からは X と Y の積の期待値や共分散などが計算できる。計算方法は1変数の期待値と同様で、E (XY) = {(X × Y) × (X × Y) が起きる確率} の総和と定義される。上記の例では 1/2 となる。共分散は Cov (X, Y) = E (XY) - E (X) E (Y) であり、1/8 と求められる。X と Y の結びつき具合を示す母関数係数は ρ = Cov (X, Y) / (V (X) V (Y))1/2 と定義され、これは 1/31/2 である。なお、同時確率関数から求める母相関係数と、データの特性を調べるために求める標本相関係数の違いには注意が必要である(相関係数を参照)。条件付き確率関数とは、このような同時確率関数の任意の行あるいは列を選択して、確率の総和が1になるように調整したものをいう。例えば、Y = 1 の条件をつけた場合の X の条件付き分布は、0と1を各々1/3と2/3で執る分布である。1/3は (0, 1) が起きる確率1/4を列和の3/4で割って求める。Y = 0 の条件をつけた X は確率1で0になる。これは一点分布である。
条件付き確率関数も確率関数の要件を満たしていることから、条件付き確率関数について、期待値や分散を計算できる。これを条件付き期待値あるいは条件付き分散(偏分散)という。例えば、Y = 1 の条件を付した場合の X の条件付き期待値は、E (X | Y = 1) = 2/3、E (X | Y = 0) = 0、条件付き分散は V (X | Y = 1) = 2/9、E (X | Y = 0) = 0 などとなる。条件によって値は変化する。