シグモイド関数
シグモイド関数(シグモイドかんすう、sigmoid function)は、
- <math>\varsigma_a (x) = \frac{1}{1+e^{- a x}}</math>
で表される実関数である。なお、<math>a</math> をゲイン (gain) と呼ぶ。
狭義には、ゲインが1の標準シグモイド関数 (standard sigmoid function)
- <math>\varsigma_1 (x) = \frac{1}{1+e^{-x}}</math>
をさす。
以下は広義のシグモイド関数について述べる。標準シグモイド関数については、<math> a = 1 </math> を代入すればよい。
シグモイド (sigmoid) とは、シグモイド曲線 (sigmoid curve) ともいい、ギリシャ文字のシグマ(語中では σ だがここでは語末形の ς のこと)に似た形と言う意味である。ただし、単にシグモイドまたはシグモイド曲線と言った場合は、シグモイド関数と似た性質を持つς型の関数(累積正規分布関数、ゴンペルツ関数など)を総称するのが普通である。
目次
性質
<math>(-\infty, \infty) \rightarrow (0,1) </math> の単調増加連続関数で、1つの変曲点を持つ。
<math>y = 0</math> と <math>y = 1</math> を漸近線に持ち、
- <math>\lim_{x \rightarrow \infty} \varsigma _a (x) = 1 </math>
- <math>\lim_{x \rightarrow -\infty} \varsigma _a (x) = 0 </math>
- <math>\lim_{x \rightarrow \pm \infty} \dot \varsigma _a (x) = 0 </math>
である。
<math>x = 0</math> では
- <math>\varsigma _a (0) = 1 / 2 </math>
- <math>\dot \varsigma _a (0) = a / 4 </math>
- <math>\ddot \varsigma _a (0) = 0 </math>
である。つまり、変曲点は <math>(0,1/2)</math> である。
また、<math>(0,1/2)</math> を中心に点対称である。つまり、<math> \varsigma_a (x) - 1/2 </math> は奇関数であり、
- <math> \varsigma_a (-x) = 1 - \varsigma_a (x) </math>
を満たす。
逆関数は、
- <math>\varsigma _a ^{-1} (y) = \frac{1}{a} \ln \left( \frac{ y }{ 1 - y } \right) = \frac{1}{a} \operatorname{logit} y</math>
と、ロジット関数で表せる。特に、標準シグモイド関数とロジット関数は互いに逆関数である。
導関数と二階導関数は
- <math>\dot \varsigma _a (x) = \frac{ a e^{-ax} }{ (1 + e^{-ax} ) ^2 } = a \varsigma_a (x) \{ 1 - \varsigma_a (x) \}</math>
- <math>\ddot \varsigma _a (x) = a ^2 \varsigma_a (x) \{ 1 - \varsigma_a (x) \} \{ 1 - 2 \varsigma_a (x) \}</math>
と、シグモイド関数自身を使って簡潔に表せる。
他の関数との関係
- <math>\tanh x = \frac{ e^x - e^{-x} }{ e^x + e^{-x} }</math>
を使って
- <math>\varsigma_a (x) = \frac{ \tanh(a x / 2) + 1 }{ 2 }</math>
とも表せる。
- <math>N = \frac{K}{1 + \exp{r K (t_0 - t)}}</math>
の特殊ケースで、<math>r = a, K = 1, t_0 = 0</math> と置いた場合にあたる。
応用
導関数をシグモイド関数自身で簡単に導出できるため、微分成分が必要となるプロパゲーションに適している。パーセプトロンにおけるバックプロパゲーションなどで用いられる。