負の二項分布(ふのにこうぶんぷ)とは、確率分布の一種で、二項分布の拡張。
負の二項分布は、文献によって異なった意味で使われることがある。
(1) 統計的に独立なベルヌーイ試行を行ったとき、x 回目の試行で k 回目の「成功」が得られた時の x の分布。
(2) 統計的に独立なベルヌーイ試行を行ったときに、k 回目の「成功」を得るまでに失敗した試行回数 y の分布。
(1) x 回目の試行で k 回目の「成功」が得られた時の x の確率分布
x 回目の試行で k 回目の成功となったのだから、x - 1 回目は必ず失敗している。また、x 回試行したうちの k 回は成功しているのだから、失敗した試行の数は x - k 回。
おのおのの成功する確率を p とすると失敗する確率は (1 - p)。
x 回目の試行は「成功」でなければならないから、成功失敗の順番が決まっていないのは x - 1 回目まで。よって、
![{\displaystyle P(X=x)={x-1 \choose k-1}p^{k}(1-p)^{x-k}}](http://178.128.105.246/cars-https-wikimedia.org/api/rest_v1/media/math/render/svg/5fc1772b4575f17e2ebdd0da70e8f59767a3209e)
となる。
(2) k 回目の「成功」を得るまでに失敗した試行回数 y の確率分布
k 回成功して y 回失敗したので、全試行回数は k + y 回。
また、k + y 回目は「成功」であるので、(1)と同じく成功失敗の組み合わせは k + y - 1 回目までを考え、
![{\displaystyle P(Y=y)={k+y-1 \choose y}p^{k}(1-p)^{y}}](http://178.128.105.246/cars-https-wikimedia.org/api/rest_v1/media/math/render/svg/3ef08ffae60fcee9ae20d5640619e1d8328c4214)
となる。
(1)と(2)の両式は変数変換
![{\displaystyle y=x-k}](http://178.128.105.246/cars-https-wikimedia.org/api/rest_v1/media/math/render/svg/a6cf60efca52f05c655d63c7173abe66969a8bcb)
で互いに可換である。
![{\displaystyle {n \choose m}={n \choose n-m}}](http://178.128.105.246/cars-https-wikimedia.org/api/rest_v1/media/math/render/svg/732df59326cc664d5e62a6dfb7a184e24b004485)
に注意すると、
![{\displaystyle {\begin{aligned}P(X=x)&={x-1 \choose k-1}p^{k}(1-p)^{x-k}\\&={x-1 \choose (x-1)-(k-1)}p^{k}(1-p)^{x-k}\\&={x-1 \choose x-k}p^{k}(1-p)^{x-k}\\&={y+k-1 \choose y}p^{k}(1-p)^{y}\\&=P(Y=y)\end{aligned}}}](http://178.128.105.246/cars-https-wikimedia.org/api/rest_v1/media/math/render/svg/1b79dc01f671ebb6a6c254fa3e995f50303b61df)
(1)式と(2)式では期待値が異なる。
(1)式の場合
![{\displaystyle {\begin{aligned}E[X]&=\sum _{x=0}^{\infty }xP_{k}(x)\\&=\sum _{x=0}^{\infty }x{\frac {(x-1)(x-2)\cdots (x-k+1)}{(k-1)!}}p^{k}(1-p)^{x-k}\\&=\sum _{x=k}^{\infty }{\frac {x(x-1)\cdots (x-k+1)}{(k-1)!}}p^{k}(1-p)^{x-k}\\&={\frac {k}{p}}\sum _{x=k}^{\infty }{\frac {x(x-1)\cdots (x-k+1)}{k!}}p^{k+1}(1-p)^{x-k}\\&={\frac {k}{p}}\sum _{x=k+1}^{\infty }{\frac {(x-1)(x-2)\cdots (x-k)}{k!}}p^{k+1}(1-p)^{x-k-1}\\&={\frac {k}{p}}\sum _{x=0}^{\infty }P_{k+1}(x)\\&={\frac {k}{p}}\end{aligned}}}](http://178.128.105.246/cars-https-wikimedia.org/api/rest_v1/media/math/render/svg/34934a536d813b6194fedfccfd568e953209e59b)
(2)式の場合
![{\displaystyle {\begin{aligned}E[Y]&=\sum _{y=0}^{\infty }xP_{k}(y)\\&=\sum _{y=0}^{\infty }y{\frac {(k+y-1)(k+y-2)\cdots (k+1)k}{y!}}p^{k}(1-p)^{y}\\&=\sum _{y=1}^{\infty }{\frac {(k+y-1)(k+y-2)\cdots (k+1)k}{(y-1)!}}p^{k}(1-p)^{y}\\&=k{\frac {(1-p)}{p}}\sum _{y=0}^{\infty }{\frac {(k+y)(k+y-1)\cdots (k+1)}{y!}}p^{k+1}(1-p)^{y}\\&=k{\frac {(1-p)}{p}}\sum _{y=0}^{\infty }P_{k+1}(y)\\&=k{\frac {(1-p)}{p}}\end{aligned}}}](http://178.128.105.246/cars-https-wikimedia.org/api/rest_v1/media/math/render/svg/64aff0af3ea02f1541c56c699f112bf48cb90e6b)
これらは期待値の線形性
![{\displaystyle E[aX+bY]=aE[X]+bE[Y]}](http://178.128.105.246/cars-https-wikimedia.org/api/rest_v1/media/math/render/svg/3f20a5cf4b4dd13bef83477f4659703db627ff28)
から容易に互いに導ける。
![{\displaystyle y=x-k}](http://178.128.105.246/cars-https-wikimedia.org/api/rest_v1/media/math/render/svg/a6cf60efca52f05c655d63c7173abe66969a8bcb)
だから、
![{\displaystyle E[Y]=E[X-k]=E[X]-k}](http://178.128.105.246/cars-https-wikimedia.org/api/rest_v1/media/math/render/svg/f027b37aa402b479c194935a432fb4697eabee88)
よって
![{\displaystyle {\begin{aligned}E[Y]&=k{\frac {(1-p)}{p}}\\&={\frac {k-pk}{p}}\\&={\frac {k}{p}}-k\\&=E[X]-k\end{aligned}}}](http://178.128.105.246/cars-https-wikimedia.org/api/rest_v1/media/math/render/svg/ca3ae5e17626cdd6b41b274c2981d63e556079f3)
上記のように三つの意味があるので、ここでは最初の意味に絞って解説する。最初の意味では、負の二項分布とは、おのおのの試行で成功する確率が p である独立なベルヌーイ試行を続けておこなったとき、r 回の成功を得るのに必要な試行回数であった。
パラメータ : 成功回数 r は、整数で、1 ≤ r とする。r = 1 のときの負の二項分布を幾何分布という。おのおのの試行で成功する確率 p は、0 < p < 1 である実数である。
- 確率分布関数 r 回の成功を x 回目の試行で達成する確率
![{\displaystyle f(x)=P(X=x)={x-1 \choose r-1}p^{r}(1-p)^{x-r}}](http://178.128.105.246/cars-https-wikimedia.org/api/rest_v1/media/math/render/svg/5b689a047b3064b93a79b015c7662b8159115b5d)
- 累積分布関数 r 回の成功を、x 回目かそれ以前に達成する確率 : 単純な解法は存在しないが、正規化された不完全なベータ関数を使って計算することができる。二項分布
- 期待値 E(X) = r / p.
- 分散 var(X) = σ2 = r(1 − p) / p2.
[[Category:確率分布|ふのにこうふんふ]]
[[Category:数学に関する記事|ふのにこうふんふ]]