利用者:MKBs/sandbox

ここはMKBsさんの利用者サンドボックスです。編集を試したり下書きを置いておいたりするための場所であり、百科事典の記事ではありません。ただし、公開の場ですので、許諾されていない文章の転載はご遠慮ください。

登録利用者は自分用の利用者サンドボックスを作成できます（サンドボックスを作成する、解説）。

その他のサンドボックス: 共用サンドボックス | モジュールサンドボックス

記事がある程度できあがったら、編集方針を確認して、新規ページを作成しましょう。

負の二項分布（ふのにこうぶんぷ）とは、確率分布の一種で、二項分布の拡張。

二つの意味

負の二項分布は、文献によって異なった意味で使われることがある。

(1) 統計的に独立なベルヌーイ試行を行ったとき、x 回目の試行で k 回目の「成功」が得られた時の x の分布。

(2) 統計的に独立なベルヌーイ試行を行ったときに、k 回目の「成功」を得るまでに失敗した試行回数 y の分布。

式

(1)　x 回目の試行で k 回目の「成功」が得られた時の x の確率分布

x 回目の試行で k 回目の成功となったのだから、x - 1 回目は必ず失敗している。また、x 回試行したうちの k 回は成功しているのだから、失敗した試行の数は x - k 回。おのおのの成功する確率を p とすると失敗する確率は (1 - p)。 x 回目の試行は「成功」でなければならないから、成功失敗の順番が決まっていないのは x - 1 回目まで。よって、

$P(X=x)={x-1 \choose k-1}p^{k}(1-p)^{x-k}$

となる。

(2)　k 回目の「成功」を得るまでに失敗した試行回数 y の確率分布

k 回成功して y 回失敗したので、全試行回数は k + y 回。また、k + y 回目は「成功」であるので、(1)と同じく成功失敗の組み合わせは k + y - 1 回目までを考え、

$P(Y=y)={k+y-1 \choose y}p^{k}(1-p)^{y}$

となる。

(1)と(2)の両式は変数変換

y=x-k

で互いに可換である。

{n \choose m}={n \choose n-m}

に注意すると、

{\begin{aligned}P(X=x)&={x-1 \choose k-1}p^{k}(1-p)^{x-k}\\&={x-1 \choose (x-1)-(k-1)}p^{k}(1-p)^{x-k}\\&={x-1 \choose x-k}p^{k}(1-p)^{x-k}\\&={y+k-1 \choose y}p^{k}(1-p)^{y}\\&=P(Y=y)\end{aligned}}

期待値

(1)式と(2)式では期待値が異なる。

(1)式の場合

{\begin{aligned}E[X]&=\sum _{x=0}^{\infty }xP_{k}(x)\\&=\sum _{x=0}^{\infty }x{\frac {(x-1)(x-2)\cdots (x-k+1)}{(k-1)!}}p^{k}(1-p)^{x-k}\\&=\sum _{x=k}^{\infty }{\frac {x(x-1)\cdots (x-k+1)}{(k-1)!}}p^{k}(1-p)^{x-k}\\&={\frac {k}{p}}\sum _{x=k}^{\infty }{\frac {x(x-1)\cdots (x-k+1)}{k!}}p^{k+1}(1-p)^{x-k}\\&={\frac {k}{p}}\sum _{x=k+1}^{\infty }{\frac {(x-1)(x-2)\cdots (x-k)}{k!}}p^{k+1}(1-p)^{x-k-1}\\&={\frac {k}{p}}\sum _{x=0}^{\infty }P_{k+1}(x)\\&={\frac {k}{p}}\end{aligned}}

(2)式の場合

{\begin{aligned}E[Y]&=\sum _{y=0}^{\infty }xP_{k}(y)\\&=\sum _{y=0}^{\infty }y{\frac {(k+y-1)(k+y-2)\cdots (k+1)k}{y!}}p^{k}(1-p)^{y}\\&=\sum _{y=1}^{\infty }{\frac {(k+y-1)(k+y-2)\cdots (k+1)k}{(y-1)!}}p^{k}(1-p)^{y}\\&=k{\frac {(1-p)}{p}}\sum _{y=0}^{\infty }{\frac {(k+y)(k+y-1)\cdots (k+1)}{y!}}p^{k+1}(1-p)^{y}\\&=k{\frac {(1-p)}{p}}\sum _{y=0}^{\infty }P_{k+1}(y)\\&=k{\frac {(1-p)}{p}}\end{aligned}}

これらは期待値の線形性

$E[aX+bY]=aE[X]+bE[Y]$

から容易に互いに導ける。

y=x-k

だから、

E[Y]=E[X-k]=E[X]-k

よって

{\begin{aligned}E[Y]&=k{\frac {(1-p)}{p}}\\&={\frac {k-pk}{p}}\\&={\frac {k}{p}}-k\\&=E[X]-k\end{aligned}}

上記のように三つの意味があるので、ここでは最初の意味に絞って解説する。最初の意味では、負の二項分布とは、おのおのの試行で成功する確率が p である独立なベルヌーイ試行を続けておこなったとき、r 回の成功を得るのに必要な試行回数であった。

パラメータ : 成功回数 r　は、整数で、1 ≤ r とする。r = 1 のときの負の二項分布を幾何分布という。おのおのの試行で成功する確率 p は、0 < p < 1 である実数である。

確率分布関数 r 回の成功を x 回目の試行で達成する確率
$f(x)=P(X=x)={x-1 \choose r-1}p^{r}(1-p)^{x-r}$
累積分布関数 r 回の成功を、x 回目かそれ以前に達成する確率 : 単純な解法は存在しないが、正規化された不完全なベータ関数を使って計算することができる。二項分布
期待値 E(X) = r / p.
分散 var(X) = σ² = r(1 − p) / p².

二つの意味

式

期待値

関連項目