負の二項分布について|Excel(エクセル)で学ぶデータ分析ブログ
負の二項分布とは?
負の二項分布(negative binomial distribution)とは、確率分布の一種で、二項分布の拡張です。
また、幾何分布は負の二項分布における特殊ケースとなります。
二項分布、幾何分布との違い
二項分布
N回の試行を行ったときの成功数分布 \[
p(X=x) = {}_nC_x p^x (1-p)^{n-x}
\]
幾何分布
試行を繰り返して初めて成功させるまでの試行回数の分布 \[
成功がx回目: p(X=x) = p (1-p)^{x-1} ,x = 1,2,3,4 \cdots \\
失敗がx回続く: p(X=x) = p (1-p)^x ,x = 0,1,2,3 \cdots
\]
幾何分布では、ようやく『1回』成功するまでに何回失敗するか、という予想をする際に用いられますが
では『10回』成功するためには何回失敗を繰り返せばいいのか、という問題に応えることは難しそうです。
| 失敗数 | 失敗数/試行回数 | 確率分布 | |
|---|---|---|---|
| 1回 | 8 | 0.001 | 0.001 |
| 2回 | 58 | 0.006 | 0.005 |
| 3回 | 128 | 0.013 | 0.013 |
| 4回 | 264 | 0.026 | 0.027 |
| 5回 | 430 | 0.043 | 0.044 |
| 6回 | 608 | 0.061 | 0.061 |
| 7回 | 794 | 0.079 | 0.076 |
| 8回 | 812 | 0.081 | 0.087 |
| 9回 | 925 | 0.092 | 0.093 |
| 10回 | 924 | 0.092 | 0.093 |
| 11回 | 865 | 0.086 | 0.088 |
| 12回 | 824 | 0.082 | 0.08 |
| 13回 | 716 | 0.072 | 0.07 |
| 14回 | 581 | 0.058 | 0.059 |
| 15回 | 495 | 0.05 | 0.049 |
| 16回 | 434 | 0.043 | 0.039 |
| 17回 | 321 | 0.032 | 0.03 |
| 18回 | 203 | 0.02 | 0.023 |
| 19回 | 193 | 0.019 | 0.017 |
| 20回 | 123 | 0.012 | 0.013 |
| 21回 | 82 | 0.008 | 0.009 |
| 22回 | 62 | 0.006 | 0.007 |
| 23回 | 51 | 0.005 | 0.005 |
| 24回 | 31 | 0.003 | 0.003 |
| 25回 | 26 | 0.003 | 0.002 |
| 26回 | 8 | 0.001 | 0.002 |
| 27回 | 16 | 0.002 | 0.001 |
| 28回 | 5 | 0 | 0.001 |
| 29回 | 7 | 0.001 | 0 |
| 30回 | 2 | 0 | 0 |
| 31回 | 1 | 0 | 0 |
| 32回 | 1 | 0 | 0 |
| 33回 | 1 | 0 | 0 |
| 34回 | 0 | 0 | 0 |
| 35回 | 1 | 0 | 0 |
コインを例にして、表が出たら成功と定義づけ、10回表が出るまで投げ続けます。
確率は1/2なので2回に1回は失敗をすることが想像できますので
10回成功させるためには20回くらい投げればいいと考えられます。
したがって分布が10回あたりでピークになっていることと感覚的に合致しています。
負の二項分布
試行を行ったとき、r 回の「成功」を得るのに必要な試行回数の分布。
または 試行を行ったときに、r 回の「成功」をする前に失敗した試行回数の分布。 \[
成功がx回目: P(X=x) = {x-1 \choose r-1} p^{r} (1-p)^{x-r} ,x = 1,2,3,4 \cdots \\
失敗がx回続く: P(X=x) = {x+r-1 \choose x} p^{r} (1-p)^{x} ,x = 0,1,2,3 \cdots
\]
また、幾何分布は負の二項分布でr=1としたときの式を用います。
エクセルでは下記のようにあらわします。
試行回数:10回の場合
=COMBIN($l2+$M$1-1,$L2)*((B$1)^$M$1)*(1-B$1)^($L2)
=NEGBINOMDIST($l2,$M$1,B$1)
サイコロの場合
| 失敗数 | 失敗数/試行回数 | 確率分布 | |
|---|---|---|---|
| 1回 | 0 | 0 | 0 |
| 2回 | 0 | 0 | 0 |
| 3回 | 0 | 0 | 0 |
| 4回 | 0 | 0 | 0 |
| 5回 | 0 | 0 | 0 |
| 6回 | 0 | 0 | 0 |
| 7回 | 1 | 0 | 0 |
| 8回 | 0 | 0 | 0 |
| 9回 | 0 | 0 | 0 |
| 10回 | 2 | 0 | 0 |
| 11回 | 1 | 0 | 0 |
| 12回 | 2 | 0 | 0 |
| 13回 | 4 | 0 | 0.001 |
| 14回 | 5 | 0 | 0.001 |
| 15回 | 9 | 0.001 | 0.001 |
| 16回 | 13 | 0.001 | 0.001 |
| 17回 | 20 | 0.002 | 0.002 |
| 18回 | 14 | 0.001 | 0.002 |
| 19回 | 23 | 0.002 | 0.003 |
| 20回 | 34 | 0.003 | 0.004 |
| 21回 | 43 | 0.004 | 0.004 |
| 22回 | 66 | 0.007 | 0.005 |
| 23回 | 53 | 0.005 | 0.006 |
| 24回 | 65 | 0.006 | 0.007 |
| 25回 | 84 | 0.008 | 0.008 |
| 26回 | 85 | 0.008 | 0.009 |
| 27回 | 111 | 0.011 | 0.01 |
| 28回 | 107 | 0.011 | 0.011 |
| 29回 | 117 | 0.012 | 0.012 |
| 30回 | 133 | 0.013 | 0.014 |
| 31回 | 149 | 0.015 | 0.015 |
| 32回 | 145 | 0.014 | 0.016 |
| 33回 | 167 | 0.017 | 0.017 |
| 34回 | 168 | 0.017 | 0.018 |
| 35回 | 187 | 0.019 | 0.019 |
| 36回 | 203 | 0.02 | 0.02 |
| 37回 | 214 | 0.021 | 0.021 |
| 38回 | 201 | 0.02 | 0.021 |
| 39回 | 232 | 0.023 | 0.022 |
| 40回 | 225 | 0.022 | 0.023 |
| 41回 | 239 | 0.024 | 0.023 |
| 42回 | 246 | 0.025 | 0.023 |
| 43回 | 229 | 0.023 | 0.024 |
| 44回 | 259 | 0.026 | 0.024 |
| 45回 | 236 | 0.024 | 0.024 |
| 46回 | 277 | 0.028 | 0.024 |
| 47回 | 245 | 0.024 | 0.024 |
| 48回 | 246 | 0.025 | 0.024 |
| 49回 | 207 | 0.021 | 0.024 |
| 50回 | 239 | 0.024 | 0.023 |

