二項分布のわかりやすいまとめ

[公開日]2017/11/16[更新日]2017/11/17

二項分布についてわかりやすくまとめました。以下の表は二項分布の基本的な特性一覧になります。

パラメーター\(n,p\)
範囲\(0≦x≦n\)
x:成功回数
確率密度関数\(f\left( x\right) =\begin{pmatrix} n \\ x \end{pmatrix}p^{x}q^{n-x}\)
分布関数\(F\left( x\right) =\sum^{x}_{k=0}\begin{pmatrix} n \\ k \end{pmatrix}p^{k}q^{n-k}\)
積率母関数\((pe^t+q)^n\)
特性関数\((pe^{it}+q)^n\)
キュムラント母関数\(nlog(pe^t+q)\)
期待値\(E(X)=np\)
分散\(Var(X)=npq\)
最頻値\(p(n+1)-1≦x≦p(n+1)\)
歪度\(\frac{q-p}{\sqrt{npq}}\)

二項分布とは?

二項分布(Binomial Distribution)とは、互いに独立したベルヌーイ試行をn回行ったときに、ある事象が何回起こるかの確率分布です。例えば、「コインを5回投げた時に表2回出る確率」「対戦ゲームで90%の確率で当たる技を10回中8回当てる確率」などを表した確率分布です。

(ベルヌーイ試行とは、試行結果が成功か失敗かの2通りしかない試行をさします。例えば、「サイコロを投げた場合1なのか、それ以外なのか?」というのを考える場合これはベルヌーイ試行ですが、「サイコロを投げてどの目が出るか?」というのを考えるのはベルヌーイ試行ではありません。ベルヌーイ試行について詳しくはベルヌーイ試行の定義を丁寧にわかりやすく解説をご覧下さい。)

また、ベルヌーイ試行がの回数が一回のとき(すなわちn = 1のとき)、二項分布はベルヌーイ分布となります。

二項分布と正規分布

二項分布\(B(n.p)\)は\(n\)が十分に大きいとき、平均\(np\)、分散\(np(1-p)\)の正規分布に近づきます。また、\(\frac{X-np}{\sqrt{np(1-p)}}\)は近似的に標準正規分布に従います。これをド・モアブルー・ラプラスの定理と言います。正規分布につてはこちら→正規分布のわかりやすいまとめ

確率密度関数

二項分布の確率密度関数は、ベルヌーイ分布の確率密度関数と非常によく似ています。

$$f\left( x\right) =\begin{pmatrix} n \\ x \end{pmatrix}p^{x}(1-p)^{n-x}$$

積率母関数

二項分布の積率母関数は以下のようにして導出されます。

\(\begin{eqnarray*}M_X(t)&=&E(\mathrm{e}^{tk})\\ &=&\sum_{k=0}^{n}\mathrm{e}^{tk}P(X=k)\\ &=&\sum_{k=0}^{n}\mathrm{e}^{tk}\begin{pmatrix}n \\ k\end{pmatrix} p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}\mathrm{e}^{tk}\ _n C_k p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}\ _n C_k {(\mathrm{e}^tp)}^{k}{(1-p)}^{n-k}\\ &=&{(\mathrm{e}^tp+1-p)}^n \end{eqnarray*}\)

期待値、分散の導出(密度関数より)

期待値の導出

\(\begin{eqnarray*}E(X)&=&\sum_{k=0}^{n}kP(X=k)\\ &=&\sum_{k=0}^{n}k\begin{pmatrix}n \\ k\end{pmatrix} p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}k\ _n C_k p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}k\frac{n!}{{(n-k)}!k!}p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}\frac{n {(n-1)}!}{{(n-k)}!{(k-1)}!}p p^{k-1}{(1-p)}^{n-k}\\ &=&np\sum_{k=0}^{n}\frac{{(n-1)}!}{{((n-1)-(k-1))}!{(k-1)}!}p^{k-1}{(1-p)}^{n-k}\\ &=&np\end{eqnarray*}\)

さらに詳しい説明→二項分布の期待値の導出(証明)

分散の導出

\(\begin{eqnarray*}E(X^2)&=&\sum_{k=0}^{n}k^2P(X=k)\\ &=&\sum_{k=0}^{n}k^2\begin{pmatrix}n \\ k\end{pmatrix} p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}k^2\ _n C_k p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}(k(k-1)+k)\frac{n!}{{(n-k)}!k!}p^{k}{(1-p)}^{n-k}\\ &=&\sum_{k=0}^{n}k(k-1)\frac{n!}{{(n-k)}!k!}p^{k}{(1-p)}^{n-k}+\sum_{k=0}^{n}k\frac{n!}{{(n-k)}!k!}p^{k}{(1-p)}^{n-k}\end{eqnarray*}\)

\(\begin{eqnarray*}\ \ \ \ \ \ \ \ \ \ \ &=&\sum_{k=0}^{n}\frac{n!}{{(n-k)}!(k-2)!}p^{k}{(1-p)}^{n-k}+np\\ &=&\sum_{k=0}^{n}\frac{n(n-1)(n-2)!}{{(n-k)}!(k-2)!}p^2p^{k-2}{(1-p)}^{n-k}+np\\ &=&n(n-1)p^2\sum_{k=0}^{n}\frac{(n-2)!}{{((n-2)-(k-2))}!(k-2)!}p^{k-2}{(1-p)}^{n-k}+np\\ &=&n(n-1)p^2+np\end{eqnarray*}\)

\(\begin{eqnarray*}V(X)&=&E(X^2)-{(E(X))}^2\\ &=&n(n-1)p^2+np-{(np)}^2\\ &=&np(1-p) \end{eqnarray*}\)

さらに詳しい説明→二項分布の分散導出(証明)

期待値、分散の導出(積率母関数より)

積率母関数からの期待値の導出

\(\begin{eqnarray*}E(X)&=&\left.\frac{d{M_x}(t)}{dt}\right|_{t=0}\\ &=&n{(\mathrm{e}^tp+1-p)}^{n-1}p\mathrm{e}^t|_{t=0}\\ &=&n{(1-p+p)}^{n-1}p\\ &=&np\end{eqnarray*}\)

積率母関数からの分散の導出

\(\begin{eqnarray*}E(X^2)&=&\left.\frac{d^2{M_x}(t)}{dt^2}\right|_{t=0}\\ &=&{(np(\mathrm{e}^tp+1-p)^{n-1}\mathrm{e}^t)}'|_{t=0}\\ &=&n(n-1)p(\mathrm{e}^{t}p+1-p)^{n-2}p\mathrm{e}^t+np(\mathrm{e}^tp+1-p)^{n-1}\mathrm{e}^t\\ &=&n(n-1)p^2+np\\\\ V(X)&=&E(X^2)-{E(X)}^2\\ &=&np(1-p) \end{eqnarray*}\)

二項分布の最頻値

そもそも最頻値ってなんだっけ?

最頻値とは、確率密度関数\(f(x)\)が最大となる\(x\)をさします。そして、この場合\(f(x)\)は常に正の値をとるので、

\(\begin{eqnarray*}f\left( x\right) -f\left( x-1\right) ≧0\\ \end{eqnarray*}\)

を満たす最大のxが最頻値です。これで計算を進めると最頻値\(x\)は、

\(p(n+1)-1≦x≦p(n+1)\)

を満たす整数\(x\)となります。(等号成立時に最頻値は二つになります。)

さらに詳しい導出過程→二項分布の最頻値を導出(確率密度関数より)

二項分布の歪度・尖度

歪度

\(\begin{eqnarray*}\dfrac {E\left[ \left( x-\mu\right) ^{3}\right] }{\sigma^{3}}&=&\dfrac {np\left( p-1\right) \left( 2p-1\right) }{np\left( 1-p\right) \sqrt {np\left( 1-p\right) }}\\ &=&\dfrac {1-2p}{\left( 1-p\right) \sqrt {np\left( 1-p\right) }}\end{eqnarray*}\)

さらに詳しい導出過程→二項分布の歪度の導出

尖度

\(\begin{eqnarray*}\dfrac {E\left[ \left( x-\mu\right)^4\right] }{\sigma^{4}}-3&=&\dfrac {np\left( 1-p\right) \left( 1+3(n-2\right) p\left( 1-P\right) }{n^{2}p^{2}\left( 1-p\right) ^{2}}-3\\ &=&\dfrac {1-6p\left( 1-p\right) }{np\left( 1-p\right) ^{2}}\end{eqnarray*}\)

さらに詳しい導出過程→二項分布の尖度の導出