確率質量関数を用いた二項分布の期待値・分散の導出

更新日

公式の確認

まずは、公式の確認をしましょう。

確率質量関数

P(X=k)=(nk)pk(1p)nkP(X=k)=\begin{pmatrix}n \\ k\end{pmatrix} p^{k}{(1-p)}^{n-k}

期待値

E(X)=npE(X)=np

分散

V(X)=np(1p)V(X)=np(1-p)

期待値の導出

E(X)=k=0nkP(X=k)=k=0nk(nk)pk(1p)nk=k=0nk <em>nC</em>kpk(1p)nk=k=0nkn!(nk)!k!pk(1p)nk=k=0nn(n1)!(nk)!(k1)!ppk1(1p)nk=npk=0n(n1)!((n1)(k1))!(k1)!pk1(1p)nk=np\begin{equation*}\begin{split}E(X)&=\sum_{k=0}^{n}kP(X=k)\\ &=\sum_{k=0}^{n}k\begin{pmatrix}n \\ k\end{pmatrix} p^{k}{(1-p)}^{n-k}\\ &=\sum_{k=0}^{n}k\ <em>n C</em>k p^{k}{(1-p)}^{n-k}\\ &=\sum_{k=0}^{n}k\frac{n!}{{(n-k)}!k!}p^{k}{(1-p)}^{n-k}\\ &=\sum_{k=0}^{n}\frac{n {(n-1)}!}{{(n-k)}!{(k-1)}!}p p^{k-1}{(1-p)}^{n-k}\\ &=np\sum_{k=0}^{n}\frac{{(n-1)}!}{{((n-1)-(k-1))}!{(k-1)}!}p^{k-1}{(1-p)}^{n-k}\\ &=np\end{split}\end{equation*}

【補足】

(n1)!((n1)(k1))!(k1)!pk1(1p)nk\begin{equation*}\begin{split}\frac{{(n-1)}!}{{((n-1)-(k-1))}!{(k-1)}!}p^{k-1}{(1-p)}^{n-k}\end{split}\end{equation*}

この部分のn-1をn'、k-1をk'とおくと、

n!(nk)!k!pk(1p)nk\begin{equation*}\begin{split}\frac{n'!}{{(n'-k')}!k'!}p^{k'}{(1-p)}^{n'-k'}\end{split}\end{equation*}

となる。これはパラメータがn'とk'の二項分布の確率質量関数である。よって、

k=0n(n1)!((n1)(k1))!(k1)!pk1(1p)nk\begin{equation*}\begin{split}\sum_{k=0}^{n}\frac{{(n-1)}!}{{((n-1)-(k-1))}!{(k-1)}!}p^{k-1}{(1-p)}^{n-k}\end{split}\end{equation*}

は確率質量関数を確率変数がとりうる値において全て足しあわせた値であるため、1である。

(ある事象における全ての確率を足すと1になることと同義)

分散の導出

E(X2)=k=0nk2P(X=k)=k=0nk2(nk)pk(1p)nk=k=0nk2 <em>nC</em>kpk(1p)nk=k=0n(k(k1)+k)n!(nk)!k!pk(1p)nk=k=0nk(k1)n!(nk)!k!pk(1p)nk+k=0nkn!(nk)!k!pk(1p)nk\begin{equation*}\begin{split}E(X^2)&=\sum_{k=0}^{n}k^2P(X=k)\\ &=\sum_{k=0}^{n}k^2\begin{pmatrix}n \\ k\end{pmatrix} p^{k}{(1-p)}^{n-k}\\ &=\sum_{k=0}^{n}k^2\ <em>n C</em>k p^{k}{(1-p)}^{n-k}\\ &=\sum_{k=0}^{n}(k(k-1)+k)\frac{n!}{{(n-k)}!k!}p^{k}{(1-p)}^{n-k}\\ &=\sum_{k=0}^{n}k(k-1)\frac{n!}{{(n-k)}!k!}p^{k}{(1-p)}^{n-k}+\sum_{k=0}^{n}k\frac{n!}{{(n-k)}!k!}p^{k}{(1-p)}^{n-k}\end{split}\end{equation*}

【補足】

k=0nkn!(nk)!k!pk(1p)nk\begin{equation*}\begin{split}\\\sum_{k=0}^{n}k\frac{n!}{{(n-k)}!k!}p^{k}{(1-p)}^{n-k}\end{split}\end{equation*}

これは、先ほど導出した二項分布の期待値であるため、npとなる。

           =k=0nn!(nk)!(k2)!pk(1p)nk+np=k=0nn(n1)(n2)!(nk)!(k2)!p2pk2(1p)nk+np=n(n1)p2k=0n(n2)!((n2)(k2))!(k2)!pk2(1p)nk+np=n(n1)p2+np\begin{equation*}\begin{split}\ \ \ \ \ \ \ \ \ \ \ &=\sum_{k=0}^{n}\frac{n!}{{(n-k)}!(k-2)!}p^{k}{(1-p)}^{n-k}+np\\ &=\sum_{k=0}^{n}\frac{n(n-1)(n-2)!}{{(n-k)}!(k-2)!}p^2p^{k-2}{(1-p)}^{n-k}+np\\ &=n(n-1)p^2\sum_{k=0}^{n}\frac{(n-2)!}{{((n-2)-(k-2))}!(k-2)!}p^{k-2}{(1-p)}^{n-k}+np\\ &=n(n-1)p^2+np\end{split}\end{equation*}

【補足】

(n2)!((n2)(k2))!(k2)!pk2(1p)nk\begin{equation*}\begin{split}\frac{{(n-2)}!}{{((n-2)-(k-2))}!{(k-2)}!}p^{k-2}{(1-p)}^{n-k}\end{split}\end{equation*}

この部分のn-2をn'、k-2をk'とおくと、

n!(nk)!k!pk(1p)nk\begin{equation*}\begin{split}\frac{n'!}{{(n'-k')}!k'!}p^{k'}{(1-p)}^{n'-k'}\end{split}\end{equation*}

となる。これはパラメータがn'とk'の二項分布の確率質量関数である。よって、

k=0n(n2)!((n2)(k2))!(k2)!pk2(1p)nk\begin{equation*}\begin{split}\sum_{k=0}^{n}\frac{{(n-2)}!}{{((n-2)-(k-2))}!{(k-2)}!}p^{k-2}{(1-p)}^{n-k}\end{split}\end{equation*}

は確率質量関数を確率変数がとりうる値において全て足しあわせた値であるため、1である。

(ある事象における全ての確率を足すと1になることと同義)

V(X)=E(X2)(E(X))2=n(n1)p2+np(np)2=np(1p)\begin{equation*}\begin{split}V(X)&=E(X^2)-{(E(X))}^2\\ &=n(n-1)p^2+np-{(np)}^2\\ &=np(1-p) \end{split}\end{equation*}

関連記事

二項分布のわかりやすいまとめ

積率母関数を用いた二項分布の期待値・分散の導出

カテゴリ: 二項分布