正規分布の公式と特徴まとめ

更新日

正規分布(ガウス分布)に関するあらゆる特徴を、分かりやすくまとめました。目次から気になるトピックをご覧ください。

また正規分布の関連記事はこちらからご確認ください。

正規分布(ガウス分布)とは

正規分布とは、統計学を理解する上で最も大切な確率分布の一つです。

正規分布はガウス分布と呼ばれることもしばしばあります。これは18世紀から19世紀に渡って活躍した数学者C.F.ガウスに由来します。ガウスは天文学の観測データの研究から測定誤差がある法則に従うことを導き出し、誤差理論を確立しました。これが正規分布の基礎となったと言われています。

正規分布の基本的な性質

正規分布には以下のような基本的な性質があります。

  • 平均値最頻値中央値が一致する。
  • 平均値を中心にして左右対称である。(直線x=μに関して対称)
  • x軸が漸近線である。
  • 分散標準偏差)が大きくなると、曲線の山は低くなり、左右に広がって平らになる。分散(標準偏差)が小さくなると、山は高くなり、より尖った形になる。

確率密度関数

一変量の確率変数XXが、平均μμ、分散σ2σ^2の正規分布に従うとき、確率密度関数は次の式で表されます。

f(x)=12πσ2exp[(xμ)22σ2]f(x) = \frac{1}{\sqrt{2πσ^2}}\exp{[-\frac{(x-μ)^2}{2σ^2}]}

この確率密度関数を全区間で、積分すると1になります。また正規分布が平均μμ,分散σ2σ^2に従うことを省略してN(μ,σ2)N(μ,σ^2)に従うと表記することもあります。

このNNは正規分布 Normal distribution の頭文字から来ています。

正規分布が持つ3つの性質

正規分布には、以下3つの性質があります。各性質の詳細の説明や証明は、「正規分布の3つの性質とその証明」をご確認ください。

性質1:確率変数aX+bが従う正規分布

確率変数XXが正規分布N(μ,σ2)N(μ,σ^2)に従うとき、aX+baX+bは正規分布N(aμ+b,a2σ2)N(aμ+b,a^2σ^2)に従う。

性質2:標準化による標準正規分布

性質1を用いて、Z=XμσZ = \frac{X-μ}{σ}と変換すると、ZZは平均0、分散1の正規分布に従う。これを特別に標準正規分布という。

また、この変換を正規分布の標準化と呼ぶ。

性質3:正規分布の再現性

確率変数XXYYが独立に正規分布N(μ1,σ12)N(μ_1,σ_1^2),N(μ2,σ22)N(μ_2,σ_2^2)にそれぞれ従うとき、X+YX+Yも正規分布に従う。

また、その分布はN(μ1+μ2,σ12+σ22)N(μ_1+μ_2,σ_1^2+σ_2^2)となる。

標準正規分布

確率変数XXが正規分布N(μ,σ2)N(μ,σ^2)に従うとき、XXの線形変換Z=XμσZ = \frac{X-μ}{σ}N(0,1)N(0,1)に従います。

この平均0、分散1の分布を標準正規分布と言います。また、ZZの確率密度関数は次のようになります。

f(z)=12πez22f(z) = \frac{1}{\sqrt{2π}}e^{-\frac{z^2}{2}}

全ての正規分布はこの変換によって、標準正規分布に変換することができます。この変換を、正規分布の標準化といいます。

また、標準正規分布に従う確率変数ZZに対して、確率 P(uZ)P(u≦Z≦∞)P(u)P(u)としたとき、様々なuuに対する確率をまとめたものが、標準正規分布表といいます。

標本平均の分布と正規分布の関係

正規分布と標本平均には次のような関係があります。

母平均μμ、母分散σ2σ^2の母集団から大きさnnの標本を無作為に抽出するとき、標本平均Xˉ\bar{X}は、nnが大きい場合、N(μ,σ2n)N(μ,\frac{σ^2}{n})に近似的に従う。

正規分布が統計学を理解する上で非常に大事である理由の一つがこの特徴によるものです。この特徴を中心極限定理と言います。

抽出元の母集団の分布がどのような分布に従っていても、nnが大きければ、その標本平均の分布は正規分布に従うのです。二項分布でも、ポアソン分布でも、指数分布でも、あるいは未知の分布だとしても、その標本平均の分布は正規分布に従います。(nn → ∞ならば完全に従う)

さらに、もし母集団分布が正規分布であった場合、標本平均Xˉ\bar{X}nnの大きさによらず、正規分布N(μ,σ2n)N(μ,\frac{σ^2}{n})に従います。

中心極限定理

中心極限定理の定義は以下です。

平均μ\mu、分散σ2\sigma^2をもつあらゆる分布からの無作為標本の標本平均XXの分布はnが十分大きいとき以下の式が成立する。

limnP(Znz)=Φ(z)=z12πex22dx\lim_{n \to \infty} P(Z_{n} \leq z)=\Phi(z)=\int_\infty^z \frac{1}{\sqrt{2\pi}}\mathrm{e}^{-\frac{x^2}{2}} dx

これは、「確率変数の数が多くなったとき、あらゆる同一の分布に従う確率変数の標本平均の分布が、元の分布に関係なく、正規分布に収束する」という定理です。この定理の存在よって、正規分布があらゆる場面で使える分布となっています。

正規分布と標準偏差の関係

正規分布の標準偏差σσ(シグマ)は、その分布を把握する上でよく使われる指標です。

正規分布のグラフ

上図が正規分布のグラフと、標準偏差とその2倍、3倍σ,2σ,3σσ,2σ,3σの範囲を示したものです。

図からみてわかる通り、平均分散標準偏差の値とは関係なく、全ての正規分布のグラフは以下の性質を示します。

  • 平均値±1σの範囲中に、全体の約68パーセント(偏差値で言うと40〜60)
  • 平均値±2σ(場合によっては1.96σ)の範囲中に、全体の約95パーセント(偏差値で言うと30〜70)
  • 平均値±3σの中に、全体の約99.7パーセント(偏差値でいうと20~80)

正規分布の積率母関数

正規分布の積率母関数は以下のように導出されます。

mX(t)=E(etX)=etxf(x)dx=eμtσ2t22\begin{equation*}\begin{split}m_X(t)&=E(\mathrm{e}^{tX})\\ &=\displaystyle \int_{ - \infty }^{ \infty }\mathrm{e}^{tx}f(x)dx\\&={\mathrm{e}}^{\mu t+\frac{{\sigma}^{2}t^2}{2}}\end{split}\end{equation*}

上式の積率母関数を使った正規分布の平均や分散の導出の詳細は、「積率母関数を用いた正規分布の期待値(平均)と分散の導出」をご確認ください。

確率密度関数から正規分布の期待値・分散の導出

確率密度関数から、正規分布の期待・分散を導出してみます。詳細は「確率密度関数を用いた正規分布の期待値(平均)と分散の導出」をご確認ください。

期待値(平均)の導出

E(X)=xf(x)dx=(xμ+μ)f(x)dx=(xμ)12πσ2exp[(xμ)22σ2]dx+μf(x)dx=μ\begin{equation*}\begin{split}E(X)&=\displaystyle \int_{ - \infty }^{ \infty } xf(x) dx\\&=\displaystyle \int_{ - \infty }^{ \infty } (x-\mu+\mu)f(x) dx\\ &=\displaystyle \int_{ - \infty }^{ \infty } (x-\mu)\frac{1}{\sqrt{2πσ^2}}\exp{[-\frac{(x-μ)^2}{2σ^2}]}dx+\mu f(x) dx\\&=μ\end{split}\end{equation*}

分散の導出

E(X2)=x2f(x)dx={(xμ)2+2μxμ2}12πσ2e(xμ)22σ2dx=(xμ)212πσ2e(xμ)22σ2dx+μ2=σ212πey22dy+μ2=σ2+μ2V(X)=E(X2)(E(X))2=σ2\begin{equation*}\begin{split}E(X^2)&=\displaystyle \int_{ - \infty }^{ \infty } x^2f(x) dx\\&=\displaystyle \int_{ - \infty }^{ \infty }\{{(x-\mu)}^2+2\mu x-{\mu}^2\}\frac{1}{\sqrt{2\pi σ^2}}\mathrm{e}^{-\frac{{(x-\mu)}^2}{2σ^2}}dx\\&=\displaystyle \int_{ - \infty }^{ \infty }{(x-\mu)}^2\frac{1}{\sqrt{2\pi σ^2}}\mathrm{e}^{-\frac{{(x-\mu)}^2}{2σ^2}}dx+{\mu}^2\\&=σ^2\displaystyle \int_{ - \infty }^{ \infty }\frac{1}{\sqrt{2\pi }}\mathrm{e}^{-\frac{y^2}{2}}dy+{\mu }^2\\ &=σ^2+\mu^2\\\\ V(X)&=E(X^2)-{(E(X))}^{2}\\ &={\sigma}^{2} \end{split}\end{equation*}

指数型分布族の性質を利用した正規分布の期待値・分散の導出

正規分布は指数型分布族に属します。指数型分布族に属することの証明は「正規分布が指数型分布族に属することの証明」をご確認ください。

指数型分布族の性質を利用した正規分布の期待値と分散の導出は以下の通りです。

指数型分布族に関する説明は「指数型分布族とは?定義と性質をわかりやすく解説」、指数型分布族の性質を用いた期待値・分散の導出の詳細は「指数型分布族の性質を利用した期待値と分散の求め方」をそれぞれご確認ください。

期待値の導出

E(X)=E[a(X)]=c(μ)b(μ)=1σ2(μσ2)=μE(X) = E[a(X)] = -\frac{c'(\mu)}{b'(\mu)} = -\frac{\frac{1}{\sigma^2}}{\left(\frac{\mu}{\sigma^2}\right)} = \mu

分散の導出

Var(X)=Var[a(X)]=b(θ)c(θ)c(θ)b(θ)[b(θ)]3=0(1σ2)(1σ2)(1σ2)[1σ2]3=σ2Var(X) = Var[a(X)] = \frac{b''(\theta)c'(\theta) - c''(\theta)b'(\theta)}{[b'(\theta)]^3} = \frac{0 \cdot \left(-\frac{1}{\sigma^2}\right) - \left(-\frac{1}{\sigma^2}\right) \cdot \left(\frac{1}{\sigma^2}\right)}{\left[ \frac{1}{\sigma^2} \right]^3} =\sigma^2

正規分布の事後分布の平均・分散

正規分布に従う母集団からデータを取ってくるとき、共役事前分布は正規分布となります。

よって、事前分布を正規分布としたとき、事後分布は次のようなことが言えます。

母平均μ\mu、母分散σ2\sigma^2に従う正規母集団から大きさnnの標本を抽出し、標本平均x\overline{x}を得たとする。母平均μ\muの事前分布として平均η\eta、分散τ2\tau^2の正規分布をとるとき、μ\muの事後分布は

平均:nτ2x+σ2ηnτ2+σ2=nσ2x+1τ2ηnσ2+1τ2\frac{n\tau^2\overline{x}+\sigma^2\eta}{n\tau^2+\sigma^2}=\frac{\frac{n}{\sigma^2}\overline{x}+\frac{1}{\tau^2}\eta}{\frac{n}{\sigma^2}+\frac{1}{\tau^2}}

分散:τ2σ2nτ2+σ2=σ2τ2nσ2n+τ2\frac{\tau^2\sigma^2}{n\tau^2+\sigma^2}=\frac{\frac{\sigma^2\tau^2}{n}}{\frac{\sigma^2}{n}+\tau^2}

の正規分布に従う

具体的な導出過程は、「正規分布の事後分布の平均と分散」をご確認ください。

関連記事

正規分布の確率密度関数の成り立ち

正規分布の標準化

標準正規分布表の使い方

中心極限定理の例とメリットを分かりやすく解説

積率母関数を用いた正規分布の期待値(平均)と分散の導出

確率密度関数を用いた正規分布の期待値(平均)と分散の導出

正規分布の3つの性質とその証明

共役事前分布を分かりやすく解説

指数型分布族とは?定義と性質をわかりやすく解説

指数型分布族の性質を利用した期待値と分散の求め方

正規分布が指数型分布族に属することの証明

正規分布の事後分布の平均と分散

カテゴリ: 正規分布