正規分布

正規分布の定義

定義(正規分布)

連続型確率変数 \(X\) の確率密度関数 \(f\) が \(\mu\in\mathbb{R},~\sigma\gt 0\) として \[ f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\} \] であるとき、\(X\) は平均 \(\mu\) 、分散 \(\sigma^2\) の正規分布に従うといい \[ X\sim N(\mu,\sigma^2) \] と表す。
特に、\(\mu=0,~\sigma^2=1\) となる \(N(0,1)\) を標準正規分布という。

正規分布における確率の計算方法

確率変数 \(X\sim N(\mu,\sigma^2)\) が \(a\) 以上 \(b\) 以下となる確率は

\[ P(a\le X\le b)=\int_a^b\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\}dx \]

で与えられます。このままでは複雑なので \[ z=\frac{x-\mu}{\sigma} \] と変数変換すると

\[ \begin{align} P(a\le X\le b)&=\int_a^b\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\}dx\\ &=\int_{\frac{a-\mu}{\sigma}}^{\frac{b-\mu}{\sigma}}\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{z^2}{2}\right)\cdot\sigma dz\\ &=\int_{\frac{a-\mu}{\sigma}}^{\frac{b-\mu}{\sigma}}\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{z^2}{2}\right)dz \end{align} \]

となります。ここで \[ \frac{1}{\sqrt{2\pi}}\exp\left(-\frac{z^2}{2}\right) \] は標準正規分布の確率密度関数なので、確率変数 \(X\) を \[ Z=\frac{X-\mu}{\sigma} \] と変換すれば \(Z\) は標準正規分布 \(N(0,1)\) に従うことがわかります。

つまり、標準正規分布の上側確率 \[ Q(z)=\int_z^\infty\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{t^2}{2}\right)dt \] あるいは \[ \Phi(z)=\int_0^z\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{t^2}{2}\right)dt \] の値がわかれば、正規分布の確率が簡単に計算できます。 この \(Q(z)\) や \(\Phi(z)\) の値の近似値を表にまとめたものが正規分布表です。

二項分布の正規近似

定理(ド・モアブル-ラプラスの定理)

確率変数 \(X\) が二項分布 \(B(n,p)\) に従うとき、\(n\) が十分大きいならば、\(X\) の分布は正規分布 \(N(np,np(1-p))\) で近似される。

離散型の確率分布の正規近似

離散型の確率分布を連続型の確率分布に近似するとき、補正する必要があります。
離散型確率変数 \(X\) が \(m\le X\le n~~~(m,n\in\mathbb{Z})\) となる確率を求めるとき \[ P(m\le X\le n)=\sum_{x=m}^nP(X=x)=\sum_{x=m}^nP(X=x)\cdot1\fallingdotseq\int_{m+0.5}^{n+0.5}f(x)dx \] であるから、\(X\) を連続型と近似する場合は \(P(m+0.5\le X\le n+0.5)\) を考えなければならない。

演習問題

問題1

ある大学の男子の身長を調査したところ、平均170cm、標準偏差5cmの正規分布に従うことが分かった。

  1. 身長180cm以上の人は約何%いるか。
  2. 身長165cm以上175cm以下の人は約何%いるか。
  3. 身長の高い方から3%の中に入るのは、約何cm以上の人か。
解答

身長の確率変数を \(X\) とすると、\(X\sim N(170,~5)\) であり
\(Z=\displaystyle\frac{X-170}{5}\) とおくと、\(Z\sim N(0,~1)\) となる。

  1. \(\begin{align} P(X\ge 180)&=P\left(Z\ge \displaystyle\frac{180-170}{5}\right)=P(Z\ge 2)\\ &=0.5-\Phi(2)=0.5-0.4772=0.0228 \end{align}\)

    よって、約 \(2.3\) %いる。

問題2

表の出る確率が \(0.5\) であるコインを \(1000\) 回投げるとき、 表が \(460\) 回以上 \(520\) 回以下である確率を正規近似を用いて求めよ。

解答

表が出る回数を \(X\) とすると、\(X\sim B(1000,~0.5)\) である。
正規近似により \(X\sim N(500,250)\) が成り立つ。
\(Z=\displaystyle\frac{X-500}{\sqrt{250}}\) とおくと、\(Z\sim N(0,1)\) となる。
求める確率は半整数補正を施して

\[ \begin{align} P(460.5\le X\le520.5)&=P\left(\frac{460.5-500}{\sqrt{250}}\le Z\le\frac{520.5-500}{\sqrt{250}}\right)\\ &=P(-2.50\le Z\le1.30)\\ &=\Phi(2.50)+\Phi(1.30)\\ &=0.4938+0.4032\\ &=0.8977 \end{align} \]