正規分布
正規分布の定義
連続型確率変数 \(X\) の確率密度関数 \(f\) が \(\mu\in\mathbb{R},~\sigma\gt 0\) として
\[
f(x)=\frac{1}{\sqrt{2\pi\sigma^2}}\exp\left\{-\frac{(x-\mu)^2}{2\sigma^2}\right\}
\]
であるとき、\(X\) は平均 \(\mu\) 、分散 \(\sigma^2\) の正規分布に従うといい
\[
X\sim N(\mu,\sigma^2)
\]
と表す。
特に、\(\mu=0,~\sigma^2=1\) となる \(N(0,1)\) を標準正規分布という。
正規分布における確率の計算方法
確率変数 \(X\sim N(\mu,\sigma^2)\) が \(a\) 以上 \(b\) 以下となる確率は
で与えられます。このままでは複雑なので \[ z=\frac{x-\mu}{\sigma} \] と変数変換すると
となります。ここで \[ \frac{1}{\sqrt{2\pi}}\exp\left(-\frac{z^2}{2}\right) \] は標準正規分布の確率密度関数なので、確率変数 \(X\) を \[ Z=\frac{X-\mu}{\sigma} \] と変換すれば \(Z\) は標準正規分布 \(N(0,1)\) に従うことがわかります。
つまり、標準正規分布の上側確率 \[ Q(z)=\int_z^\infty\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{t^2}{2}\right)dt \] あるいは \[ \Phi(z)=\int_0^z\frac{1}{\sqrt{2\pi}}\exp\left(-\frac{t^2}{2}\right)dt \] の値がわかれば、正規分布の確率が簡単に計算できます。 この \(Q(z)\) や \(\Phi(z)\) の値の近似値を表にまとめたものが正規分布表です。
二項分布の正規近似
確率変数 \(X\) が二項分布 \(B(n,p)\) に従うとき、\(n\) が十分大きいならば、\(X\) の分布は正規分布 \(N(np,np(1-p))\) で近似される。
離散型の確率分布の正規近似
離散型の確率分布を連続型の確率分布に近似するとき、補正する必要があります。
離散型確率変数 \(X\) が \(m\le X\le n~~~(m,n\in\mathbb{Z})\) となる確率を求めるとき
\[
P(m\le X\le n)=\sum_{x=m}^nP(X=x)=\sum_{x=m}^nP(X=x)\cdot1\fallingdotseq\int_{m+0.5}^{n+0.5}f(x)dx
\]
であるから、\(X\) を連続型と近似する場合は \(P(m+0.5\le X\le n+0.5)\) を考えなければならない。
演習問題
ある大学の男子の身長を調査したところ、平均170cm、標準偏差5cmの正規分布に従うことが分かった。
- 身長180cm以上の人は約何%いるか。
- 身長165cm以上175cm以下の人は約何%いるか。
- 身長の高い方から3%の中に入るのは、約何cm以上の人か。
解答
身長の確率変数を \(X\) とすると、\(X\sim N(170,~5)\) であり
\(Z=\displaystyle\frac{X-170}{5}\) とおくと、\(Z\sim N(0,~1)\) となる。
- \(\begin{align} P(X\ge 180)&=P\left(Z\ge \displaystyle\frac{180-170}{5}\right)=P(Z\ge 2)\\ &=0.5-\Phi(2)=0.5-0.4772=0.0228 \end{align}\) よって、約 \(2.3\) %いる。
表の出る確率が \(0.5\) であるコインを \(1000\) 回投げるとき、 表が \(460\) 回以上 \(520\) 回以下である確率を正規近似を用いて求めよ。
解答
表が出る回数を \(X\) とすると、\(X\sim B(1000,~0.5)\) である。
正規近似により \(X\sim N(500,250)\) が成り立つ。
\(Z=\displaystyle\frac{X-500}{\sqrt{250}}\) とおくと、\(Z\sim N(0,1)\) となる。
求める確率は半整数補正を施して