ポアソン分布
ポアソン分布の定義
まず、次の問題を考える。
問題
ある工場では、1日に1万個の製品を生産しており、1つの製品が不良品となる確率は0.001%である。1日に不良品が10個発生する確率を求めよ。
1日に発生する不良品の個数を \(X\) とすると
\[
X\sim B\left(10000,\frac{1}{1000}\right)
\]
であり、求める確率は
\[
P(X=10)={_{10000}\mathrm{C}_{10}}\left(\frac{1}{10000}\right)^{10}\left(\frac{9990}{10000}\right)^{9990}
\]
となる。しかし、これを直接計算するのは現実的ではない。このように \(n\) が大きく、\(p\) が小さい場合、二項分布は扱いにくい。
二項分布の確率関数
\[
P(X=k)={_n\mathrm{C}_k}p^k(1-p)^{n-k}
\]
において \(np=\lambda\) として \(n\to\infty\) とする極限を考えると
\[
\begin{align}
&\lim_{n\to\infty}P(X=k)\\
&=\lim_{n\to\infty}\binom{n}{k}p^k(1-p)^{n-k}\\
&=\lim_{n\to\infty}\frac{n!}{(n-k)!k!}\left(\frac{\lambda}{n}\right)^k\left(1-\frac{\lambda}{n}\right)^{n-k}\\
&=\lim_{n\to\infty}\frac{\lambda^k}{k!}\cdot\frac{n(n-1)\cdots(n-k+1)}{n^k}\left(1-\frac{\lambda}{n}\right)^n\left(1-\frac{\lambda}{n}\right)^{-k}\\
&=\lim_{n\to\infty}\frac{\lambda^k}{k!}\left(1-\frac{1}{n}\right)\cdots\left(1-\frac{k-1}{n}\right)\left\{\left(1-\frac{\lambda}{n}\right)^{-\frac{n}{\lambda}}\right\}^{-\lambda}\left(1-\frac{\lambda}{n}\right)^{-k}\\
&=\frac{\lambda^k}{k!}e^{-\lambda}
\end{align}
\]
このことから、次のような分布を定義する。
定義(ポアソン分布)
離散型確率変数 \(X\) の確率質量関数 \(f\) が \(\lambda\gt0\) として
\[
f(x)=\frac{\lambda^x}{x!}e^{-\lambda}~~~(x\in\mathbb{Z}_{\ge0})\\
\]
であるとき、\(X\) は母数 \(\lambda\) のポアソン分布に従うといい
\[
X\sim Po(\lambda)
\]
と表す。
ポアソン分布の期待値と分散
定理(ポアソン分布の期待値と分散)
\(X\sim Po(\lambda)\) のとき
\[
E[X]=\lambda,~~~V[X]=\lambda
\]
演習問題
問題1
1%の確率で当たりが出るくじがある。このくじに100回挑戦するとき、当たりが少なくとも1回出る確率を求めよ。また、ポアソン分布での近似を使った確率を求めよ。ただし、引いたくじはもとに戻すものとする。
解答
当たりが出る回数を \(X\) とすると、\(X\sim Bin(100,0.01)\) であるから、求める確率は
\[
\begin{align}
P(X\ge1)&=1-P(X\lt1)\\
&=1-P(X=0)\\
&=1-{_{100}\mathrm{C}_0}\cdot0.01^0\cdot(1-0.01)^{100}\\
&=1-0.99^{100}\\
&=1-0.366\\
&=0.634
\end{align}
\]
ポアソン分布での近似を使うとき、\(\lambda=100\cdot0.01=1\) より、\(X\sim Po(1)\) であるから
\[
P(X\ge1)=1-\frac{1^0}{0!}e^{-1}=1-\frac{1}{e}=1-0.369=0.631
\]