指数分布
指数分布の定義
単位時間に平均 \(\lambda\) 回起こる事象が、\(x\) 単位時間の間隔で起こる確率を表す確率分布です。
ある事象がランダムに起こるとき、その次に事象が起こるまでの待ち時間が従う確率分布です。
\(X\) を「次に事象が起こるまでの時間」とします。
・事象は一定の割合 \(\lambda\) (単位時間あたり)で起こる
・事象が起こる確率は過去に起きたかどうかに関係しない
\(X\) の確率分布を求めたいので、まず累積分布関数 \(F(x)\) を考えます。確率密度関数は
\[
f(x)=\frac{d}{dx}F(x)
\]
の関係から得られます。
累積分布関数とは
\[
F(x)=P(X\le x)
\]
と定義される関数でした。これは
「\(X\) が \(x\) 以下である確率」
つまり
「時間 \(x\) 以内で次の事象が起こる確率」
を表しています。
この場合、「時間 \(x\) ではまだ起きていない確率」の方が考えやすいです。時間 \(x\) ではまだ起きていない確率を \(G(x)\) とすると
\[
F(x)=P(X\le x)=1-G(x)
\]
となります。
ここでは、まずこの \(G(x)\) を求めます。
時間 \(x+\varDelta x\) の時点でまだ起きていない確率は、
「時間 \(x\) まで起きていない」確率と、
「そこからさらに時間 \(\varDelta x\) 後でも起きていない」確率の積と考えられます。
\[
G(x+\varDelta x)=G(x)(1-\lambda\varDelta x)
\]
これを整理して
\[
\frac{G(x+\varDelta x)-G(x)}{\varDelta x}=-\lambda G(x)
\]
とし、\(\varDelta x\to0\) の極限をとると
\[
\frac{dG(x)}{dx}=-\lambda G(x)
\]
という微分方程式が得られます。これの一般解は
\[
G(x)=Ce^{-\lambda x}
\]
です。初期条件 \(G(0)=1\)(時間0ではまだ何も起きていない)より \(C=1\) となり
\[
G(x)=e^{-\lambda x}
\]
とわかりました。
よって、累積分布関数は
\[
F(x)=1-G(x)=1-e^{-\lambda x}
\]
となります。
これを微分すれば、確率密度関数が得られます:
\[
f(x)=\frac{dF(x)}{dx}=\lambda e^{-\lambda x}
\]
これを指数分布といい、次のように定義されます。
定義(指数分布)
連続型確率変数 \(X\) の確率密度関数 \(f\) が、\(\lambda\gt0\) として
\[
f(x)=
\begin{cases}
\lambda e^{-\lambda x} & (\mathrm{if}~x\gt0)\\
0 & (\mathrm{otherwise})
\end{cases}
\]
であるとき、\(X\) はパラメータ \(\lambda\) の指数分布に従うといい
\[
X\sim Ex(\lambda)
\]
と表す。
指数分布に従う確率変数の期待値と分散
定理(指数分布に従う確率変数の期待値と分散)
\(X\sim Ex(\lambda)\) のとき、次式が成り立つ。
\[
E[X]=\frac{1}{\lambda},~~~~~V[X]=\frac{1}{\lambda^2}
\]
証明
\(
\begin{align}
E[X]
&=\int_{-\infty}^\infty xf(x)dx\\
&=\int_0^\infty x\cdot\lambda e^{-\lambda x}dx\\
&=\int_0^\infty x\left(-e^{-\lambda x}\right)'dx\\
&=\left[-xe^{-\lambda x}\right]_0^\infty+\int_0^\infty e^{-\lambda x}dx\\
&=\left[-\frac{1}{\lambda}e^{-\lambda x}\right]_0^\infty\\
&=\frac{1}{\lambda}
\end{align}
\)
\(
\begin{align}
V[X]
&=E[X^2]-E[X]^2\\
&=\int_{-\infty}^\infty x^2f(x)dx-\frac{1}{\lambda^2}\\
&=\int_0^\infty x^2\cdot\lambda e^{-\lambda x}dx-\frac{1}{\lambda^2}\\
&=\int_0^\infty x^2\left(-e^{-\lambda x}\right)'dx-\frac{1}{\lambda^2}\\
&=\left[-x^2e^{-\lambda x}\right]_0^\infty+\int_0^\infty 2xe^{-\lambda x}dx-\frac{1}{\lambda^2}\\
&=\int_0^\infty2x\left(-\frac{1}{\lambda}e^{-\lambda x}\right)'dx-\frac{1}{\lambda^2}\\
&=\left[-\frac{2}{\lambda}xe^{-\lambda x}\right]_0^\infty+\int_0^\infty\frac{2}{\lambda}e^{-\lambda x}dx-\frac{1}{\lambda^2}\\
&=\left[-\frac{2}{\lambda^2}e^{-\lambda x}\right]_0^\infty-\frac{1}{\lambda^2}\\
&=\frac{2}{\lambda^2}-\frac{1}{\lambda^2}\\
&=\frac{1}{\lambda^2}
\end{align}
\)
指数分布に従う具体例
例題
1時間に平均20人が来店する飲食店がある。この飲食店にある客が来てから次の客が5分以内に来店する確率を求めよ。
客の来店間隔を \(X\) 時間とします。
\(X\sim Ex(20)\) であるから \(X\) の確率密度関数は
\[
f(x)=20e^{-20x}~~~(x\gt0)
\]
です。また、
\[
5\text{分}=\frac{5}{60}\text{時間}=\frac{1}{12}\text{時間}
\]
なので、求める確率は
\[
\begin{align}
P\left(0\lt X\le\frac{1}{12}\right)
&=\int_0^{\frac{1}{12}}20e^{-20x}dx\\
&=\left[-e^{-20x}\right]_0^\frac{1}{12}\\
&=1-e^{-\frac{5}{3}}\\
&\fallingdotseq1-0.189\\
&=0.811
\end{align}
\]
指数分布の無記憶性
定理(指数分布の無記憶性)
\(X\sim Ex(\lambda)\) とし、\(s,t\in\mathbb{R}_{\ge0}\) とすると次式が成り立つ。
\[
P(X\gt s+t~|~X\gt s)=P(X\gt t)
\]
証明
\[
\begin{align}
P(X\gt s+t~|~X\gt s)
&=\frac{P(\{X\gt s+t\}\land\{X\gt s\})}{P(X\gt s)}\\
&=\frac{P(X\gt s+t)}{P(X\gt s)}\\
&=\frac{\displaystyle\int_{s+t}^\infty\lambda e^{-\lambda x}dx}{\displaystyle\int_{s}^\infty\lambda e^{-\lambda x}dx}=\frac{\left[-e^{-\lambda x}\right]_{s+t}^\infty}{\left[-e^{-\lambda x}\right]_{s}^\infty}\\
&=\frac{e^{-\lambda(s+t)}}{e^{-\lambda s}}=e^{-\lambda t}
\end{align}
\]
\[
P(X\gt t)=\int_{t}^\infty\lambda e^{-\lambda x}dx=\left[-e^{-\lambda x}\right]_t^\infty=e^{-\lambda t}
\]
したがって
\[
P(X\gt s+t~|~X\gt s)=P(X\gt t)
\]
無記憶性を持つ確率分布は指数分布のみです。