指数分布

指数分布の定義

単位時間に平均 \(\lambda\) 回起こる事象が、\(x\) 単位時間の間隔で起こる確率を表す確率分布です。 ある事象がランダムに起こるとき、その次に事象が起こるまでの待ち時間が従う確率分布です。

\(X\) を「次に事象が起こるまでの時間」とします。

・事象は一定の割合 \(\lambda\) (単位時間あたり)で起こる
・事象が起こる確率は過去に起きたかどうかに関係しない

\(X\) の確率分布を求めたいので、まず累積分布関数 \(F(x)\) を考えます。確率密度関数は

\[ f(x)=\frac{d}{dx}F(x) \]

の関係から得られます。

累積分布関数とは

\[ F(x)=P(X\le x) \]

と定義される関数でした。これは

「\(X\) が \(x\) 以下である確率」

つまり

「時間 \(x\) 以内で次の事象が起こる確率」

を表しています。

この場合、「時間 \(x\) ではまだ起きていない確率」の方が考えやすいです。時間 \(x\) ではまだ起きていない確率を \(G(x)\) とすると

\[ F(x)=P(X\le x)=1-G(x) \]

となります。

ここでは、まずこの \(G(x)\) を求めます。

時間 \(x+\varDelta x\) の時点でまだ起きていない確率は、
「時間 \(x\) まで起きていない」確率と、
「そこからさらに時間 \(\varDelta x\) 後でも起きていない」確率の積と考えられます。

\[ G(x+\varDelta x)=G(x)(1-\lambda\varDelta x) \]

これを整理して

\[ \frac{G(x+\varDelta x)-G(x)}{\varDelta x}=-\lambda G(x) \]

とし、\(\varDelta x\to0\) の極限をとると

\[ \frac{dG(x)}{dx}=-\lambda G(x) \]

という微分方程式が得られます。これの一般解は

\[ G(x)=Ce^{-\lambda x} \]

です。初期条件 \(G(0)=1\)(時間0ではまだ何も起きていない)より \(C=1\) となり

\[ G(x)=e^{-\lambda x} \]

とわかりました。

よって、累積分布関数は

\[ F(x)=1-G(x)=1-e^{-\lambda x} \]

となります。

これを微分すれば、確率密度関数が得られます:

\[ f(x)=\frac{dF(x)}{dx}=\lambda e^{-\lambda x} \]

これを指数分布といい、次のように定義されます。

定義(指数分布)

連続型確率変数 \(X\) の確率密度関数 \(f\) が、\(\lambda\gt0\) として

\[ f(x)= \begin{cases} \lambda e^{-\lambda x} & (\mathrm{if}~x\gt0)\\ 0 & (\mathrm{otherwise}) \end{cases} \]

であるとき、\(X\) はパラメータ \(\lambda\) の指数分布に従うといい

\[ X\sim Ex(\lambda) \]

と表す。

指数分布に従う確率変数の期待値と分散

定理(指数分布に従う確率変数の期待値と分散)

\(X\sim Ex(\lambda)\) のとき、次式が成り立つ。

\[ E[X]=\frac{1}{\lambda},~~~~~V[X]=\frac{1}{\lambda^2} \]
証明
\( \begin{align} E[X] &=\int_{-\infty}^\infty xf(x)dx\\ &=\int_0^\infty x\cdot\lambda e^{-\lambda x}dx\\ &=\int_0^\infty x\left(-e^{-\lambda x}\right)'dx\\ &=\left[-xe^{-\lambda x}\right]_0^\infty+\int_0^\infty e^{-\lambda x}dx\\ &=\left[-\frac{1}{\lambda}e^{-\lambda x}\right]_0^\infty\\ &=\frac{1}{\lambda} \end{align} \)

\( \begin{align} V[X] &=E[X^2]-E[X]^2\\ &=\int_{-\infty}^\infty x^2f(x)dx-\frac{1}{\lambda^2}\\ &=\int_0^\infty x^2\cdot\lambda e^{-\lambda x}dx-\frac{1}{\lambda^2}\\ &=\int_0^\infty x^2\left(-e^{-\lambda x}\right)'dx-\frac{1}{\lambda^2}\\ &=\left[-x^2e^{-\lambda x}\right]_0^\infty+\int_0^\infty 2xe^{-\lambda x}dx-\frac{1}{\lambda^2}\\ &=\int_0^\infty2x\left(-\frac{1}{\lambda}e^{-\lambda x}\right)'dx-\frac{1}{\lambda^2}\\ &=\left[-\frac{2}{\lambda}xe^{-\lambda x}\right]_0^\infty+\int_0^\infty\frac{2}{\lambda}e^{-\lambda x}dx-\frac{1}{\lambda^2}\\ &=\left[-\frac{2}{\lambda^2}e^{-\lambda x}\right]_0^\infty-\frac{1}{\lambda^2}\\ &=\frac{2}{\lambda^2}-\frac{1}{\lambda^2}\\ &=\frac{1}{\lambda^2} \end{align} \)

指数分布に従う具体例

例題

1時間に平均20人が来店する飲食店がある。この飲食店にある客が来てから次の客が5分以内に来店する確率を求めよ。

客の来店間隔を \(X\) 時間とします。
\(X\sim Ex(20)\) であるから \(X\) の確率密度関数は

\[ f(x)=20e^{-20x}~~~(x\gt0) \]

です。また、

\[ 5\text{分}=\frac{5}{60}\text{時間}=\frac{1}{12}\text{時間} \]

なので、求める確率は

\[ \begin{align} P\left(0\lt X\le\frac{1}{12}\right) &=\int_0^{\frac{1}{12}}20e^{-20x}dx\\ &=\left[-e^{-20x}\right]_0^\frac{1}{12}\\ &=1-e^{-\frac{5}{3}}\\ &\fallingdotseq1-0.189\\ &=0.811 \end{align} \]

指数分布の無記憶性

定理(指数分布の無記憶性)

\(X\sim Ex(\lambda)\) とし、\(s,t\in\mathbb{R}_{\ge0}\) とすると次式が成り立つ。

\[ P(X\gt s+t~|~X\gt s)=P(X\gt t) \]
証明
\[ \begin{align} P(X\gt s+t~|~X\gt s) &=\frac{P(\{X\gt s+t\}\land\{X\gt s\})}{P(X\gt s)}\\ &=\frac{P(X\gt s+t)}{P(X\gt s)}\\ &=\frac{\displaystyle\int_{s+t}^\infty\lambda e^{-\lambda x}dx}{\displaystyle\int_{s}^\infty\lambda e^{-\lambda x}dx}=\frac{\left[-e^{-\lambda x}\right]_{s+t}^\infty}{\left[-e^{-\lambda x}\right]_{s}^\infty}\\ &=\frac{e^{-\lambda(s+t)}}{e^{-\lambda s}}=e^{-\lambda t} \end{align} \] \[ P(X\gt t)=\int_{t}^\infty\lambda e^{-\lambda x}dx=\left[-e^{-\lambda x}\right]_t^\infty=e^{-\lambda t} \]

したがって

\[ P(X\gt s+t~|~X\gt s)=P(X\gt t) \]

無記憶性を持つ確率分布は指数分布のみです。

演習問題

問題
解答