カイ二乗分布

カイ二乗分布の定義

定義(カイ二乗分布)

互いに独立な確率変数 \(Z_1,Z_2,\cdots, Z_n\sim N(0,1)\) に対して

\[ X=Z_1^2+Z_2^2+\cdots+Z_n^2=\sum_{i=1}^nZ_i^2 \]

で定まる \(X\) が従う確率分布を自由度 \(n\) のカイ二乗分布といい

\[ X\sim \chi^2(n) \]

と表す。

カイ二乗分布の確率密度関数

定理(カイ二乗分布の確率密度関数)

確率変数 \(X\sim\chi^2(n)\) の確率密度関数 \(f\) は次式で表される。

\[ f(x)= \begin{cases} \displaystyle\frac{1}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}x^{\frac{n}{2}-1}e^{-\frac{x}{2}} & (\mathrm{if}~x\gt0)\\ 0 & (\mathrm{otherwise}) \end{cases} \]

カイ二乗分布に従う確率変数の期待値と分散

定理(カイ二乗分布に従う確率変数の期待値と分散)

確率変数 \(X\sim\chi^2(n)\) に対して次が成り立つ。

\[ E[X]=n,\quad V[X]=2n \]

証明
\( \begin{align} E[X] &=\int_{-\infty}^\infty xf(x)dx\\ &=\int_0^\infty x\cdot\frac{1}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}x^{\frac{n}{2}-1}e^{-\frac{x}{2}}\\ &=\frac{1}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}\int_0^\infty x^{\frac{n}{2}}e^{-\frac{x}{2}}dx\\ &=\frac{2}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}\int_0^\infty (2t)^{\frac{n}{2}}e^{-t}dt~~~(x=2t)\\ &=\frac{2}{\Gamma\left(\frac{n}{2}\right)}\int_0^\infty t^{\frac{n}{2}}e^{-t}dt\\ &=\frac{2}{\Gamma\left(\frac{n}{2}\right)}\Gamma\left(\frac{n}{2}+1\right)\\ &=\frac{2}{\Gamma\left(\frac{n}{2}\right)}\cdot\frac{n}{2}\Gamma\left(\frac{n}{2}\right)\\ &=n \end{align} \)

カイ二乗分布に従う確率変数

定理(カイ二乗分布に従う確率変数)

不偏分散 \(U^2\) に対して次が成り立つ。

\[ \frac{(n-1)U^2}{\sigma^2}\sim \chi^2(n-1) \]
\[ \begin{align} U^2&=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2\\ &=\frac{1}{n-1}\sum_{i=1}^n\{(X_i-\mu)-(\overline{X}-\mu)\}^2\\ &=\frac{1}{n-1}\sum_{i=1}^n\{(X_i-\mu)^2-2(X_i-\mu)(\overline{X}-\mu)+(\overline{X}-\mu)^2\}\\ &=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)\sum_{i=1}^n(X_i-\mu)+\sum_{i=1}^n(\overline{X}-\mu)^2\right\}\\ &=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)(n\overline{X}-n\mu)+n(\overline{X}-\mu)^2\right\}\\ &=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2n(\overline{X}-\mu)^2+n(\overline{X}-\mu)^2\right\}\\ &=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-n(\overline{X}-\mu)^2\right\}\\ \end{align} \]