カイ二乗分布
カイ二乗分布の定義
互いに独立な確率変数 \(Z_1,Z_2,\cdots, Z_n\sim N(0,1)\) に対して
\[
X=Z_1^2+Z_2^2+\cdots+Z_n^2=\sum_{i=1}^nZ_i^2
\]
で定まる \(X\) が従う確率分布を自由度 \(n\) のカイ二乗分布といい
\[
X\sim \chi^2(n)
\]
と表す。
カイ二乗分布の確率密度関数
確率変数 \(X\sim\chi^2(n)\) の確率密度関数 \(f\) は次式で表される。
\[
f(x)=
\begin{cases}
\displaystyle\frac{1}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}x^{\frac{n}{2}-1}e^{-\frac{x}{2}} & (\mathrm{if}~x\gt0)\\
0 & (\mathrm{otherwise})
\end{cases}
\]
カイ二乗分布に従う確率変数の期待値と分散
確率変数 \(X\sim\chi^2(n)\) に対して次が成り立つ。
\[
E[X]=n,\quad V[X]=2n
\]
証明
\(
\begin{align}
E[X]
&=\int_{-\infty}^\infty xf(x)dx\\
&=\int_0^\infty x\cdot\frac{1}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}x^{\frac{n}{2}-1}e^{-\frac{x}{2}}\\
&=\frac{1}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}\int_0^\infty x^{\frac{n}{2}}e^{-\frac{x}{2}}dx\\
&=\frac{2}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}\int_0^\infty (2t)^{\frac{n}{2}}e^{-t}dt~~~(x=2t)\\
&=\frac{2}{\Gamma\left(\frac{n}{2}\right)}\int_0^\infty t^{\frac{n}{2}}e^{-t}dt\\
&=\frac{2}{\Gamma\left(\frac{n}{2}\right)}\Gamma\left(\frac{n}{2}+1\right)\\
&=\frac{2}{\Gamma\left(\frac{n}{2}\right)}\cdot\frac{n}{2}\Gamma\left(\frac{n}{2}\right)\\
&=n
\end{align}
\)
カイ二乗分布に従う確率変数
不偏分散 \(U^2\) に対して次が成り立つ。
\[
\frac{(n-1)U^2}{\sigma^2}\sim \chi^2(n-1)
\]
\[
\begin{align}
U^2&=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2\\
&=\frac{1}{n-1}\sum_{i=1}^n\{(X_i-\mu)-(\overline{X}-\mu)\}^2\\
&=\frac{1}{n-1}\sum_{i=1}^n\{(X_i-\mu)^2-2(X_i-\mu)(\overline{X}-\mu)+(\overline{X}-\mu)^2\}\\
&=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)\sum_{i=1}^n(X_i-\mu)+\sum_{i=1}^n(\overline{X}-\mu)^2\right\}\\
&=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)(n\overline{X}-n\mu)+n(\overline{X}-\mu)^2\right\}\\
&=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2n(\overline{X}-\mu)^2+n(\overline{X}-\mu)^2\right\}\\
&=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-n(\overline{X}-\mu)^2\right\}\\
\end{align}
\]