カイ二乗分布
カイ二乗分布の定義
定義(カイ二乗分布)
互いに独立な確率変数 \(Z_1,Z_2,\cdots, Z_n\sim N(0,1)\) に対して
\[
W=Z_1^2+Z_2^2+\cdots+Z_n^2=\sum_{i=1}^nZ_i^2
\]
の従う確率分布を自由度 \(n\) のカイ二乗分布といい
\[
W\sim\chi^2(n)
\]
と表す。
\(X_1,X_2,\cdots,X_n\sim N(\mu,\sigma^2)\) とすると
\[
\frac{X_i-\mu}{\sigma}\sim N(0,1)
\]
であることから、次のようにも書けます。
\[
W=\sum_{i=1}^n\frac{(X_i-\mu)^2}{\sigma^2}\sim\chi^2(n)
\]
カイ二乗分布の確率密度関数
定理(カイ二乗分布の確率密度関数)
確率変数 \(W\sim\chi^2(n)\) の確率密度関数 \(f_W\) は次式で表される。
\[
f_W(x)=
\begin{cases}
\displaystyle\frac{1}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}x^{\frac{n}{2}-1}e^{-\frac{x}{2}} & (\mathrm{if}~x\gt0)\\
0 & (\mathrm{otherwise})
\end{cases}
\]
カイ二乗分布の期待値と分散
カイ二乗分布の期待値は自由度に等しく、分散は自由度の \(2\) 倍に等しいです。
定理(カイ二乗分布の期待値と分散)
確率変数 \(W\sim\chi^2(n)\) に対して次が成り立つ。
\[
E[W]=n,\quad V[W]=2n
\]
証明
\(
\begin{align}
E[X]
&=\int_{-\infty}^\infty xf(x)dx\\
&=\int_0^\infty x\cdot\frac{1}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}x^{\frac{n}{2}-1}e^{-\frac{x}{2}}\\
&=\frac{1}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}\int_0^\infty x^{\frac{n}{2}}e^{-\frac{x}{2}}dx\\
&=\frac{2}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}\int_0^\infty (2t)^{\frac{n}{2}}e^{-t}dt~~~(x=2t)\\
&=\frac{2}{\Gamma\left(\frac{n}{2}\right)}\int_0^\infty t^{\frac{n}{2}}e^{-t}dt\\
&=\frac{2}{\Gamma\left(\frac{n}{2}\right)}\Gamma\left(\frac{n}{2}+1\right)\\
&=\frac{2}{\Gamma\left(\frac{n}{2}\right)}\cdot\frac{n}{2}\Gamma\left(\frac{n}{2}\right)\\
&=n
\end{align}
\)
カイ二乗分布に従う確率変数
\(X_1,X_2,\cdots,X_n\sim N(\mu,\sigma^2)\) のとき、カイ二乗分布の定義から
\[
\sum_{i=1}^n\frac{(X_i-\mu)^2}{\sigma^2}\sim\chi^2(n)
\]
ですが、平均 \(\mu\) をその不偏推定量である標本平均 \(\overline{X}\) で代用したもの
\[
\sum_{i=1}^n\frac{(X_i-\overline{X})^2}{\sigma^2}
\]
の従う分布を考えてみます。
この確率変数は、標本から推定した \(\overline{X}\) を使用しているため、自由度は \(1\) つ下がると予想されます。
実際に、次の事実が成り立ちます。
定理(カイ二乗分布に従う確率変数)
無作為標本 \(X_1,X_2,\cdots,X_n\sim N(\mu,\sigma^2)\) の標本平均を \(\overline{X}\) 、不偏分散を \(U^2\) とするとき、次が成り立つ。
\[
\sum_{i=1}^n\frac{(X_i-\overline{X})^2}{\sigma^2}=\frac{(n-1)U^2}{\sigma^2}\sim \chi^2(n-1)
\]
証明
\[
\begin{align}
\frac{(n-1)U^2}{\sigma^2}
&=\frac{1}{\sigma^2}\sum_{i=1}^n(X_i-\overline{X})^2\\
&=\frac{1}{\sigma^2}\sum_{i=1}^n\{(X_i-\mu)-(\overline{X}-\mu)\}^2\\
&=\frac{1}{\sigma^2}\sum_{i=1}^n\{(X_i-\mu)^2-2(X_i-\mu)(\overline{X}-\mu)+(\overline{X}-\mu)^2\}\\
&=\frac{1}{\sigma^2}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)\sum_{i=1}^n(X_i-\mu)+\sum_{i=1}^n(\overline{X}-\mu)^2\right\}\\
&=\frac{1}{\sigma^2}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)(n\overline{X}-n\mu)+n(\overline{X}-\mu)^2\right\}\\
&=\frac{1}{\sigma^2}\left\{\sum_{i=1}^n(X_i-\mu)^2-2n(\overline{X}-\mu)^2+n(\overline{X}-\mu)^2\right\}\\
&=\frac{1}{\sigma^2}\left\{\sum_{i=1}^n(X_i-\mu)^2-n(\overline{X}-\mu)^2\right\}\\
&=\sum_{i=1}^n\frac{(X_i-\mu)^2}{\sigma^2}-\frac{n(\overline{X}-\mu)^2}{\sigma^2} \\
&=\sum_{i=1}^n{\left(\frac{X_i-\mu}{\sigma}\right)}^2-{\left(\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\right)}^2
\end{align}
\]
ここで
\[
\frac{X_i-\mu}{\sigma}\sim N(0,1),\quad \frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1)
\]
より、カイ二乗分布の定義から
\[
\sum_{i=1}^n{\left(\frac{X_i-\mu}{\sigma}\right)}^2\sim \chi^2(n),~~~~~{\left(\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\right)}^2\sim\chi^2(1)
\]
カイ二乗分布の自由度の加法性より
\[
\frac{(n-1)U^2}{\sigma^2}\sim\chi^2(n-1)
\]