カイ二乗分布

カイ二乗分布の定義

定義(カイ二乗分布)

互いに独立な確率変数 \(Z_1,Z_2,\cdots, Z_n\sim N(0,1)\) に対して

\[ W=Z_1^2+Z_2^2+\cdots+Z_n^2=\sum_{i=1}^nZ_i^2 \]

の従う確率分布を自由度 \(n\) のカイ二乗分布といい

\[ W\sim\chi^2(n) \]

と表す。

\(X_1,X_2,\cdots,X_n\sim N(\mu,\sigma^2)\) とすると

\[ \frac{X_i-\mu}{\sigma}\sim N(0,1) \]

であることから、次のようにも書けます。

\[ W=\sum_{i=1}^n\frac{(X_i-\mu)^2}{\sigma^2}\sim\chi^2(n) \]

カイ二乗分布の確率密度関数

定理(カイ二乗分布の確率密度関数)

確率変数 \(W\sim\chi^2(n)\) の確率密度関数 \(f_W\) は次式で表される。

\[ f_W(x)= \begin{cases} \displaystyle\frac{1}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}x^{\frac{n}{2}-1}e^{-\frac{x}{2}} & (\mathrm{if}~x\gt0)\\ 0 & (\mathrm{otherwise}) \end{cases} \]

カイ二乗分布の期待値と分散

カイ二乗分布の期待値は自由度に等しく、分散は自由度の \(2\) 倍に等しいです。

定理(カイ二乗分布の期待値と分散)

確率変数 \(W\sim\chi^2(n)\) に対して次が成り立つ。

\[ E[W]=n,\quad V[W]=2n \]

証明
\( \begin{align} E[X] &=\int_{-\infty}^\infty xf(x)dx\\ &=\int_0^\infty x\cdot\frac{1}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}x^{\frac{n}{2}-1}e^{-\frac{x}{2}}\\ &=\frac{1}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}\int_0^\infty x^{\frac{n}{2}}e^{-\frac{x}{2}}dx\\ &=\frac{2}{2^\frac{n}{2}\Gamma\left(\frac{n}{2}\right)}\int_0^\infty (2t)^{\frac{n}{2}}e^{-t}dt~~~(x=2t)\\ &=\frac{2}{\Gamma\left(\frac{n}{2}\right)}\int_0^\infty t^{\frac{n}{2}}e^{-t}dt\\ &=\frac{2}{\Gamma\left(\frac{n}{2}\right)}\Gamma\left(\frac{n}{2}+1\right)\\ &=\frac{2}{\Gamma\left(\frac{n}{2}\right)}\cdot\frac{n}{2}\Gamma\left(\frac{n}{2}\right)\\ &=n \end{align} \)

カイ二乗分布に従う確率変数

\(X_1,X_2,\cdots,X_n\sim N(\mu,\sigma^2)\) のとき、カイ二乗分布の定義から

\[ \sum_{i=1}^n\frac{(X_i-\mu)^2}{\sigma^2}\sim\chi^2(n) \]

ですが、平均 \(\mu\) をその不偏推定量である標本平均 \(\overline{X}\) で代用したもの

\[ \sum_{i=1}^n\frac{(X_i-\overline{X})^2}{\sigma^2} \]

の従う分布を考えてみます。 この確率変数は、標本から推定した \(\overline{X}\) を使用しているため、自由度は \(1\) つ下がると予想されます。 実際に、次の事実が成り立ちます。

定理(カイ二乗分布に従う確率変数)

無作為標本 \(X_1,X_2,\cdots,X_n\sim N(\mu,\sigma^2)\) の標本平均を \(\overline{X}\) 、不偏分散を \(U^2\) とするとき、次が成り立つ。

\[ \sum_{i=1}^n\frac{(X_i-\overline{X})^2}{\sigma^2}=\frac{(n-1)U^2}{\sigma^2}\sim \chi^2(n-1) \]
証明
\[ \begin{align} \frac{(n-1)U^2}{\sigma^2} &=\frac{1}{\sigma^2}\sum_{i=1}^n(X_i-\overline{X})^2\\ &=\frac{1}{\sigma^2}\sum_{i=1}^n\{(X_i-\mu)-(\overline{X}-\mu)\}^2\\ &=\frac{1}{\sigma^2}\sum_{i=1}^n\{(X_i-\mu)^2-2(X_i-\mu)(\overline{X}-\mu)+(\overline{X}-\mu)^2\}\\ &=\frac{1}{\sigma^2}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)\sum_{i=1}^n(X_i-\mu)+\sum_{i=1}^n(\overline{X}-\mu)^2\right\}\\ &=\frac{1}{\sigma^2}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)(n\overline{X}-n\mu)+n(\overline{X}-\mu)^2\right\}\\ &=\frac{1}{\sigma^2}\left\{\sum_{i=1}^n(X_i-\mu)^2-2n(\overline{X}-\mu)^2+n(\overline{X}-\mu)^2\right\}\\ &=\frac{1}{\sigma^2}\left\{\sum_{i=1}^n(X_i-\mu)^2-n(\overline{X}-\mu)^2\right\}\\ &=\sum_{i=1}^n\frac{(X_i-\mu)^2}{\sigma^2}-\frac{n(\overline{X}-\mu)^2}{\sigma^2} \\ &=\sum_{i=1}^n{\left(\frac{X_i-\mu}{\sigma}\right)}^2-{\left(\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\right)}^2 \end{align} \]

ここで

\[ \frac{X_i-\mu}{\sigma}\sim N(0,1),\quad \frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1) \]

より、カイ二乗分布の定義から

\[ \sum_{i=1}^n{\left(\frac{X_i-\mu}{\sigma}\right)}^2\sim \chi^2(n),~~~~~{\left(\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\right)}^2\sim\chi^2(1) \]

カイ二乗分布の自由度の加法性より

\[ \frac{(n-1)U^2}{\sigma^2}\sim\chi^2(n-1) \]