母分散の検定(カイ二乗検定)

母分散の検定統計量

母集団を正規母集団と仮定します。
正規母集団 \(N(\mu,\sigma^2)\) から抽出した \(n\) 個の無作為標本を \[ X_1,~~~X_2,~~~\cdots,~~~X_{n} \] とし、この標本平均を \(\overline{X}\) とすると、この不偏分散は \[ S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2 \] となります。
これを検定統計量としたいところですが、従う分布が不明です。
そこで、次のように変形します。

\[ \begin{align} S^2&=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2\\ &=\frac{1}{n-1}\sum_{i=1}^n\{(X_i-\mu)-(\overline{X}-\mu)\}^2\\ &=\frac{1}{n-1}\sum_{i=1}^n\{(X_i-\mu)^2-2(X_i-\mu)(\overline{X}-\mu)+(\overline{X}-\mu)^2\}\\ &=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)\sum_{i=1}^n(X_i-\mu)+\sum_{i=1}^n(\overline{X}-\mu)^2\right\}\\ &=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)(n\overline{X}-n\mu)+n(\overline{X}-\mu)^2\right\}\\ &=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2n(\overline{X}-\mu)^2+n(\overline{X}-\mu)^2\right\}\\ &=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-n(\overline{X}-\mu)^2\right\}\\ \end{align} \]

よって \[ S^2=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-n(\overline{X}-\mu)^2\right\} \] が成り立ち、この両辺に \(\displaystyle\frac{n-1}{\sigma^2}\) を掛けると \[ \frac{(n-1)S^2}{\sigma^2}=\sum_{i=1}^n{\left(\frac{X_i-\mu}{\sigma}\right)}^2-{\left(\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\right)}^2 \] ここで \[ \frac{X_i-\mu}{\sigma}\sim N(0,1),~~~\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1) \] より \[ \sum_{i=1}^n{\left(\frac{X_i-\mu}{\sigma}\right)}^2\sim \chi^2(n),~~~~~{\left(\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\right)}^2\sim\chi^2(1) \] となります。
カイ二乗分布の自由度の加法性より \[ \frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1) \] となり、これが検定統計量となります。
カイ二乗分布に従う検定統計量を用いた検定をカイ二乗検定といいます。

t検定を手計算で行う場合は棄却域法を用います。

仮説検定の流れ(棄却域法)
  1. 帰無仮説・対立仮説を立てる
  2. 検定統計量を計算する
  3. 有意水準を決める
  4. 棄却域を求める
  5. 検定統計量の実現値が棄却域に入るかを見る

カイ二乗分布において、p値の計算は手計算では困難です。
一方で、統計ソフトを用いる場合はp値法が主流です。

仮説検定の流れ(p値法)
  1. 帰無仮説・対立仮説を立てる
  2. 検定統計量を計算する
  3. 有意水準を決める
  4. p値を計算する
  5. p値が有意水準未満かを見る

例題

以下では棄却域法を用います。

例題

あるネジ工場では、ネジの直径のばらつき(分散)が \(0.01~\mathrm{mm^2}\) 以下であることを品質基準にしています。 ランダムに \(20\) 本のネジを測定したところ、標本分散は \(0.018~\mathrm{mm^2}\) でした。
ばらつきは許容範囲を超えているか、有意水準 \(5\%\) で判断してください。

1. 帰無仮説・対立仮説を立てる

母分散を \(\sigma^2\) として、次のように仮説を立てます。

帰無仮説 \(H_0:\sigma^2\le0.01\)
対立仮説 \(H_1:\sigma\gt0.01\)

よって、右側検定を行います。

2. 検定統計量を計算する

検定統計量を \[ \chi^2=\frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1) \] とすると、\(\chi^2\) の実現値 \(\chi^2_0\) は \[ \chi^2_0=\frac{(20-1)\cdot0.018^2}{0.01}=34.2 \] となります。

3. 有意水準を定める

本問では有意水準 \(\alpha\) は \(5\%\) と与えられているので \[ \alpha=0.05 \] です。

4. 棄却域を求める

上側 \(\alpha\%\) 点を求めます。
自由度 \(19\) の上側 \(5\%\) 点とは \[ P(\chi^2\ge \chi^2_{0.05}(19))=0.05 \] となるような \(\chi^2_{0.05}(19)\) です。
カイ二乗分布のパーセント点表より \[ \chi^2_{0.05}(19)=30.14 \] とわかります。
したがって、棄却域は \[ \chi^2\gt30.14 \] となります。

検定統計量の実現値が棄却域に入るかを見る

検定統計量の実現値は \[ \chi^2_0=34.2 \] であり、これは棄却域 \[ \chi^2\gt30.14 \] に入ります。
よって、帰無仮説 \(H_0\) を棄却し、対立仮説 \(H_1\) を採択します。
ネジの直径のばらつきは \(0.01~\mathrm{mm^2}\) を超えていると言えます。
このように、p値法のときと同じ結論が得られます。