母分散の区間推定と検定

母分散の検定統計量

母分散の区間推定と検定を行うための統計量を作成します。

正規母集団 \(N(\mu,\sigma^2)\) から \(n\) 個の無作為標本

\[ X_1,X_2,\cdots,X_{n}\sim N(\mu,\sigma^2) \]

を抽出します。 母分散 \(\sigma^2\) からのずれを調べるには、母分散の不偏推定量である不偏分散

\[ U^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2 \]

を用いるのが自然です。 しかし、これは従う分布が不明であり、区間推定、検定が行えません。 そこで、次のように変形します。

\[ \begin{align} U^2&=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2\\ &=\frac{1}{n-1}\sum_{i=1}^n\{(X_i-\mu)-(\overline{X}-\mu)\}^2\\ &=\frac{1}{n-1}\sum_{i=1}^n\{(X_i-\mu)^2-2(X_i-\mu)(\overline{X}-\mu)+(\overline{X}-\mu)^2\}\\ &=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)\sum_{i=1}^n(X_i-\mu)+\sum_{i=1}^n(\overline{X}-\mu)^2\right\}\\ &=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)(n\overline{X}-n\mu)+n(\overline{X}-\mu)^2\right\}\\ &=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2n(\overline{X}-\mu)^2+n(\overline{X}-\mu)^2\right\}\\ &=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-n(\overline{X}-\mu)^2\right\}\\ \end{align} \]

よって

\[ U^2=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-n(\overline{X}-\mu)^2\right\} \]

が成り立ち、この両辺に \(\displaystyle\frac{n-1}{\sigma^2}\) を掛けると

\[ \frac{(n-1)U^2}{\sigma^2}=\sum_{i=1}^n{\left(\frac{X_i-\mu}{\sigma}\right)}^2-{\left(\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\right)}^2 \]

ここで

\[ \frac{X_i-\mu}{\sigma}\sim N(0,1),\quad\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1) \]

より

\[ \sum_{i=1}^n{\left(\frac{X_i-\mu}{\sigma}\right)}^2\sim \chi^2(n),~~~~~{\left(\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\right)}^2\sim\chi^2(1) \]

となります。 カイ二乗分布の自由度の加法性より

\[ \frac{(n-1)U^2}{\sigma^2}\sim\chi^2(n-1) \]

が成り立ちます。 この統計量により、母分散の区間推定と検定が行えます。

母分散の区間推定

例題

ある学生が毎朝の通学時間(分)を \(20\) 日間記録し、その不偏分散は \(6.89~\text{分}^2\) だった。 このとき、通学時間の母分散の \(95\%\) 信頼区間を求めよ。

母分散の区間推定なので、母分散を \(\sigma^2\) 、標本数を \(n\) 、不偏分散を \(U^2\) とした次の統計量を用います。

\[ \frac{(n-1)U^2}{\sigma^2}\sim\chi^2(n-1) \]

分布 \(\chi^2(n-1)\) の上側 \(100\alpha\%\) 点を \(\chi^2_{U(\alpha)}(n-1)\) 、下側 \(100\alpha\%\) 点を \(\chi^2_{L(\alpha)}(n-1)\) とすると

\[ P\left(\chi^2_{L(\frac{\alpha}{2})}(n-1)\le\frac{(n-1)U^2}{\sigma^2}\le \chi^2_{U(\frac{\alpha}{2})}(n-1)\right)=1-\alpha \]

が成り立ちます。 \(95\%\) 信頼区間を求めたいので、\(1-\alpha=0.95\) より \(\alpha=0.05\) とすると

\[ P\left(\chi^2_{L(0.025)}(n-1)\le\frac{(n-1)U^2}{\sigma^2}\le \chi^2_{U(0.025)}(n-1)\right)=0.95 \]

不等式を \(\sigma^2\) について解くと

\[ P\left(\frac{(n-1)U^2}{\chi^2_{U(0.025)}(n-1)}\le\sigma^2\le\frac{(n-1)U^2}{\chi^2_{L(0.025)}(n-1)}\right)=0.95 \]

したがって、母分散 \(\sigma^2\) の \(95\%\) 信頼区間は

\[ \left[\frac{(n-1)u^2}{\chi^2_{U(0.025)}(n-1)},~\frac{(n-1)u^2}{\chi^2_{L(0.025)}(n-1)}\right] \]

となります。 \(n=20\) 、\(u^2=6.89\) を代入すると

\[ \left[\frac{19\cdot 6.89}{\chi^2_{U(0.025)}(19)},~\frac{19\cdot 6.89}{\chi^2_{L(0.025)}(19)}\right] \]
\[ \left[\frac{130.91}{\chi^2_{U(0.025)}(19)},~\frac{130.91}{\chi^2_{U(0.975)}(19)}\right] \]

カイ二乗分布のパーセント点表より

\[ \left[\frac{130.91}{32.85},~\frac{130.91}{8.91}\right] \]

したがって、求める信頼区間は

\[ [3.99,~14.69] \]

母分散の検定

例題

あるネジ工場では、ネジの直径のばらつき(分散)が \(0.01~\mathrm{mm^2}\) 以下であることを品質基準にしている。 ランダムに \(20\) 本のネジを測定したところ、不偏分散は \(0.018~\mathrm{mm^2}\) だった。 このとき、ばらつきは許容範囲を超えていると言えるか。 有意水準 \(5\%\) で判断せよ。

母分散を \(\sigma^2\) として、次のように仮説を立てます。

帰無仮説 \(H_0:\sigma^2\le0.01\)
対立仮説 \(H_1:\sigma\gt0.01\)

よって、右側検定を行います。 \(H_0\) が正しいと仮定して進めます。 すなわち

\[ \sigma^2=0.01 \]

と仮定します。

有意水準 \(\alpha\) は \(5\%\) と与えられているので

\[ \alpha=0.05 \]

です。

母分散の検定統計量は

\[ \chi^2=\frac{(n-1)U^2}{\sigma^2}=\frac{19U^2}{0.01}=1900U^2\sim\chi^2(19) \]

となります。

右側検定なので、\(\chi^2(19)\) の上側 \(5\%\) 点 \(\chi^2_{U(0.05)}(19)\) を求めます。 カイ二乗分布のパーセント点表より

\[ \chi^2_{U(0.05)}(19)=30.14 \]

とわかります。 したがって、棄却域は

\[ R=[30.14,\infty) \]

となります。

\(\chi^2\) の実現値 \(\chi^2_0\) は

\[ \chi^2_0=\frac{(20-1)\cdot0.018^2}{0.01}=34.2 \]

です。 よって

\[ \chi^2_0\in R \]

なので、\(H_0\) を棄却して \(H_1\) を採択します。 したがって、ネジの直径のばらつきは \(0.01~\mathrm{mm^2}\) を超えていると言えます。