母分散の区間推定と検定
母分散の検定統計量
母分散の区間推定と検定を行うための統計量を作成します。
正規母集団 \(N(\mu,\sigma^2)\) から \(n\) 個の無作為標本
\[
X_1,X_2,\cdots,X_{n}\sim N(\mu,\sigma^2)
\]
を抽出します。
母分散 \(\sigma^2\) からのずれを調べるには、母分散の不偏推定量である不偏分散
\[
U^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2
\]
を用いるのが自然です。
しかし、これは従う分布が不明であり、区間推定、検定が行えません。
そこで、次のように変形します。
\[
\begin{align}
U^2&=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2\\
&=\frac{1}{n-1}\sum_{i=1}^n\{(X_i-\mu)-(\overline{X}-\mu)\}^2\\
&=\frac{1}{n-1}\sum_{i=1}^n\{(X_i-\mu)^2-2(X_i-\mu)(\overline{X}-\mu)+(\overline{X}-\mu)^2\}\\
&=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)\sum_{i=1}^n(X_i-\mu)+\sum_{i=1}^n(\overline{X}-\mu)^2\right\}\\
&=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2(\overline{X}-\mu)(n\overline{X}-n\mu)+n(\overline{X}-\mu)^2\right\}\\
&=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-2n(\overline{X}-\mu)^2+n(\overline{X}-\mu)^2\right\}\\
&=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-n(\overline{X}-\mu)^2\right\}\\
\end{align}
\]
よって
\[
U^2=\frac{1}{n-1}\left\{\sum_{i=1}^n(X_i-\mu)^2-n(\overline{X}-\mu)^2\right\}
\]
が成り立ち、この両辺に \(\displaystyle\frac{n-1}{\sigma^2}\) を掛けると
\[
\frac{(n-1)U^2}{\sigma^2}=\sum_{i=1}^n{\left(\frac{X_i-\mu}{\sigma}\right)}^2-{\left(\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\right)}^2
\]
ここで
\[
\frac{X_i-\mu}{\sigma}\sim N(0,1),\quad\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\sim N(0,1)
\]
より
\[
\sum_{i=1}^n{\left(\frac{X_i-\mu}{\sigma}\right)}^2\sim \chi^2(n),~~~~~{\left(\frac{\overline{X}-\mu}{\frac{\sigma}{\sqrt{n}}}\right)}^2\sim\chi^2(1)
\]
となります。
カイ二乗分布の自由度の加法性より
\[
\frac{(n-1)U^2}{\sigma^2}\sim\chi^2(n-1)
\]
が成り立ちます。
この統計量により、母分散の区間推定と検定が行えます。
母分散の区間推定
例題
ある学生が毎朝の通学時間(分)を \(20\) 日間記録し、その不偏分散は \(6.89~\text{分}^2\) だった。
このとき、通学時間の母分散の \(95\%\) 信頼区間を求めよ。
母分散の区間推定なので、母分散を \(\sigma^2\) 、標本数を \(n\) 、不偏分散を \(U^2\) とした次の統計量を用います。
\[
\frac{(n-1)U^2}{\sigma^2}\sim\chi^2(n-1)
\]
分布 \(\chi^2(n-1)\) の上側 \(100\alpha\%\) 点を \(\chi^2_{U(\alpha)}(n-1)\) 、下側 \(100\alpha\%\) 点を \(\chi^2_{L(\alpha)}(n-1)\) とすると
\[
P\left(\chi^2_{L(\frac{\alpha}{2})}(n-1)\le\frac{(n-1)U^2}{\sigma^2}\le \chi^2_{U(\frac{\alpha}{2})}(n-1)\right)=1-\alpha
\]
が成り立ちます。
\(95\%\) 信頼区間を求めたいので、\(1-\alpha=0.95\) より \(\alpha=0.05\) とすると
\[
P\left(\chi^2_{L(0.025)}(n-1)\le\frac{(n-1)U^2}{\sigma^2}\le \chi^2_{U(0.025)}(n-1)\right)=0.95
\]
不等式を \(\sigma^2\) について解くと
\[
P\left(\frac{(n-1)U^2}{\chi^2_{U(0.025)}(n-1)}\le\sigma^2\le\frac{(n-1)U^2}{\chi^2_{L(0.025)}(n-1)}\right)=0.95
\]
したがって、母分散 \(\sigma^2\) の \(95\%\) 信頼区間は
\[
\left[\frac{(n-1)u^2}{\chi^2_{U(0.025)}(n-1)},~\frac{(n-1)u^2}{\chi^2_{L(0.025)}(n-1)}\right]
\]
となります。
\(n=20\) 、\(u^2=6.89\) を代入すると
\[
\left[\frac{19\cdot 6.89}{\chi^2_{U(0.025)}(19)},~\frac{19\cdot 6.89}{\chi^2_{L(0.025)}(19)}\right]
\]
\[
\left[\frac{130.91}{\chi^2_{U(0.025)}(19)},~\frac{130.91}{\chi^2_{U(0.975)}(19)}\right]
\]
カイ二乗分布のパーセント点表より
\[
\left[\frac{130.91}{32.85},~\frac{130.91}{8.91}\right]
\]
したがって、求める信頼区間は
\[
[3.99,~14.69]
\]
母分散の検定
例題
あるネジ工場では、ネジの直径のばらつき(分散)が \(0.01~\mathrm{mm^2}\) 以下であることを品質基準にしている。
ランダムに \(20\) 本のネジを測定したところ、不偏分散は \(0.018~\mathrm{mm^2}\) だった。
このとき、ばらつきは許容範囲を超えていると言えるか。
有意水準 \(5\%\) で判断せよ。
母分散を \(\sigma^2\) として、次のように仮説を立てます。
帰無仮説 \(H_0:\sigma^2\le0.01\)
対立仮説 \(H_1:\sigma\gt0.01\)
よって、右側検定を行います。
\(H_0\) が正しいと仮定して進めます。
すなわち
\[
\sigma^2=0.01
\]
と仮定します。
有意水準 \(\alpha\) は \(5\%\) と与えられているので
\[
\alpha=0.05
\]
です。
母分散の検定統計量は
\[
\chi^2=\frac{(n-1)U^2}{\sigma^2}=\frac{19U^2}{0.01}=1900U^2\sim\chi^2(19)
\]
となります。
右側検定なので、\(\chi^2(19)\) の上側 \(5\%\) 点 \(\chi^2_{U(0.05)}(19)\) を求めます。
カイ二乗分布のパーセント点表より
\[
\chi^2_{U(0.05)}(19)=30.14
\]
とわかります。
したがって、棄却域は
\[
R=[30.14,\infty)
\]
となります。
\(\chi^2\) の実現値 \(\chi^2_0\) は
\[
\chi^2_0=\frac{(20-1)\cdot0.018^2}{0.01}=34.2
\]
です。
よって
\[
\chi^2_0\in R
\]
なので、\(H_0\) を棄却して \(H_1\) を採択します。
したがって、ネジの直径のばらつきは \(0.01~\mathrm{mm^2}\) を超えていると言えます。