母平均の検定
母平均の検定(母分散が既知の場合)
帰無仮説を定める
ある母集団の母平均 \(\mu\) がある特定の値 \(\mu_0\) に等しいといえるかどうかを検定します。 ここでは、母集団は正規母集団 \(N(\mu,\sigma^2)\) であると仮定します。 帰無仮説 \(H_0\) は次のようになります。
対立仮説を定める
対立仮説を次の3種類から一つ選びます。
\(H_1:\mu\neq\mu_0\) (両側検定)
\(H_1:\mu\gt\mu_0\) (右側検定)
\(H_1:\mu\lt\mu_0\) (左側検定)
有意水準を定める
有意水準 \(\alpha\) を定めます。 \(\alpha=0.05\) や \(\alpha=0.01\) などとします。
検定統計量を選ぶ
正規母集団 \(N(\mu,\sigma^2)\) から抽出した \(n\) 個の無作為標本を \(X_1,X_2,\cdots,X_{n}\) とします。
帰無仮説 \(H_0\) が正しい(母平均は \(\mu_0\) である)と仮定すると
となります。
母平均 \(\mu_0\) からのずれを調べるには、母平均の不偏推定量である標本平均
を用いるのが自然です。 このとき
となります。標準正規分布表を用いるために、\(\overline{X}\) を標準化したもの
を検定統計量とします。 標準正規分布に従う検定統計量を用いた検定を \(Z\) 検定といいます。
母平均の検定(母分散が未知の場合)
帰無仮説、対立仮説、有意水準の定め方は、母分散が既知の場合と同様です。 しかし、母分散が既知の場合と同様に、検定統計量を
としてしまうと、未知の \(\sigma^2\) を含んでいるため、\(Z\) の実現値が計算できません。 そこで、母分散 \(\sigma^2\) の不偏推定量である不偏分散
を \(\sigma^2\) の代わりに用います。 \(Z\) の \(\sigma^2\) を \(U^2\) にした新しい量を \(T\) とすると
この \(T\) が従う分布を考えます。 不偏分散に関して次のことが成り立ちます。
また、\(Z\sim N(0,1),~W\sim\chi^2(n)\) であるとき
となります。 これらをもとに \(T\) を変形すると
よって
となり、この \(T\) が分散が未知の場合の母平均の検定統計量となります。 \(t\) 分布に従う検定統計量を用いた検定を \(t\) 検定といいます。
例題
あるカフェでは、\(1\) 杯のコーヒーは平均 \(200~\mathrm{mL}\) 注がれるように設定されいる。 しかし最近、「量が少ない気がする」とお客様から苦情が出てきた。 そこで、ランダムに \(25\) 杯を計測したところ、標本平均は \(197.3~\mathrm{mL}\) であった。 \(1\) 杯のコーヒーの量の平均は \(200~\mathrm{mL}\) より少ないと言えるか、以下の場合において、有意水準 \(1\%\) で判断せよ。
- 母標準偏差が既知で \(5~\mathrm{mL}\) である場合
- 母分散が未知の場合
母平均を \(\mu\) として、次のように仮説を立てます。
帰無仮説 \(H_0:\mu=200\)
対立仮説 \(H_1:\mu\lt200\)
よって、左側検定を行います。 有意水準 \(\alpha\) は \(1\%\) と与えられているので \[ \alpha=0.01 \] です。
-
母平均は \(\sigma^2=5^2\) と既知なので、\(H_0\) が正しいと仮定すると、無作為標本 \(X_1,X_2,\cdots,X_{25}\) は
\[ X_1,X_2,\cdots,X_{25}\sim N(200,5^2) \]であり、標本平均 \(\overline{X}\) は
\[ \overline{X}\sim N\left(200,~\frac{5^2}{25}\right) \]となります。これを標準化することで、検定統計量は
\[ Z=\frac{\overline{X}-200}{\frac{5}{\sqrt{25}}}\sim N(0,1) \]となります。
左側検定で、有意水準 \(\alpha=0.01\) より、\(N(0,1)\) の下側 \(1\%\) 点 \(-z_{0.01}\) を求めます。 棄却域は
\[ R=(-\infty,-2.33] \]\(Z\) の実現値 \(z\) は
\[ z=\frac{197.3-200}{\frac{5}{\sqrt{25}}}=-2.7 \]であり、これは棄却域 \(R\) に含まれます。 よって、帰無仮説 \(H_0\) を棄却し、対立仮説 \(H_1\) を採択します。 \(1\) 杯のコーヒーの量の平均は \(200~\mathrm{mL}\) より少ないと言えます。
例題(p値)
今度は先ほどの例題をp値を使って行います。 p値を計算して、有意水準 \(\alpha=0.01\) と比較します。
よって
したがって、帰無仮説 \(H_0\) を棄却し、対立仮説 \(H_1\) を採択します。 \(1\) 杯のコーヒーの量の平均は \(200~\mathrm{mL}\) より少ないと言えます。 このように、棄却域法のときと同じ結論が得られます。