母平均の検定

母平均の検定(母分散が既知の場合)

帰無仮説を定める

ある母集団の母平均 \(\mu\) がある特定の値 \(\mu_0\) に等しいといえるかどうかを検定します。 ここでは、母集団は正規母集団 \(N(\mu,\sigma^2)\) であると仮定します。 帰無仮説 \(H_0\) は次のようになります。

\[ H_0:\mu=\mu_0 \]

対立仮説を定める

対立仮説を次の3種類から一つ選びます。

  • \(H_1:\mu\neq\mu_0\) (両側検定)

  • \(H_1:\mu\gt\mu_0\) (右側検定)

  • \(H_1:\mu\lt\mu_0\) (左側検定)

有意水準を定める

有意水準 \(\alpha\) を定めます。 \(\alpha=0.05\) や \(\alpha=0.01\) などとします。

検定統計量を選ぶ

正規母集団 \(N(\mu,\sigma^2)\) から抽出した \(n\) 個の無作為標本を \(X_1,X_2,\cdots,X_{n}\) とします。

帰無仮説 \(H_0\) が正しい(母平均は \(\mu_0\) である)と仮定すると

\[ X_1,X_2,\cdots,X_{n}\sim N(\mu_0,\sigma^2) \]

となります。

母平均 \(\mu_0\) からのずれを調べるには、母平均の不偏推定量である標本平均

\[ \overline{X}=\frac{1}{n}\sum_{i=1}^nX_i \]

を用いるのが自然です。 このとき

\[ \overline{X}\sim N\left(\mu_0,~\frac{\sigma^2}{n}\right) \]

となります。標準正規分布表を用いるために、\(\overline{X}\) を標準化したもの

\[ Z=\frac{\overline{X}-\mu_0}{\sqrt{\frac{\sigma^2}{n}}}\sim N(0,1) \]

を検定統計量とします。 標準正規分布に従う検定統計量を用いた検定を \(Z\) 検定といいます。

母平均の検定(母分散が未知の場合)

帰無仮説、対立仮説、有意水準の定め方は、母分散が既知の場合と同様です。 しかし、母分散が既知の場合と同様に、検定統計量を

\[ Z=\frac{\overline{X}-\mu_0}{\sqrt{\frac{\sigma^2}{n}}}\sim N(0,1) \]

としてしまうと、未知の \(\sigma^2\) を含んでいるため、\(Z\) の実現値が計算できません。 そこで、母分散 \(\sigma^2\) の不偏推定量である不偏分散

\[ U^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2 \]

を \(\sigma^2\) の代わりに用います。 \(Z\) の \(\sigma^2\) を \(U^2\) にした新しい量を \(T\) とすると

\[ T=\frac{\overline{X}-\mu}{\sqrt{\frac{U^2}{n}}} \]

この \(T\) が従う分布を考えます。 不偏分散に関して次のことが成り立ちます。

\[ \frac{(n-1)U^2}{\sigma^2}\sim\chi^2(n-1) \]

また、\(Z\sim N(0,1),~W\sim\chi^2(n)\) であるとき

\[ \frac{Z}{\sqrt{\frac{W}{n}}}\sim t(n) \]

となります。 これらをもとに \(T\) を変形すると

\[ T=\frac{\overline{X}-\mu}{\sqrt{\frac{U^2}{n}}} =\frac{\frac{\overline{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}}}{\frac{\sqrt{\frac{U^2}{n}}}{\sqrt{\frac{\sigma^2}{n}}}} =\frac{Z}{\sqrt{\frac{U^2}{\sigma^2}}} =\frac{Z}{\sqrt{\frac{\frac{(n-1)U^2}{\sigma^2}}{n-1}}} =\frac{Z}{\sqrt{\frac{W}{n-1}}} \]

よって

\[ T=\frac{\overline{X}-\mu}{\sqrt{\frac{U^2}{n}}}\sim t(n-1) \]

となり、この \(T\) が分散が未知の場合の母平均の検定統計量となります。 \(t\) 分布に従う検定統計量を用いた検定を \(t\) 検定といいます。

例題

例題

あるカフェでは、\(1\) 杯のコーヒーは平均 \(200~\mathrm{mL}\) 注がれるように設定されいる。 しかし最近、「量が少ない気がする」とお客様から苦情が出てきた。 そこで、ランダムに \(25\) 杯を計測したところ、標本平均は \(197.3~\mathrm{mL}\) であった。 \(1\) 杯のコーヒーの量の平均は \(200~\mathrm{mL}\) より少ないと言えるか、以下の場合において、有意水準 \(1\%\) で判断せよ。

  1. 母標準偏差が既知で \(5~\mathrm{mL}\) である場合
  2. 母分散が未知の場合

母平均を \(\mu\) として、次のように仮説を立てます。

帰無仮説 \(H_0:\mu=200\)
対立仮説 \(H_1:\mu\lt200\)

よって、左側検定を行います。 有意水準 \(\alpha\) は \(1\%\) と与えられているので \[ \alpha=0.01 \] です。

  1. 母平均は \(\sigma^2=5^2\) と既知なので、\(H_0\) が正しいと仮定すると、無作為標本 \(X_1,X_2,\cdots,X_{25}\) は

    \[ X_1,X_2,\cdots,X_{25}\sim N(200,5^2) \]

    であり、標本平均 \(\overline{X}\) は

    \[ \overline{X}\sim N\left(200,~\frac{5^2}{25}\right) \]

    となります。これを標準化することで、検定統計量は

    \[ Z=\frac{\overline{X}-200}{\frac{5}{\sqrt{25}}}\sim N(0,1) \]

    となります。

    左側検定で、有意水準 \(\alpha=0.01\) より、\(N(0,1)\) の下側 \(1\%\) 点 \(-z_{0.01}\) を求めます。 棄却域は

    \[ R=(-\infty,-2.33] \]

    \(Z\) の実現値 \(z\) は

    \[ z=\frac{197.3-200}{\frac{5}{\sqrt{25}}}=-2.7 \]

    であり、これは棄却域 \(R\) に含まれます。 よって、帰無仮説 \(H_0\) を棄却し、対立仮説 \(H_1\) を採択します。 \(1\) 杯のコーヒーの量の平均は \(200~\mathrm{mL}\) より少ないと言えます。

例題(p値)

今度は先ほどの例題をp値を使って行います。 p値を計算して、有意水準 \(\alpha=0.01\) と比較します。

\[ \begin{align} p&=P(Z\le z)\\ &=P(Z\le -2.7)\\ &=P(Z\ge 2.7)\\ &=0.0035 \quad (\because\text{標準正規分布表より})\\ \end{align} \]

よって

\[ p\lt\alpha \]

したがって、帰無仮説 \(H_0\) を棄却し、対立仮説 \(H_1\) を採択します。 \(1\) 杯のコーヒーの量の平均は \(200~\mathrm{mL}\) より少ないと言えます。 このように、棄却域法のときと同じ結論が得られます。