母平均の検定(t検定)

母平均の検定統計量(母分散未知)

母集団を正規母集団と仮定します。
正規母集団 \(N(\mu,\sigma^2)\) から抽出した \(n\) 個の無作為標本を \[ X_1,~~~X_2,~~~\cdots,~~~X_{n} \] とすると、この標本平均は \[ \overline{X}=\frac{1}{n}\sum_{i=1}^nX_i \] となります。

\[ \overline{X}\sim N\left(\mu,~\frac{\sigma^2}{n}\right) \] となるので \(\overline{X}\) を標準化すると \[ Z=\frac{\overline{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}}\sim N(0,1) \] しかし、母分散 \(\sigma^2\) が未知なので、これは検定統計量として使えません。

そこで、母分散 \(\sigma^2\) の不偏推定量である不偏分散 \[ S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2 \] を代わりに用いることにします。
\(Z\) の \(\sigma^2\) を \(S^2\) にした新しい量を \(T\) とすると \[ T=\frac{\overline{X}-\mu}{\sqrt{\frac{S^2}{n}}} \] となります。

この \(T\) が従う分布を考えます。
不偏分散に関して次のことが成り立ちます。 \[ W=\frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1) \] これは次回の「母分散の検定(カイ二乗検定)」で詳しく解説します。
また、\(Z\sim N(0,1),~W\sim\chi^2(n)\) であるとき \[ \frac{Z}{\sqrt{\frac{W}{n}}}\sim t(n) \] でした。
これらをもとに、\(T\) を変形すると \[ T=\frac{\overline{X}-\mu}{\sqrt{\frac{S^2}{n}}} =\frac{\frac{\overline{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}}}{\frac{\sqrt{\frac{S^2}{n}}}{\sqrt{\frac{\sigma^2}{n}}}} =\frac{Z}{\sqrt{\frac{S^2}{\sigma^2}}} =\frac{Z}{\sqrt{\frac{\frac{(n-1)S^2}{\sigma^2}}{n-1}}} =\frac{Z}{\sqrt{\frac{W}{n-1}}} \] よって \[ T=\frac{\overline{X}-\mu}{\sqrt{\frac{S^2}{n}}}\sim t(n-1) \] となり、これが分散未知の場合の母平均の検定統計量となります。
\(t\) 分布に従う検定統計量を用いた検定を \(t\) 検定といいます。

t検定を手計算で行う場合は棄却域法を用います。

仮説検定の流れ(棄却域法)
  1. 帰無仮説・対立仮説を立てる
  2. 検定統計量を計算する
  3. 有意水準を決める
  4. 棄却域を求める
  5. 検定統計量の実現値が棄却域に入るかを見る

t分布において、p値の計算は手計算では困難です。
一方で、統計ソフトを用いる場合はp値法が主流です。

仮説検定の流れ(p値法)
  1. 帰無仮説・対立仮説を立てる
  2. 検定統計量を計算する
  3. 有意水準を決める
  4. p値を計算する
  5. p値が有意水準未満かを見る

例題

以下では棄却域法を用います。

例題

あるメーカーのカタログでは、ノートパソコンのバッテリーの平均駆動時間は \(10.0\) 時間とされています。 ユーザーの実測データを疑っている消費者団体が、実際に \(10\) 台のノートパソコンを無作為に選び、フル充電からバッテリー切れまでの駆動時間を調査したところ、次のようなデータが得られました。 \[ 10.3,~9.7,~10.1,~10.2,~9.8,~9.9,~10.0,~9.6,~9.8,~9.9 \] この結果から、カタログ値より実際の駆動時間が短いといえるか、有意水準 \(5\%\) で判断してください。

1. 帰無仮説・対立仮説を立てる

母平均を \(\mu\) として、次のように仮説を立てます。

帰無仮説 \(H_0:\mu=10.0\)
対立仮説 \(H_1:\mu\lt10.0\)

よって、左側検定を行います。

2. 検定統計量を計算する

検定統計量を \[ T=\frac{\overline{X}-\mu}{\sqrt{\frac{S^2}{n}}}\sim t(n-1) \] とする。 標本平均 \(\overline{X}\) の実現値は

\[ \begin{align} \overline{x}&=\frac{10.3+9.7+10.1+10.2+9.8+9.9+10.0+9.6+9.8+9.9}{10}\\ &=9.93 \end{align} \]

不偏分散 \(S^2\) の実現値は

\[ \begin{align} s^2&=\frac{1}{9}\{(10.3-9.93)^2+(9.7-9.93)^2+(10.1-9.93)^2+(10.2-9.93)^2+(9.8-9.93)^2+(9.9-9.93)^2+(10.0-9.93)^2+(9.6-9.93)^2+(9.8-9.93)^2+(9.9-9.93)^2\}\\ &=\frac{0.441}{9}=0.049 \end{align} \]

よって、\(T\) の実現値 \(t\) は \[ t=\frac{9.93-10.0}{\sqrt{\frac{0.049}{10}}}=-\frac{0.07}{0.0702}=-1.00 \] となります。

3. 有意水準を決める

本問では有意水準 \(\alpha\) は \(5\%\) と与えられているので \[ \alpha=0.05 \] です。

4. 棄却域を求める

下側 \(5\%\) 点を求めます。
自由度 \(9\) の \(t\) 分布の下側 \(5\%\) 点とは \[ P(T\le t_{0.05}(9))=0.05 \] となるような \(t_{0.05}(9)\) です。 t分布のパーセント点表より \[ t_{0.05}(9)=-1.833 \] とわかります。
したがって、棄却域は \[ t\le-1.833 \] となります。

検定統計量の実現値が棄却域に入るかを見る

検定統計量の実現値は \[ t=-1.00 \] であり、これは棄却域 \[ t\le-1.833 \] に入らず、帰無仮説 \(H_0\) は棄却されません。
よって、カタログ値より実際の駆動時間が短いとは言えません。