母平均の検定(t検定)
母平均の検定統計量(母分散未知)
母集団を正規母集団と仮定します。
正規母集団 \(N(\mu,\sigma^2)\) から抽出した \(n\) 個の無作為標本を
\[
X_1,~~~X_2,~~~\cdots,~~~X_{n}
\]
とすると、この標本平均は
\[
\overline{X}=\frac{1}{n}\sum_{i=1}^nX_i
\]
となります。
\[ \overline{X}\sim N\left(\mu,~\frac{\sigma^2}{n}\right) \] となるので \(\overline{X}\) を標準化すると \[ Z=\frac{\overline{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}}\sim N(0,1) \] しかし、母分散 \(\sigma^2\) が未知なので、これは検定統計量として使えません。
そこで、母分散 \(\sigma^2\) の不偏推定量である不偏分散
\[
S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2
\]
を代わりに用いることにします。
\(Z\) の \(\sigma^2\) を \(S^2\) にした新しい量を \(T\) とすると
\[
T=\frac{\overline{X}-\mu}{\sqrt{\frac{S^2}{n}}}
\]
となります。
この \(T\) が従う分布を考えます。
不偏分散に関して次のことが成り立ちます。
\[
W=\frac{(n-1)S^2}{\sigma^2}\sim\chi^2(n-1)
\]
これは次回の「母分散の検定(カイ二乗検定)」で詳しく解説します。
また、\(Z\sim N(0,1),~W\sim\chi^2(n)\) であるとき
\[
\frac{Z}{\sqrt{\frac{W}{n}}}\sim t(n)
\]
でした。
これらをもとに、\(T\) を変形すると
\[
T=\frac{\overline{X}-\mu}{\sqrt{\frac{S^2}{n}}}
=\frac{\frac{\overline{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}}}{\frac{\sqrt{\frac{S^2}{n}}}{\sqrt{\frac{\sigma^2}{n}}}}
=\frac{Z}{\sqrt{\frac{S^2}{\sigma^2}}}
=\frac{Z}{\sqrt{\frac{\frac{(n-1)S^2}{\sigma^2}}{n-1}}}
=\frac{Z}{\sqrt{\frac{W}{n-1}}}
\]
よって
\[
T=\frac{\overline{X}-\mu}{\sqrt{\frac{S^2}{n}}}\sim t(n-1)
\]
となり、これが分散未知の場合の母平均の検定統計量となります。
\(t\) 分布に従う検定統計量を用いた検定を \(t\) 検定といいます。
t検定を手計算で行う場合は棄却域法を用います。
- 帰無仮説・対立仮説を立てる
- 検定統計量を計算する
- 有意水準を決める
- 棄却域を求める
- 検定統計量の実現値が棄却域に入るかを見る
t分布において、p値の計算は手計算では困難です。
一方で、統計ソフトを用いる場合はp値法が主流です。
- 帰無仮説・対立仮説を立てる
- 検定統計量を計算する
- 有意水準を決める
- p値を計算する
- p値が有意水準未満かを見る
例題
以下では棄却域法を用います。
あるメーカーのカタログでは、ノートパソコンのバッテリーの平均駆動時間は \(10.0\) 時間とされています。 ユーザーの実測データを疑っている消費者団体が、実際に \(10\) 台のノートパソコンを無作為に選び、フル充電からバッテリー切れまでの駆動時間を調査したところ、次のようなデータが得られました。 \[ 10.3,~9.7,~10.1,~10.2,~9.8,~9.9,~10.0,~9.6,~9.8,~9.9 \] この結果から、カタログ値より実際の駆動時間が短いといえるか、有意水準 \(5\%\) で判断してください。
1. 帰無仮説・対立仮説を立てる
母平均を \(\mu\) として、次のように仮説を立てます。
帰無仮説 \(H_0:\mu=10.0\)
対立仮説 \(H_1:\mu\lt10.0\)
よって、左側検定を行います。
2. 検定統計量を計算する
検定統計量を \[ T=\frac{\overline{X}-\mu}{\sqrt{\frac{S^2}{n}}}\sim t(n-1) \] とする。 標本平均 \(\overline{X}\) の実現値は
不偏分散 \(S^2\) の実現値は
よって、\(T\) の実現値 \(t\) は \[ t=\frac{9.93-10.0}{\sqrt{\frac{0.049}{10}}}=-\frac{0.07}{0.0702}=-1.00 \] となります。
3. 有意水準を決める
本問では有意水準 \(\alpha\) は \(5\%\) と与えられているので \[ \alpha=0.05 \] です。
4. 棄却域を求める
下側 \(5\%\) 点を求めます。
自由度 \(9\) の \(t\) 分布の下側 \(5\%\) 点とは
\[
P(T\le t_{0.05}(9))=0.05
\]
となるような \(t_{0.05}(9)\) です。
t分布のパーセント点表より
\[
t_{0.05}(9)=-1.833
\]
とわかります。
したがって、棄却域は
\[
t\le-1.833
\]
となります。
検定統計量の実現値が棄却域に入るかを見る
検定統計量の実現値は
\[
t=-1.00
\]
であり、これは棄却域
\[
t\le-1.833
\]
に入らず、帰無仮説 \(H_0\) は棄却されません。
よって、カタログ値より実際の駆動時間が短いとは言えません。