標本調査と統計量

統計調査の手法

調査対象全体の集合を母集団といい、母集団が従う確率分布を母集団分布といいます。母集団の状況を調べるには、次の2通りの方法があります。

全数調査 … 母集団に属するすべての個体を対象として調査する
標本調査 … 母集団に属する一部の個体から全体の状況を推測する

全数調査を行えば母集団分布を正確に特定できますが、母集団全体を調査することは困難であることが多いです。

母集団と標本

母集団分布の特徴を表す量を母数(パラメータ)といいます。特に、母集団分布の平均を母平均、分散を母分散と呼びます。

母集団から取り出された要素の集合を標本といい、母集団から標本を取り出すことを標本抽出といいます。

無作為標本 \[ \boldsymbol{X}=\begin{bmatrix} X_1 & X_2 & \cdots & X_n \end{bmatrix} \] に対して、実際の調査で得られるデータ \[ \boldsymbol{x}=\begin{bmatrix} x_1 & x_2 & \cdots & x_n \end{bmatrix} \] を実現値(観測値)といいます。

統計量の定義

標本調査では、無作為標本 \(X_1,~X_2,~\cdots,~X_n\) の何らかの関数 \[ T(X_1,~X_2,~\cdots,~X_n) \] から、ある母数を推測します。この関数 \(T\) を統計量といいます。

無作為標本 \(X_1,~X_2,~\cdots,~X_n\) の実現値がそれぞれ \[ x_1,~x_2,~\cdots,~x_n \] であるとき、統計量 \(T\) が定める値 \[ T(x_1,~x_2,~\cdots,~x_n) \] を統計量 \(T\) の実現値といいます。

代表的な統計量

代表的な統計量として、標本平均と不偏分散があります。

標本平均

定義(標本平均)
無作為標本 \(X_1,~X_2,~\cdots,~X_n\) に対して \[ \overline{X}:=\frac{1}{n}\sum_{i=1}^nX_i \] を標本平均という。

定理(標本平均の期待値と分散)
平均 \(\mu\) 、分散 \(\sigma^2\) の母集団からの無作為標本の標本平均 \(\overline{X}\) に対して \[ E[\overline{X}]=\mu,~~~~~V[\overline{X}]=\frac{\sigma^2}{n} \] が成り立つ。

不偏分散

定義(不偏分散)
無作為標本 \(X_1,~X_2,~\cdots,~X_n\) とその標本平均 \(\overline{X}\) に対して \[ S^2=\frac{1}{n-1}\sum_{i=1}^n(X_i-\overline{X})^2 \] を不偏分散という。

「不偏」の意味、なぜ分母が \(n-1\) なのかは次回説明する。

演習問題

問題
解答