標本調査と統計量
統計調査の手法
調査対象全体の集合を母集団といい、母集団が従う確率分布を母集団分布といいます。母集団の状況を調べるには、次の2通りの方法があります。
全数調査 … 母集団に属するすべての個体を対象として調査する
標本調査 … 母集団に属する一部の個体から全体の状況を推測する
全数調査を行えば母集団分布を正確に特定できますが、母集団全体を調査することは困難であることが多いです。
母集団と標本
母集団分布の特徴を表す量を母数(パラメータ)といいます。特に、母集団分布の平均を母平均、分散を母分散と呼びます。
母集団から取り出された要素の集合を標本といい、母集団から標本を取り出すことを標本抽出といいます。
無作為標本 \[ \boldsymbol{X}=\begin{bmatrix} X_1 & X_2 & \cdots & X_n \end{bmatrix} \] に対して、実際の調査で得られるデータ \[ \boldsymbol{x}=\begin{bmatrix} x_1 & x_2 & \cdots & x_n \end{bmatrix} \] を実現値(観測値)といいます。
統計量の定義
標本調査では、無作為標本 \(X_1,~X_2,~\cdots,~X_n\) の何らかの関数 \[ T(X_1,~X_2,~\cdots,~X_n) \] から、ある母数を推測します。この関数 \(T\) を統計量といいます。
無作為標本 \(X_1,~X_2,~\cdots,~X_n\) の実現値がそれぞれ \[ x_1,~x_2,~\cdots,~x_n \] であるとき、統計量 \(T\) が定める値 \[ T(x_1,~x_2,~\cdots,~x_n) \] を統計量 \(T\) の実現値といいます。
代表的な統計量
代表的な統計量として、標本平均と不偏分散があります。
標本平均
不偏分散
「不偏」の意味、なぜ分母が \(n-1\) なのかは次回説明する。