区間推定
区間推定とは
点推定では、母数を1点(1つの値)で推定しましたが、区間推定では、母数が含まれていると考えられる区間を推定します。
未知母数 \(\theta\) に対して、
\[
P(Q_1 \le \theta \le Q_2) = 1 - \alpha
\]
を満たすような確率変数 \(Q_1, Q_2\) を考えます。
このときの \(1 - \alpha\) を信頼水準(信頼係数)と呼びます。
\(Q_1, Q_2\) の実現値をそれぞれ \(q_1, q_2\) とすると、区間 \([q_1, q_2]\) を母数 \(\theta\) に対する\(100(1-\alpha)\%\) 信頼区間といいます。
また、\(q_1\) を信頼下限、\(q_2\) を信頼上限と呼びます。
信頼水準が \(1 - \alpha\) のとき、ある分布に従う確率変数 \(X\) に対して、\(X\) が従う分布の上側 \(100\alpha\%\) 点を \(x_{U(\alpha)}\)、下側 \(100\alpha\%\) 点を \(x_{L(\alpha)}\) とすると、 \[ P\left(x_{L\left(\frac{\alpha}{2}\right)}\le X\le x_{U\left(\frac{\alpha}{2}\right)}\right)=1-\alpha \]
母平均の区間推定(母分散が既知)
母集団分布が正規分布である母集団の母平均 \(\mu\) を推定します。ただし、母分散は既知で \(\sigma^2\) であるとします。
母集団から標本を抽出する
母集団から大きさ \(n\) の標本 \(X_1,X_2,\cdots,X_n\) を無作為に抽出します。
未知母数の推定量の分布を調べる
標本 \(X_1,X_2,\cdots,X_n\) の標本平均 \(\overline{X}\) に対して
が成り立つので、標本平均 \(\overline{X}\) は \(\mu\) の不偏推定量です。
このとき
しかし、\(\mu\) は推定したい母数なので、\(\displaystyle N\left(\mu,\frac{\sigma^2}{n}\right)\) の分布はわかりません。
そこで、\(\overline{X}\) を標準化します。
とおくと \(Z\sim N(0,1)\) であり、分布がわかる確率変数が得られました。
信頼区間を求める
\(N(0,1)\) の上側 \(100\alpha\) %点を \(z_{U(\alpha)}\) 、下側 \(100\alpha\) %点を \(z_{L(\alpha)}\) とするとき
となるような \(z_{U\left(\frac{\alpha}{2}\right)},~x_{L\left(\frac{\alpha}{2}\right)}\) を求めます。
これを \(\mu\) について整理して
したがって、母平均 \(\mu\) の \(100(1-\alpha)\) %信頼区間は