回帰分析

回帰分析とは、ある特定の変数を他の変数から予測する手法である。予測したい変数を目的変数といい、予測に用いる変数を説明変数という。 予測式として線形式を用いる場合を線形回帰といい、非線形な予測式を用いる場合を非線形回帰という。

単回帰分析

目的変数 \(y\) の予測に説明変数 \(x\) を用いる。 予測式は \[ y=ax+b \] \(x_i\) に対する予測値は \[ \hat{y_i}=ax_i+b \] と求められる。 観測値から予測値を引いたものを残差という。 \[ \varepsilon_i=y_i-\hat{y_i}=y_i-(ax_i+b) \] 各データに対する残差の平方和を最小にすることを考える。 \[ \mathrm{RSS}=\sum_{i=1}^n\varepsilon_i^2=\sum_{i=1}^n\{y_i-(ax_i+b)\}^2 \] これが最小になるように、係数 \(a,b\) の値を求める推定法を最小二乗法という。

ここで、次の関数を考える。 \[ E(a,b)=\frac{1}{2}\sum_{i=1}^n(ax_i+b-y_i)^2 \] 偏微分すると \[ \begin{align} \begin{cases} \displaystyle\frac{\partial E}{\partial a}=\sum_{i=1}^nx_i(ax_i+b-y_i)=0\\ \displaystyle\frac{\partial E}{\partial a}=\sum_{i=1}^n(ax_i+b-y_i)=0 \end{cases} &\Leftrightarrow\begin{cases} a\displaystyle\sum_{i=1}^nx_i^2+b\sum_{i=1}^nx_i=\sum_{i=1}^nx_iy_i\\ a\displaystyle\sum_{i=1}^nx_i+bn=\sum_{i=1}^ny_i \end{cases}\\ \end{align} \] 第2式より \[ b=\frac{1}{n}\sum_{i=1}^ny_i-a\cdot\frac{1}{n}\sum_{i=1}^nx_i=\overline{y}-a\overline{x} \] 第1式の両辺を \(n\) で割ると \[ a\cdot\frac{1}{n}\sum_{i=1}^nx_i^2+b\cdot\frac{1}{n}\sum_{i=1}^nx_i=\frac{1}{n}\sum_{i=1}^nx_iy_i \] \[ a\overline{x^2}+b\overline{x}=\overline{xy} \] これに \(b=\overline{y}-a\overline{x}\) を代入して \[ a\overline{x^2}+(\overline{y}-a\overline{x})\overline{x}=\overline{xy} \] \[ a\{\overline{x^2}-(\overline{x})^2\}=\overline{xy}-\overline{x}\cdot\overline{y} \] よって \[ a=\frac{\overline{xy}-\overline{x}\cdot\overline{y}}{\overline{x^2}-(\overline{x})^2},~~~~~b=\overline{y}- \frac{\overline{xy}-\overline{x}\cdot\overline{y}}{\overline{x^2}-(\overline{x})^2} \overline{x} \]

重回帰分析

複数の説明変数を使って1つの目的変数を予測する回帰分析の手法を重回帰分析という。

説明変数 \(x_1,x_2,\cdots,x_p\)

\(y\) \(x_1\) \(x_2\) \(\cdots\)\(x_p\)
1 \(y_1\) \(x_{11}\)\(x_{12}\)\(\cdots\)\(x_{1p}\)
2 \(y_2\) \(x_{21}\)\(x_{22}\)\(\cdots\)\(x_{2p}\)
\(\vdots\)\(\vdots\)\(\vdots\)\(\vdots\)\(\ddots\)\(\vdots\)
n \(y_n\) \(x_{n1}\)\(x_{n2}\)\(\cdots\)\(x_{np}\)

回帰式は \[ y=\beta_0+\beta_1x_1+\beta_2x_2+\cdots+\beta_px_p \] と表され、\(\beta_0,\beta_1,\cdots,\beta_p\) は偏回帰係数と呼ばれる。

\[ X= \begin{bmatrix} 1 & x_{11} & x_{12} & \cdots & x_{1p}\\ 1 & x_{21} & x_{22} & \cdots & x_{2p}\\ \vdots & \vdots & \vdots & \ddots & \vdots\\ 1 & x_{n1} & x_{n2} & \cdots & x_{np}\\ \end{bmatrix} \]