相関係数・相関行列

相関係数

共分散は単位がついたままの値なので、値そのものの大きさは比較しにくいです。 そこで、共分散を標準化したものとして、相関係数を定義します。

定義(相関係数)

2つの確率変数 \(X,Y\) に対して

\[ \rho[X,Y]=\frac{\operatorname{Cov}[X,Y]}{\sqrt{V[X]V[Y]}} \]

を \(X,Y\) の相関係数という。

定理(相関係数の値域)

相関係数 \(\rho[X,Y]\) に対して次が成り立つ。

\[ -1\le \rho[X,Y]\le1 \]
証明
定理(相関係数の性質)

確率変数 \(X,Y\) と \(a,b,c,d\in\mathbb{R}\) に対して、次が成り立つ。

\[ \rho[aX+b,cY+d] = \operatorname{sign}(ac)\rho[X,Y] \]
証明
\[ \begin{align} \rho[aX+b,cY+d] &= \frac{\operatorname{Cov}[aX+b,cY+d]}{\sqrt{V[aX+b]V[cY+d]}} \\ &= \frac{\operatorname{Cov}[aX,cY]}{\sqrt{V[aX]V[cY]}} \\ &= \frac{ac\operatorname{Cov}[X,Y]}{\sqrt{a^2V[X]\cdot c^2V[Y]}} \\ &= \frac{ac}{|ac|}\cdot\frac{\operatorname{Cov}[X,Y]}{\sqrt{V[X]V[Y]}} \\ &= \operatorname{sign}(ac)\rho[X,Y] \\ \end{align} \]

相関行列

定義(相関行列)

確率ベクトル \(\boldsymbol{X}=\begin{bmatrix} X_1 & X_2 & \cdots & X_n \end{bmatrix}^\top\) に対して、各 \(X_i,X_j\) の相関係数 \(\rho_{X_iX_j}\) を並べた行列

\[ R= \begin{bmatrix} \rho_{X_1X_1} & \rho_{X_1X_2} & \cdots & \rho_{X_1X_n}\\ \rho_{X_2X_1} & \rho_{X_2X_2} & \cdots & \rho_{X_2X_n}\\ \vdots & \vdots & \ddots & \vdots\\ \rho_{X_nX_1} & \rho_{X_nX_2} & \cdots & \rho_{X_nX_n} \end{bmatrix} \]

を \(\boldsymbol{X}\) の相関行列という。