相関係数・相関行列
相関係数
共分散は単位がついたままの値なので、値そのものの大きさは比較しにくいです。 そこで、共分散を標準化したものとして、相関係数を定義します。
2つの確率変数 \(X,Y\) に対して
\[
\rho[X,Y]=\frac{\operatorname{Cov}[X,Y]}{\sqrt{V[X]V[Y]}}
\]
を \(X,Y\) の相関係数という。
相関係数 \(\rho[X,Y]\) に対して次が成り立つ。
\[
-1\le \rho[X,Y]\le1
\]
証明
確率変数 \(X,Y\) と \(a,b,c,d\in\mathbb{R}\) に対して、次が成り立つ。
\[
\rho[aX+b,cY+d] = \operatorname{sign}(ac)\rho[X,Y]
\]
証明
\[
\begin{align}
\rho[aX+b,cY+d]
&= \frac{\operatorname{Cov}[aX+b,cY+d]}{\sqrt{V[aX+b]V[cY+d]}} \\
&= \frac{\operatorname{Cov}[aX,cY]}{\sqrt{V[aX]V[cY]}} \\
&= \frac{ac\operatorname{Cov}[X,Y]}{\sqrt{a^2V[X]\cdot c^2V[Y]}} \\
&= \frac{ac}{|ac|}\cdot\frac{\operatorname{Cov}[X,Y]}{\sqrt{V[X]V[Y]}} \\
&= \operatorname{sign}(ac)\rho[X,Y] \\
\end{align}
\]
相関行列
確率ベクトル \(\boldsymbol{X}=\begin{bmatrix} X_1 & X_2 & \cdots & X_n \end{bmatrix}^\top\) に対して、各 \(X_i,X_j\) の相関係数 \(\rho_{X_iX_j}\) を並べた行列
\[
R=
\begin{bmatrix}
\rho_{X_1X_1} & \rho_{X_1X_2} & \cdots & \rho_{X_1X_n}\\
\rho_{X_2X_1} & \rho_{X_2X_2} & \cdots & \rho_{X_2X_n}\\
\vdots & \vdots & \ddots & \vdots\\
\rho_{X_nX_1} & \rho_{X_nX_2} & \cdots & \rho_{X_nX_n}
\end{bmatrix}
\]
を \(\boldsymbol{X}\) の相関行列という。