データの変換

標準化

定義(標準化)

データ \(x_1,x_2,\cdots,x_n\) に対して、平均 \(\overline{x}\) 、標準偏差 \(s_x\) によって

\[ z_i=\frac{x_i-\overline{x}}{s_x} \quad (i=1,2,\cdots,n) \]

という変換を標準化といい、\(z_i\) をデータ \(x_i\) の標準化得点という。

偏差値は標準化得点を用いて定義されます。

定義(偏差値得点)

データの標準化得点 \(z_i\) に対して

\[ T_i=10z_i+50 \]

をデータの偏差値得点という。

正規化

定義(正規化)

データ \(x_1,x_2,\cdots,x_n\) に対して、最大値 \(x_{\mathrm{max}}\) 、最小値 \(x_{\mathrm{min}}\) によって

\[ x_{\mathrm{norm}}=\frac{x-x_{\mathrm{min}}}{x_{\mathrm{max}}-x_{\mathrm{min}}} \quad (i=1,2,\cdots,n) \]

という変換を正規化という。

演習問題

問題
解答