データのばらつきの指標
平均偏差
各データ \(x_1,x_2,\cdots,x_n\) からその平均 \(\overline{x}\) を引いたもの
を偏差といいます。 これは各データが平均からどのくらい離れているのかを示します。
各データの偏差を平均すれば、データのばらつきを表現できそうですが、そのまま偏差の平均を考えると
のように \(0\) となってしまいます。 これを回避するために偏差の絶対値をとったものを考えます。
\(n\) 個のデータ \(x_1,x_2,\cdots,x_n\) とその平均 \(\overline{x}\) に対して
をデータの平均偏差という。
分散と標準偏差
前項の平均偏差では、偏差に絶対値をとることで、\(0\) になるのを回避しましたが、2乗をしてもうまくいきます。 偏差の2乗の平均を分散といい、次のように定義されます。
\(n\) 個のデータ \(x_1,x_2,\cdots,x_n\) とその平均 \(\overline{x}\) に対して
を分散という。
変動係数
データの平均 \(\overline{x}\) と標準偏差 \(s_x\) に対して
をデータの変動係数という。