データの代表値

平均値

定義(平均)

\(n\) 個のデータ \(x_1,x_2,\cdots,x_n\) に対して

\[ \overline{x}=\frac{1}{n}\sum_{i=1}^nx_i \]

をデータの平均という。

定義(加重平均)

\(n\) 個のデータ \(x_1,x_2,\cdots,x_n\) が異なる性質を持つとき

\[ \overline{x}_w=\sum_{i=1}^nw_ix_i \]

をデータの加重平均という。

定義(幾何平均)

\(n\) 個のデータ \(x_1,x_2,\cdots,x_n\) に対して

\[ \overline{x}_g=\sqrt[n]{x_1\cdot x_2\cdots x_n}=\sqrt[n]{\prod_{i=1}^nx_i} \]

をデータの幾何平均という。

中央値

定義(中央値)

\(n\) 個のデータ \(x_1,x_2,\cdots,x_n\) を昇順に並べたものを

\[ x_{(1)},~x_{(2)},~\cdots,~x_{(n)} \]

とするとき

\[ Median= \begin{cases} x_{(k)} & (n=2k-1)\\ \displaystyle\frac{x_{(k)}+x_{(k+1)}}{2} & (n=2k) \end{cases} \]

をデータの中央値(メジアン)という。

最頻値

定義(最頻値)

データに対し、最も個数の多い値をデータの最頻値(モード)という。

演習問題

問題
解答