平均情報量(エントロピー)
平均情報量の定義
情報量の期待値を平均情報量(エントロピー)といい、次のように定義されます。
確率変数 \(X\) に対して
を \(X\) の平均情報量(エントロピー)という。
\(X\) が離散型確率変数の場合、確率質量関数 \(p(x)\) によって
\(X\) が連続型確率変数の場合、確率密度関数 \(p(x)\) によって
となります。
ある地域では、年間、晴れの日は200日、雨の日は60日、雪の日は5日である。 この天気の平均情報量を求めよ。(小数第2位まで)
天気を \(X\) とすると
エントロピー関数
2値をとる確率変数 \(X\in\{x_1,x_2\}\) を考え、確率質量関数を
とします。 このとき \(X\) のエントロピーは
となり、これは \(p\) の1変数関数と見ることができます。 この関数をエントロピー関数といい、次のように定義されます。
確率 \(p\in[0,1]\) に対して
をエントロピー関数という。
最大エントロピー
エントロピー関数
の最大値を考えます。
\(\mathcal{H}(p)\) を \(p\) で微分すると
よって
このとき、増減表は次のようになります。
| \(p\) | \(0\) | \(\cdots\) | \(\displaystyle\frac{1}{2}\) | \(\cdots\) | \(1\) |
| \(\dfrac{d\mathcal{H}}{dp}\) | \(+\) | \(0\) | \(-\) | ||
| \(H\) | \(0\) | ↗ | \(1\) | ↘ | \(0\) |
したがって、\(\mathcal{H}(p)\) は \(p=\displaystyle\frac{1}{2}\) で最大値 \(1\) をとります。 つまり、エントロピーが最大になるのは、事象が等確率で現れるときです。
一般に、\(n\) 元事象系のエントロピーが最大となるのは、\(n\) 個の事象の生起確率が等確率で \(\displaystyle\frac{1}{n}\) であるときです。
\(n\) 元事象系の最大エントロピー \(H_{\mathrm{max}}\) は
で与えられる。
演習問題
表が出る確率が \(\displaystyle\frac{1}{4}\) であるコインがある。 このコインを投げたとき、表が出る事象を \(H\) 、裏が出る事象を \(T\) とする。 次の問いに答えよ。
- コインを投げたときの結果の事象系 \(X\) を表せ。
- エントロピー \(H(X)\) を求めよ。 ただし、\(\log_23=1.585\) とする。
解答
-
\( \displaystyle X=\begin{bmatrix} H & T \\ \frac{1}{4} & \frac{3}{4} \end{bmatrix} \)
-
\( \begin{align} H(X)&=-\sum_{x\in X}P(x)\log_2P(x)\\ &=-P(H)\log_2P(H)-P(T)\log_2P(T)\\ &=-\frac{1}{4}\log_2\frac{1}{4}-\frac{3}{4}\log_2\frac{3}{4}\\ &=\frac{1}{4}\log_24+\frac{3}{4}\log_24-\frac{3}{4}\log_23\\ &=\frac{1}{2}+\frac{3}{2}-\frac{3}{4}\cdot1.585\\ &=0.81125 \end{align} \)