自己情報量
自己情報量の定義
情報量とは、ある情報がどれだけ「驚き」を持っているかを表す指標です。 情報量が満たすべき性質として、次が挙げられます。
- 複数の独立事象が起きたとき、全体の情報量は各情報量の和になる
- 起きる確率が高い事象ほど、情報量は小さい
これを数学的に表してみます。
\(a,b\) を事象とする。 \[ I(ab)=I(a)+I(b) \] \[ P(a)\lt P(b)\Longleftrightarrow I(a)\gt I(b) \] これらを満たす関数は \[ I(x)=-\log(x) \] である。証明
以上より、次のように情報量を定義します。
\(X\) を確率変数とし、\(p(x)=P(X=x)\) とするとき
を事象 \(\{X=x\}\) の自己情報量という。
底は \(2\) の他に \(e,3,10\) なども考えられますが、情報理論では \(2\) を底とします。
例題
ある地域では、年間、雨の日は60日、雪の日は3日間だけである。 この地域で、次の場合の自己情報量を求めよ。(小数第2位まで)
- 「今日は雪だった」と聞いたとき
- 「今日は雨か雪だった」と聞いた後に「今日は雪だった」と判明したとき
解答
-
「今日は雪である」という事象を \(A\) とする。 この地域で雪が降る確率は
\[ P(A)=\displaystyle\frac{3}{365} \]よって、求める自己情報量は
\[ I(A)=-\log_2\frac{3}{365}=6.93~\mathrm{bit} \] -
「今日は雨か雪である」という事象を \(B\) とする。 「今日は雨か雪である」と聞いた後に「今日は雪である」という確率は
\[ P(A|B)=\frac{P(A\cap B)}{P(B)}=\frac{\frac{3}{360}}{\frac{60+3}{360}}=\frac{3}{63}=\frac{1}{21} \]よって、求める自己情報量は
\[ I(A|B)=-\log_2\frac{1}{21}=4.39~\mathrm{bit} \]
補足:事前に雨か雪であることを知っている分、(2)の情報量は(1)より少ない。