Lecture 3 - 2025 / 3 / 4

r.v. $X = (m_1, \cdots, m_n)$ pmf $p = (p_1, \cdots, p_n)$

$H(X) := \sum_{i=1}^{n} p_i \log_2 \frac{1}{p_i} \qquad (\text{bits})$

Information

$X : p_1, p_2, \cdots, p_{n-1}, p_n$ , where $p_n = q_1 + q_2$

$Y : \dfrac{q_1}{q_1 + q_2}, \dfrac{q_2}{q_1 + q_2}$

$Z : p_1, p_2, \cdots, p_{n-1}, q_1, q_2$

$H(Z) = H(X) + p_n H(Y)$

r.v. $X, P = (p_1, \cdots, p_n)$

Code $C = (c_1, \cdots, c_n), c_i \in \{0, 1\}^*$

Goal: $\sum p_i |c_i|$ is minimal. Optimal code.

Assume $p_1 \ge p_2, \cdots, p_n$ , then $|c_1| \le |c_2| \le \cdots \le |c_n|$ .
$|c_n| = |c_{n-1}| \Rightarrow$ sibling nodes.
If $(c_1, \cdots, c_n)$ is optimal code for $(p_1, \cdots, p_n)$ , then $(c_1, \cdots, c_{n-2}, \tilde c_{n-1})$ is optimal code for $(p_1, \cdots, p_{n-2}, p_{n-1} + p_n)$ .

r.v. $X, Y$ joint probability distribution $P_{XY} = (p_{ij})_{m\times n}$

$H(X, Y) := \sum_{ij}p_{ij} \log_2 \dfrac{1}{p_{ij}} \qquad \rm (bits)$

When $X, Y$ are independent:
$H(X, Y) = H(X) + H(Y)$

When $X = Y$ :
$H(X, Y) = H(X) = H(Y)$

r.v. $X, Y$
$H(Y | X = x_i) := \sum_{j=1}^{n} P(Y = y_j | X = x_i) \log_2 \dfrac{1}{P(Y = y_j | X = x_i)}$

Definition (conditional entropy)
$H(Y | X) = \sum_{i=1}^{m} P(X = x_i) \cdot H(Y | X = x_i)$

We have:
$H(X, Y) = H(Y | X) + H(X) = H(X | Y) + H(Y)$