Lecture 13 - 2025 / 3 / 31

Power of 2 Choices (2)

Theorem:nn 个球独立放入 nn 个桶中,每个球随机选择两个桶,放入负载较小的那个桶,最大负载量 w.h.p 不超过 lnlnnln2+Θ(1)\dfrac{\ln \ln n}{\ln 2} + \Theta(1)

分两个阶段对该定理进行证明。不妨设 β6=n2e\beta_6 = \dfrac{n}{2e},则 B6β6B_6 \le \beta_6 是 trivial 的,因为 6\ge 6 的桶的个数不超过 n6<n2e\dfrac{n}{6} < \dfrac{n}{2e}。对于 i>6i > 6,定义 βi+1=eβi2n\beta_{i+1} = \dfrac{e\beta_i^2}{n}

Claim: 对于任意 i>6,βi22nlnni > 6, \beta_i^2 \ge 2n \ln n 时,有 Pr[Bi>βi]in2\Pr[B_i > \beta_i] \le \dfrac{i}{n^2}

归纳法。显然有 Pr[Bi+1>βi+1]Pr[Bi+1>βi+1,Biβi]+Pr[Bi>βi]\Pr[B_{i+1} > \beta_{i+1}] \le \Pr[B_{i+1} > \beta_{i+1}, B_{i} \le \beta_i] + \Pr[B_i > \beta_i]。后项根据归纳假设 in2\le \dfrac{i}{n^2}

接下来试图说明前一项不超过 Pr[B(n,(βi/n)2)>βi+1]\Pr[\mathcal B(n, (\beta_i / n)^2) > \beta_{i+1}],从而根据 Chernoff bound Pr[Xeμ]eμ\Pr[X \ge e\mu] \le e^{-\mu} 得知不超过 exp(βi2/n)1n2\exp(-\beta_i^2/n) \le \dfrac{1}{n^2},于是即可证毕。

定义 Bi(j)B_i^{(j)} 代表当我们放置第 jj 个球之前,负载量 i\ge i 的桶的个数。用 XjX_j 作为第 jj 个球的高度是否 i+1\ge i+1 的 indicator。则易见 Bi+1XjB_{i+1} \le \sum X_j
Pr[Bi+1>βi+1,Biβi]Pr[j=1nXj>βi+1,Biβi]\begin{aligned} \Pr[B_{i+1} > \beta_{i+1}, B_i \le \beta_i] & \le \Pr\left[\sum_{j=1}^{n} X_j > \beta_{i+1}, B_i \le \beta_i\right] \\ \end{aligned}

从而将右侧写作 xj>βi+1Pr[X1=x1,,Xm=xm,Biβi]\sum_{\sum x_j > \beta_{i+1}} \Pr[X_1 = x_1, \cdots, X_m = x_m, B_i \le \beta_i],对于其中每一项
Pr[X1=x1,,Xm=xm,Biβi]= Pr[X1=x1,,Xm=xm,Bi(1)βi,,Bi(m)βi] Pr[X1=x1,Bi(1)βi]Pr[Xm=xm,Bi(m)βiXj=xj,Bi(j)βi]= f1(x1)fm(xm;x1,,xm1)\begin{aligned} & \Pr[X_1 = x_1, \cdots, X_m = x_m, B_i \le \beta_i] \\ =\ & \Pr[X_1 = x_1, \cdots, X_m = x_m, B_i^{(1)} \le \beta_i, \cdots, B_i^{(m)} \le \beta_i] \\ \le\ & \Pr[X_1 = x_1, B_i^{(1)} \le \beta_i] \cdots \Pr[X_m = x_m, B_i^{(m)} \le \beta_i \mid X_j = x_j, B_i^{(j)} \le \beta_i] \\ = \ & f_1(x_1) \cdots f_m(x_m; x_1, \cdots, x_{m-1}) \end{aligned}

其中 fj(xj;x1,,xj1)=Pr[Xj=xj,Bi(j)βiX1=x1,Bi(1)βi,,Xj1=xj1,Bi(j1)βi]f_j(x_j; x_1, \cdots, x_{j-1}) = \Pr[X_j = x_j, B_i^{(j)} \le \beta_i \mid X_1 = x_1, B_i^{(1)} \le \beta_{i}, \cdots, X_{j-1} = x_{j-1}, B_i^{(j-1)} \le \beta_{i}]。下面说明 fj(1,x1,,xj1)(βi/n)2f_j(1, x_1, \cdots, x_{j-1}) \le (\beta_i / n)^2

实际上这是因为,我们可以通过全概率公式枚举 Bi(j)B_i^{(j)} 的值,而 condition on Bi(j)B_i^{(j)} 的值后,Pr[Xj=xj]\Pr[X_j = x_j] 是完全与 x1,,xj1x_1, \cdots, x_{j-1} 的情况无关的。也就是说,
fj(1,x1,,xj1)=bi(j)βiPr[Xj=1Bi(j)=bi(j)]Pr[Bi(j)=bi(j)](βin)2bi(j)βiPr[Bi(j)=bi(j)]=(βin)2\begin{aligned} f_j(1, x_1, \cdots, x_{j-1}) & = \sum_{b_i^{(j)} \le \beta_i} \Pr[X_j = 1 \mid B_i^{(j)} = b_i^{(j)}] \Pr[ B_i^{(j)} = b_i^{(j)} \mid \cdots] \\ & \le \left( \frac{\beta_i}{n} \right)^2 \sum_{b_i^{(j)} \le \beta_i} \Pr[ B_i^{(j)} = b_i^{(j)} \mid \cdots]\\ & = \left( \frac{\beta_i}{n} \right)^2 \end{aligned}

至此,我们证明了 fj(xjx1,,xj1)B(1,(βi/n)2)f_j(x_j \mid x_1, \cdots, x_{j-1}) \preceq \mathcal B(1, (\beta_i / n)^2)。根据 stochastic dominance 的 Lemma 证毕。

ii^* 是第一个满足 βi2<2nlnn\beta_i^2 < 2n \ln nii,则容易看出 i=lnlnnln2+O(1)i^* = \dfrac{\ln \ln n}{\ln 2} + O(1),我们手动分析最后两个阶段。

Claim: Pr[Bi+16lnn]=O(1/n)\Pr[B_{i^* + 1} \ge 6 \ln n] = O(1/n)

根据 Pr[Bi+16lnn]Pr[Bi+16lnn,Bi2nlnn]+Pr[Bi>2nlnn]\Pr[B_{i^* + 1} \ge 6 \ln n] \le \Pr[B_{i^* + 1} \ge 6 \ln n, B_{i^*} \le \sqrt{2n \ln n}] + \Pr[B_{i^*} > \sqrt{2n \ln n}],后面一项由前面的归纳法 1/n\le 1/n,而前面一项使用前面类似的 Stochastic dominance 的技术 Pr[B(n,2lnn/n)6lnn]1/n2\le \Pr[\mathcal B(n, 2\ln n / n) \ge 6 \ln n] \le 1/n^2(Chernoff bound)。

Claim: Pr[Bi+21]O(log2n/n)\Pr[B_{i^* + 2} \ge 1] \le O(\log^2 n / n)

根据 Pr[Bi+21]Pr[Bi+21,Bi+16lnn]+Pr[Bi+1>6lnn]\Pr[B_{i^* + 2} \ge 1] \le \Pr[B_{i^* + 2} \ge 1, B_{i^* + 1} \le 6 \ln n] + \Pr[B_{i^* + 1} > 6 \ln n],后面一项由前面的 Claim O(1/n)\le O(1/n),而前面一项使用 Stochastic dominance 的技术 Pr[B(n,(6lnn/n)2)1](6lnn)2/n\le \Pr[\mathcal B(n, (6 \ln n / n)^2) \ge 1] \le (6 \ln n)^2 / n(union bound)。

事实上,最大负载量的下界也是 w.h.p Ω(lnlnn)\Omega(\ln \ln n) 的。如果每次选择 dd 个桶,则最大负载量 w.h.p 是 lnlnnlnd+O(1)\dfrac{\ln \ln n}{\ln d } + O(1)

Galton-Watson Branching Process

XX 是一个非负整数 r.v.,XX 定义的分支过程从时间 00 的一个单点开始,每次分支生成 xXx \sim X 个儿子,并对每个儿子分别独立进行下去。

ZiZ_i 代表时间 ii 的结点数量,则 Z0=1Z_0 = 1,将灭绝的概率定义为
Pr[extinction]=limnPr[Zn=0]\Pr[\text{extinction}] = \lim_{n\to \infty} \Pr[Z_n = 0]

Theorem: 对于一个 XX 定义的分支过程,Pr[X=1]<1,Pr[X=0]>0\Pr[X = 1] < 1, \Pr[X = 0] > 0,有

qnq_n 为时间 nn 灭绝的概率,即 qn=Pr[Zn=0]q_n = \Pr[Z_n = 0],其中 q0=0q_0 = 0,我们可以针对第 1 步分裂情况进行讨论,从而列出递推方程 qn=f(qn1)q_n = f(q_{n-1})

根据实际含义容易看出 0<q1q2q310 < q_1 \le q_2 \le q_3 \le \cdots \le 1,也就是 (qn)(q_n) 单调递增且有界,故必然收敛到 q1q^* \le 1

注意到 f(x)f(x) 是在 [0,1][0, 1] 内的严格递增函数,且严格凸的函数,我们针对 y=f(x)y=f(x)y=xy = x 的关系进行讨论。注意 E[X]=f(1)\mathbb E[X] = f'(1)