Lecture 12 - 2025 / 3 / 27
Balls and Bins (2)
Lemma: 设 E 是关于 bin loads 的事件,且 Pr[E] 关于 m 递增是单调上升 / 单调下降的,则 PrX[E]≤4PrY[E],其中 X 为 Balls and Bins 模型,Y 为 n 个独立的 π(m/n)。
不妨设 Pr[E] 单调上升,则
YPr[E]=k=0∑∞YPr[E∣i=1∑nYi=k]Pr[i=1∑nYi=k]≥k=m∑∞YPr[E∣i=1∑nYi=m]Pr[i=1∑nYi=k]≥YPr[E∣i=1∑nYi=m]Pr[i=1∑nYi≥m]≥XPr[E]⋅41
最后一步用到对于 λ∈N,对于 X∼π(λ),有 Pr[X≥λ]≥1/4。
Corollary: Pr[∀i,Xi≤c]≤4Pr[∀i,Yi≤c]
Theorem: 将 n 个球独立均匀放进 n 个桶里,最大负载量 w.h.p 是 Ω(lnlnnlnn)。
记 E2 表示所有 Yi≤(1−ε)lnlnnlnn 我们需要证明 Pr[E2]=1/poly(n)。
由于 Y1∼π(1),所以 Pr[Y1≥k]=∑j=k∞j!e−1≤k!1。这是因为 e=1+1/2+1/3!+⋯。当然,更直接的有 Pr[Y1≥k]≥ek!1。
Pr[E2]=(1−Pr[Y1≥k])n≤(1−ek!1)n≤exp(−ek!n)≤exp(−exp(Θ(εlnn)))=exp(−nΘ(ε))
于是以指数速度趋于 0。
综上所述,最大负载量 w.h.p 是 Θ(lnlnnlnn)。
Stochastic Dominance
Definition (SD w.r.t. random variables): 对于两个在 [a,b] 上的随机变量 X,Y,如果 ∀c∈[a,b],Pr[Y≥c]≥Pr[X≥c],则称 Y stochastic dominates X,记作 X⪯Y。
Definiton (SD w.r.t. functions): 对于两个在 [a,b] 上的函数 f,g,如果 ∀c∈[a,b]
∫x≥cf(x)dx≤∫y≥cg(y)dy
则称 f stochastic dominates g,记作 f⪯g。
Lemma: X1⪯Y1,X2⪯Y2,且 X1,X2 独立,Y1,Y2 独立,则 X1+X2⪯Y1+Y2。
对于任何 c,我们只需证明 Y1+X2⪯Y1+Y2,则根据对称性得证。
Pr[Y1+Y2≥c]=y1∑Pr[Y1=y1]Pr[Y2≥c−y1]≥y1∑Pr[Y1=y1]Pr[X2≥c−y1]=Pr[Y1+X2≥c]
Corollary: 如果函数列 {gj}j=1m 和 {fj}j=1m 满足 fj(⋅;x1,⋯,xi−1)⪯gj(⋅),则
∫∑xj≥cf1(x1)⋯fm(xm;x1,⋯,xm−1)dx≤∫∑xj≥cg1(x1)⋯gm(xm)dx
归纳法,先固定 x1,⋯,xm−1,将 fm(⋅;x1,⋯,xm−1) 替换为 g(⋅),然后重复上述过程。
Power of 2 Choices (1)
将 m 个球独立放入 n 个桶中,每个球随机选择两个桶,放入负载较小的那个桶。
Theorem: m=n 时,最大负载量 w.h.p 不超过 ln2lnlnn+Θ(1)。
证明的大体思路是,设 Bi 为负载量 ≥i 的桶的个数。我们试图找到一系列 bound βi,使得 w.h.p Bi≤βi,则对于任何一个特定的球,其落在负载 ≥i 的桶的概率 ≤(nβi)2。从而 Bi+1⪯B(n,(βi/n)2),均值为 βi2/n,可以根据 Chernoff bound 取 βi+1=cβi2/n,于是有 nβi+1=c(nβi)2,即 βi/n 平方速度下降,当 i≈ln2lnlnn 时有 βi<1,这便是最大负载量。