Lecture 6 - 2025 / 3 / 6

Probability amplification using pairwise independence

Claim: 随机变量 a,bU(Zq)a, b \sim U(\Z_q)qq 是质数,则
{ax+bxZq}\{ ax + b \mid x \in \Z_q \}

是一组两两独立的随机变量,且同分布于 U(Zq)U(\Z_q)

首先 x,cZq,Pr[ax+b=c]=1q\forall x, c \in \Z_q , \Pr[ax + b = c] = \dfrac 1 q,故 ax+bU(Zq)ax + b \sim U(\Z_q)

考虑 x,y,c1,c2Zq,xy\forall x, y, c_1, c_2 \in \Z_q, x \ne y,则 Pr[ax+b=c1,ay+b=c2]=1q2=Pr[ax+b=c1]Pr[ay+b=c2]\Pr[ax + b = c_1, ay + b = c_2] = \dfrac{1}{q^2} = \Pr[ax + b = c_1] \Pr[ay + b = c_2]。(因为关于 a,ba, b 的方程有唯一解)从而两两独立。

假设现在已有一个随机算法 AA,依赖 mm 个随机 bits,用来判断 xL{0,1}nx \in L \sube \{0, 1\}^n 是否成立。而且满足:
xLPr[A output Yes]12xLPr[A output Yes]=0x \in L \Rightarrow \Pr[A \text{ output Yes} ] \ge \frac 1 2 \\ x \notin L \Rightarrow \Pr[A \text{ output Yes}] = 0

现在试图将这个算法泛化到任何正确性。如果独立重复 tt 次,可以做到 Pr[E]2t\Pr[\cal E] \le 2^{-t},从而如果需要达到 1r\dfrac 1 r 的正确率,则需要生成 mlogrm \log r 个随机 bits。

Theorem: 对于 r2mr \le 2^m,可以只生成 2m2m 随机 bits,在 O(rm)O(rm) 的时间复杂度内达到 Pr[E]2t\Pr[\cal E] \le 2^{-t} 的效果。

考虑生成 rr 组两两独立的长度为 mm 的随机 bits。形式化的说,每组随机 bits 可以看作从 U({0,1}m)U(Z2m)U(\{0,1\}^m) \cong U(\Z_{2^m}) 采样的随机变量,这 rr 个随机变量两两独立。一个不太完美的做法可以利用上面 Claim 的算法,取质数 2mq2m+12^m \le q \le 2^{m+1},通过 rejection sampling 可以通过生成期望 O(m)O(m) 个随机 bits 得到 U({0,1}m)U(\{0,1\}^m)rr 组两两独立的比特串。

然后运行算法 AA rr 次。用 Xi=0/1X_i = 0/1 代表第 iiAA 的输出,输出 Yes 时 Xi=1X_i = 1。定义 X=i=1rXiX = \sum_{i=1}^{r} X_i

xLx\in L 时,发生错误的概率为
Pr[E]=Pr[X=0]Pr[XE[X]E[X]]Var[X]E[X]2\Pr[\mathcal{E}] = \Pr[X = 0] \le \Pr[|X - \mathbb E[X]| \ge \mathbb{E}[X]] \le \frac{\mathrm{Var}[X]}{\mathbb{E}[X]^2}

其中由于两两独立,Var[X]=i=1rVar[Xi]r4,E[X]r2\text{Var}[X] = \sum\limits_{i=1}^{r} \text{Var}[X_i] \le \dfrac{r}{4}, \mathbb{E}[X] \ge \dfrac r 2,从而 Pr[E]1r\Pr[\mathcal{E}] \le \dfrac 1 r

Derandomization using kk-wise independence

考虑给一张完全图 KnK_n 的边二染色,要求没有同色 kk-clique,这里 n=2k/2n = 2^{k/2},根据之前的概率方法,染色方案是存在的。

如果要求出一种方案,一种暴力的策略是枚举 2(n2)2^{\binom n 2} 种染色方案。

回顾概率证法,设 XX 为同色 kk-clique 数量,
E[X]=(nk)22(k2)<1\mathbb E[X] = \binom n k \dfrac{2}{2^{\binom{k}{2}}} < 1

这里其实并不要求所有边的染色全部独立。事实上,只要每 (k2)\binom k 2 条边的染色是相互独立的即可。

考虑一族 (k2)\binom k 2-wise 独立的染色方案,其中每条边的颜色边际分布是均匀的。根据上述概率证法,E[X]\mathbb E[X] 不变,从而这族染色方案中一定存在一个合法方案。

推广 Claimax2+bx+ca x^2 + b x + c,不难看出,要生成服从 U(Zq)U(\Z_q)(k2)\binom k 2-wise 独立的随机变量,只需要采样 (k2)\binom k 2 个服从 U(Zq)U(\Z_q) 的变量。这里需要 q(n2)q \ge \binom n 2,以保证能够生成足够数量的随机变量。

从而我们枚举 q(k2)q^\binom{k}{2} 种采样的可能性,然后通过固定的解码策略得到唯一对应的 (k2)\binom k 2-wise 独立的边染色方案。在这族方案上,E[X]<1\mathbb E[X] < 1,从而其中必有可行解。

由于 q(k2)nO(k2)q^\binom k 2\simeq n^{O(k^2)},相较于暴力做法 2O(n)2^{O(n)},我们将复杂度降到了多项式级别。

Universal hashing

Definition (22-universal): 一个 UTU \to T 的函数集 H\mathfrak{H}22-universal 的当且仅当 x,yU,xy\forall x, y \in U, x \ne y,有
PrhH[h(x)=h(y)]1T\Pr_{h \in \mathfrak{H}} [h(x) = h(y)] \le \frac{1}{|T|}

例如,ha,b(x)=(ax+b)modqmodTh_{a,b}(x) = (ax + b)\bmod q \bmod |T|,其中 a,bU(Zq),q>Ua, b \sim U(\Z_q), q > |U|

Pr[ha,b(x)=ha,b(y)]c1c2(modT)Pr[ha,b(x)=c1]Pr[ha,b(y)=c2]=q2T1q1q=1Txy\begin{aligned} \Pr[h_{a,b}(x) = h_{a,b}(y)] & \le \sum_{c_1 \equiv c_2 \pmod {|T|}} \Pr[h_{a,b}(x) = c_1] \Pr[ h_{a,b}(y)=c_2] \\ & = \frac{q^2}{|T|} \cdot \frac 1 q \cdot \frac 1 q = \dfrac 1 {|T|}\qquad \forall x \ne y \end{aligned}