Lecture 6 - 2025 / 3 / 6
Probability amplification using pairwise independence
Claim: 随机变量 a,b∼U(Zq),q 是质数,则
{ax+b∣x∈Zq}
是一组两两独立的随机变量,且同分布于 U(Zq)。
首先 ∀x,c∈Zq,Pr[ax+b=c]=q1,故 ax+b∼U(Zq)。
考虑 ∀x,y,c1,c2∈Zq,x=y,则 Pr[ax+b=c1,ay+b=c2]=q21=Pr[ax+b=c1]Pr[ay+b=c2]。(因为关于 a,b 的方程有唯一解)从而两两独立。
假设现在已有一个随机算法 A,依赖 m 个随机 bits,用来判断 x∈L⊆{0,1}n 是否成立。而且满足:
x∈L⇒Pr[A output Yes]≥21x∈/L⇒Pr[A output Yes]=0
现在试图将这个算法泛化到任何正确性。如果独立重复 t 次,可以做到 Pr[E]≤2−t,从而如果需要达到 r1 的正确率,则需要生成 mlogr 个随机 bits。
Theorem: 对于 r≤2m,可以只生成 2m 随机 bits,在 O(rm) 的时间复杂度内达到 Pr[E]≤2−t 的效果。
考虑生成 r 组两两独立的长度为 m 的随机 bits。形式化的说,每组随机 bits 可以看作从 U({0,1}m)≅U(Z2m) 采样的随机变量,这 r 个随机变量两两独立。一个不太完美的做法可以利用上面 Claim 的算法,取质数 2m≤q≤2m+1,通过 rejection sampling 可以通过生成期望 O(m) 个随机 bits 得到 U({0,1}m) 中 r 组两两独立的比特串。
然后运行算法 A r 次。用 Xi=0/1 代表第 i 次 A 的输出,输出 Yes 时 Xi=1。定义 X=∑i=1rXi。
当 x∈L 时,发生错误的概率为
Pr[E]=Pr[X=0]≤Pr[∣X−E[X]∣≥E[X]]≤E[X]2Var[X]
其中由于两两独立,Var[X]=i=1∑rVar[Xi]≤4r,E[X]≥2r,从而 Pr[E]≤r1。
Derandomization using k-wise independence
考虑给一张完全图 Kn 的边二染色,要求没有同色 k-clique,这里 n=2k/2,根据之前的概率方法,染色方案是存在的。
如果要求出一种方案,一种暴力的策略是枚举 2(2n) 种染色方案。
回顾概率证法,设 X 为同色 k-clique 数量,
E[X]=(kn)2(2k)2<1
这里其实并不要求所有边的染色全部独立。事实上,只要每 (2k) 条边的染色是相互独立的即可。
考虑一族 (2k)-wise 独立的染色方案,其中每条边的颜色边际分布是均匀的。根据上述概率证法,E[X] 不变,从而这族染色方案中一定存在一个合法方案。
推广 Claim 到 ax2+bx+c,不难看出,要生成服从 U(Zq) 的 (2k)-wise 独立的随机变量,只需要采样 (2k) 个服从 U(Zq) 的变量。这里需要 q≥(2n),以保证能够生成足够数量的随机变量。
从而我们枚举 q(2k) 种采样的可能性,然后通过固定的解码策略得到唯一对应的 (2k)-wise 独立的边染色方案。在这族方案上,E[X]<1,从而其中必有可行解。
由于 q(2k)≃nO(k2),相较于暴力做法 2O(n),我们将复杂度降到了多项式级别。
Universal hashing
Definition (2-universal): 一个 U→T 的函数集 H 是 2-universal 的当且仅当 ∀x,y∈U,x=y,有
h∈HPr[h(x)=h(y)]≤∣T∣1
例如,ha,b(x)=(ax+b)modqmod∣T∣,其中 a,b∼U(Zq),q>∣U∣。
Pr[ha,b(x)=ha,b(y)]≤c1≡c2(mod∣T∣)∑Pr[ha,b(x)=c1]Pr[ha,b(y)=c2]=∣T∣q2⋅q1⋅q1=∣T∣1∀x=y