Lecture 19 - 2025 / 4 / 24

Ballot

有两个竞选者 A, B,分别收到 a,ba, b 张票。假设选票按随机顺序计入,a>ba > b,则 A 的选票数量一直 >> B 的选票数量的概率是多少。

定义 SkS_kkk 轮后 A, B 的选票数量之差,则 Sn=abS_n = a - b。定义 Xk=SnknkX_k = \dfrac{S_{n-k}}{n-k},即倒过来看,X0=aba+bX_0 = \dfrac{a-b}{a + b}

Claim: (Xk)(X_k) 是鞅。

在给定 Xk1X_{k-1} 的情况下,此时 A, B 的选票数量 a,ba', b' 满足 Xk1=aba+bX_{k-1} = \dfrac{a'-b'}{a' + b'}。因此
E[XkXk1]=aa+b(a1)ba+b1+ba+ba(b1)a+b1=a(a1)b(b1)(a+b)(a+b1)=(ab)(a+b1)(a+b)(a+b1)=Xk1\begin{aligned} \mathbb E[X_k \mid X_{k-1}] & = \frac{a'}{a' + b'} \cdot \frac{(a'-1) - b'}{a' + b' - 1} + \frac{b'}{a' + b'} \cdot \frac{a' - (b' - 1)}{a' + b' - 1}\\ & = \frac{a' (a' - 1) - b'(b' - 1)}{(a' + b')(a' + b' - 1)}\\ & = \frac{(a' - b')(a' + b' - 1)}{(a' + b')(a' + b' - 1)} = X_{k-1} \end{aligned}

定义 T=min{kXk=0}T = \min\{k \mid X_k = 0\} 或者 n1n - 1 如果 kk 不存在。

从而第一种情况的概率,即答案为 E[XT]=E[X0]=aba+b\mathbb E[X_T]=\mathbb E[X_0] = \dfrac{a-b}{a+b}

Submartingale

Definition (sub/supmartingale): (Xi)(X_i) 是关于 filter (Fi)(\mathcal F_i)下鞅如果
E[XiFi1]Xi1\mathbb E[X_i \mid \mathcal F_{i-1}] \ge X_{i- 1}

反之,是上鞅如果
E[XiFi1]Xi1\mathbb E[X_i \mid \mathcal F_{i-1}] \le X_{i- 1}

在满足相应条件下,关于下鞅,有 E[XT]E[X0]\mathbb E[X_T] \ge \mathbb E[X_0];对于上鞅,有 E[XT]E[X0]\mathbb E[X_T] \le \mathbb E[X_0]

基于此可以有一种 bound E[T]\mathbb E[T] 的方式:

Di=XiXi1D_i = X_i - X_{i-1},假设 (Xi)(X_i) 是一个鞅,即 E[DiX1,,Xi1]=0\mathbb E[D_i \mid X_1, \cdots, X_{i-1}] = 0,并且有 E[Di2X1,,Xi1]σ2\mathbb E[D_i^2 \mid X_1, \cdots, X_{i-1}] \ge \sigma^2。那么设 Yi=Xi2σ2iY_i = X_i^2 - \sigma^2 \cdot i ,从而
E[YiX1,,Xi1]=E[Xi2X1,,Xi1]σ2i=E[Di2X1,,Xi1]+Xi12σ2iσ2+(Yi1+σ2(i1))σ2i=Yi1\begin{aligned} \mathbb E[Y_i \mid X_1, \cdots, X_{i-1}] & = \mathbb E[X_i^2 \mid X_1, \cdots, X_{i-1}] - \sigma^2 \cdot i \\ & = \mathbb E[D_i^2 \mid X_1, \cdots, X_{i-1}] + X_{i-1}^2 - \sigma^2 \cdot i\\ & \ge \sigma^2 + (Y_{i-1} + \sigma^2 \cdot (i-1)) - \sigma^2 \cdot i \\ & = Y_{i-1} \end{aligned}

这表明 (Yi)(Y_i) 是一个下鞅,从而对于一个停时 TT
E[YT]E[Y0]E[T]E[XT2]E[X02]σ2\mathbb E[Y_T] \ge \mathbb E[Y_0] \quad \Rightarrow \quad \mathbb E[T] \le \frac{\mathbb E[X_T^2] - \mathbb E[X_0^2]}{\sigma^2}

现在考虑一个上鞅 (Xi)(X_i),定义在区间 [0,n][0, n] 上,X0=sX_0 = s,满足:
E[DiX1,,Xi1]0E[Di2X1,,Xi1]σ2\mathbb E[D_i \mid X_1, \cdots, X_{i-1}] \le 0\\ \mathbb E[D_i^2 \mid X_1, \cdots, X_{i-1}] \ge \sigma^2

Claim:TT 是第一次到达 00 的时刻,E[T]2nss2σ2n2σ2\mathbb E[T] \le \dfrac{2ns - s^2}{\sigma^2} \le \dfrac{n^2}{\sigma^2}

构造 Yi=Xi22nXiσ2iY_i = X_i^2 - 2n X_i -\sigma^2 i,可以验证 YiY_i 是一个下鞅,从而
E[YT]E[Y0]E[T]2nss2σ2n2σ2\mathbb E[Y_T] \ge \mathbb E[Y_0] \quad \Rightarrow \quad \mathbb E[T] \le \frac{2ns - s^2}{\sigma^2} \le \frac{n^2}{\sigma^2}

Random 2-SAT

对于一个有 nn 个变量的 2-CNF ϕ\phi,任意选定一个起始赋值 a0a_0。如果 ϕ\phi 不满足,则任取一个没满足的 clause C0C_0,任选其中的一个 literal 并翻转之。

Claim: 如果 ϕ\phi 是可满足的,则上述随机算法在期望 O(n2)O(n^2) 次找到一个合法赋值。

任取一个合法赋值 aa^*,用 XiX_i 代表 ii 轮后的赋值 aia_iaa^* 的 Hamming 距离,则当 aia_i 仍是不满足的赋值时,
XiXi1=1,Pr[XiXi1=1]12|X_i - X_{i-1}| = 1, \quad \Pr[X_i - X_{i-1} = -1] \ge \frac 1 2

后者是因为一个错误的 clause 当中所涉及的两个变量,不妨在 aa^* 中的赋值是 0000,则在 ai1a_{i-1} 中的赋值只可能是 01,10,1101, 10, 11。对于前两者 Hamming 距离期望不变,而对于最后一种情况 Hamming 距离一定 1-1

因此设 Di=XiXi1D_i = X_i - X_{i-1},则有
E[DiX1,,Xi1]0E[Di2X1,,Xi1]=1\mathbb E[D_i \mid X_1, \cdots, X_{i-1}] \le 0\\ \mathbb E[D_i^2 \mid X_1, \cdots, X_{i-1}] = 1

从而根据前述结论,有 E[steps to a]n2\mathbb E[\text{steps to }a ^*] \le n^2

注:事实上在上述迭代过程中可能中途即出现 aiaa_i \ne a^* 已经满足了 ϕ\phi 的情况,此时迭代会收敛,因为找不到“错误的 clause”,但这是有助于结论的,故不做考虑。