Lecture 15 - 2025 / 4 / 10

Giant Component (2)

Theorem: 对于 GGn,pG \in \mathcal G_{n, p},其中 p=cnp = \dfrac c nc>1c > 1 是一个常数,则 a.a.s. GG 存在唯一一个最大的连通分支大小是 βn(1+o(1))\beta n(1 + o(1)),其中 β\beta(0,1)(0,1) 之间 β+eβc=1\beta + e^{-\beta c} = 1 的唯一解。其余的连通块大小都是 O(logn)O(\log n) 级别。

Claim: 对于所有结点 vv,a.a.s 以下两者之一成立:

  1. vv 开始的 braching process 在 kk^- 步内停止。
  2. k\forall k s.t. kkk+k^- \le k \le k^+,从 vv 开始的 branching process 在 kk 步后,至少有 (c1)k/2(c-1)k/2 个已探索但是没有饱和的结点。

对于后者,实际上只需要证明从 vv 开始总共至少探索到了
(c1)k2+k=(c+1)k2\frac{(c-1)k}{2} + k = \frac{(c+1)k}{2}

个点。我们定义一个点 vvkk-bad 的,如果从 vv 开始的 branching process 在 kk 步后停止或者探索到了少于 (c+1)k/2(c+1)k/2 个点。

因此,当 vvkk-bad 时,从 vv 开始的 branching process 被每次展开服从 B(n(c+1)k+2,cn)\mathcal B\left(n - \dfrac{(c+1)k^+}{2}, \dfrac{c}{n}\right) 的过程支配(因为总共涉及到的点数不超过 (c+1)k+/2(c+1)k^+/2,因此 B(n?,p)\mathcal B(n-?, p)?? 处不高于这个值)。

进而从 vv 开始的 branching process 在 kk 步内展开的点数,不低于 kk 次采样 B(n(c+1)k+2,cn)\mathcal B\left(n - \dfrac{(c+1)k^+}{2}, \dfrac{c}{n}\right) 展开的点数。

「上面这一步并没有理解,如果 branching process 提前终止了,为什么还能 dominate 固定次数采样的求和?」

从而 a.a.s 从任何一个点 vv 开始的 branching process 要么在 k=O(logn)k^- = O(\log n) 轮终止,要么持续至少 k+=n2/3k^+ = n^{2/3} 轮。记前面的一类点是 small 的,后面的一类是 large 的。

Lemma: a.a.s. 存在唯一的一个连通块,包含了所有 large 点。

考虑两个 large 的 uvu \ne v。分别从 u,vu, v 独立进行 branching process,则在 k+k^+ 轮后,两者已探索未饱和的点分别记作 U(u),U(v)U(u), U(v),则这两个集合大小都 c12k+\ge \dfrac{c-1}{2} k^+

如果前 k+k^+ 步已经遇到公共点了,则 u,vu, v 已连通。否则我们证明 w.h.p. U(u),U(v)U(u), U(v) 之间有边。
Pr[edge between U(u),U(v)](1p)(c12k+)2exp(p(c12k+)2)exp(c(c1)24n1/3)=o(n2)\begin{aligned} \Pr[\nexists\text{edge between } U(u), U(v)] & \le (1 - p)^{(\frac{c-1}{2}k^+)^2}\\ & \le \exp\left( -p \left(\frac{c-1}{2}k^+\right)^2 \right)\\ & \le \exp\left( -\frac{c(c-1)^2}{4} n^{1/3} \right)\\ & = o(n^{-2}) \end{aligned}

从而对所有 u,vu, v 进行 union bound 立刻得到总概率是 o(1)o(1)

至此已经证明了最大连通块的唯一性,以及所有小连通块都是 O(logn)O(\log n),只剩下判断最大连通块的大小了。我们通过对 small 点计数来证明此。

Lemma: a.a.s. small 点的个数是 (1+o(1))(1β)n(1 + o(1)) (1 - \beta) n

根据 small 点的定义,可以知道 Pr[v is small]\Pr[v \text{ is small}]

更进一步,用 d(n,p)d(n,p) 表示服从 B(n,p)\mathcal B(n, p) 的 branching process 终止的概率:

n+n \to +\infty 时,根据泊松分布的结论,d(n,c/n)1βd(n, c/n) \to 1 - \beta,其中 β\beta(0,1)(0, 1) 之间 β+eβc=1\beta + e^{-\beta c} = 1 的解。同时因为 knk^- \ll n,所以 d(nk,c/n)1βd(n - k^-, c / n) \to 1 - \beta。根据 sandwiching 定理,可以知道
Pr[v is small]1β=:α\Pr[v \text{ is small}] \to 1 - \beta =: \alpha

Z=vZvZ = \sum_v Z_v 代表 small 点的个数,我们通过 Chebyshev 给 ZZ 一个 concentration bound。则 E[Zv]α,E[Z]=(1+o(1))αn\mathbb E[Z_v] \to \alpha, \mathbb E[Z] = (1 + o(1)) \alpha n
E[Z2]=E[Z]+uvE[ZuZv]=E[Z]+vPr[v is small]uvPr[u is smallv is small]\begin{aligned} \mathbb E[Z^2] & = \mathbb E[Z] + \sum_{u \ne v} \mathbb E[Z_u Z_v]\\ & = \mathbb E[Z] + \sum_{v} \Pr[v \text{ is small}] \sum_{u \ne v} \Pr[u \text{ is small} \mid v \text{ is small}] \end{aligned}

对于最后一个 \sum,可以拆分为 uuvv 在同一连通块、uuvv 在不同连通块的两类分别计数。

从而 E[Z2]E[Z]+n(α+o(1))(k+n(α+o(1)))E[Z]+n2α2(1+o(1))=E[Z]2(1+o(1))\mathbb E[Z^2] \le \mathbb E[Z] + n(\alpha + o(1))(k^- + n(\alpha+o(1))) \sim \mathbb E[Z]+ n^2 \alpha^2(1 + o(1)) = \mathbb E[Z]^2 (1 + o(1))

从而根据 Chebyshev 不等式
Pr[ZE[Z]>γE[Z]]1γ2(E[Z2]E[Z]21)=1γ2o(1)\Pr[|Z - \mathbb E[Z]| > \gamma \mathbb E[Z]] \le \frac{1}{\gamma^2} \left(\frac{\mathbb E[Z^2]}{\mathbb E[Z]^2} - 1\right) = \frac{1}{\gamma^2} o(1)

只需取 γ=o(1)\gamma = o(1) 但下降足够缓慢,则上式昭示了 a.a.s. 最大连通分支大小是 (1+o(1))βn(1 + o(1)) \beta n

综合以上两个 Lemma,原 Theorem 得证。