圆方树学习笔记

小粉兔 · 2019-02-28 00:46:38 · 算法·理论

本文同步发布于我的博客园：https://www.cnblogs.com/PinkRabbit/p/Introduction-to-Block-Forest.html。

众所周知，树（或森林）有很好的性质，并且容易通过很多常见数据结构维护。

而一般图则没有那么好的性质，所幸有时我们可以把一般图上的某些问题转化到树上考虑。

而圆方树就是一种将图变成树的方法。本文将介绍圆方树的构建，性质和一些应用。

限于篇幅，本文中有一些结论未经证明，读者可以自行理解或证明。

一、圆方树的定义

圆方树最初是处理“仙人掌图”（每条边在不超过一个简单环中的无向图）的一种工具，不过发掘它的更多性质，有时我们可以在一般无向图上使用它。

要介绍圆方树，首先要介绍点双连通分量。

一个点双连通图的一个定义是：图中任意两不同点之间都有至少两条点不重复的路径。
点不重复既指路径上点不重复（简单路径），也指两条路径的交集为空（当然，路径必然都经过出发点和到达点，这不在考虑范围内）。

可以发现对于只有一个点的图比较难定义它是不是一个点双，这里先不考虑节点数为 1 的图。

一个近乎等价的定义是：不存在割点的图。
这个定义只在图中只有两个点，一条连接它们的边时失效。它没有割点，但是并不能找到两条不相交的路径，因为只有一条路径。
（也可以理解为那一条路径可以算两次，的确没有交，因为不经过其他点）

虽然原始的定义的确是前者，但是为了方便，我们规定点双图的定义采用后者。

而一个图的点双连通分量则是一个极大点双连通子图。
与强连通分量等不同，一个点可能属于多个点双，但是一条边属于恰好一个点双（如果定义采用前者则有可能不属于任何点双）。

在圆方树中，原来的每个点对应一个圆点，每一个点双对应一个方点。
所以共有 n+c 个点，其中 n 是原图点数，c 是原图点双连通分量的个数。

而对于每一个点双连通分量，它对应的方点向这个点双连通分量中的每个点连边。
每个点双形成一个“菊花图”，多个“菊花图”通过原图中的割点连接在一起（因为点双的分隔点是割点）。

显然，圆方树中每条边连接一个圆点和一个方点。

下面有一张图，来自 WC 的 PPT，显示了一张图对应的点双和圆方树形态。

圆方树的点数小于 2n，这是因为割点的数量小于 n，所以请注意各种数组大小要开两倍。

其实，如果原图连通，则“圆方树”才是一棵树，如果原图有 k 个连通分量，则它的圆方树也会形成 k 棵树形成的森林。

如果原图中某个连通分量只有一个点，则需要具体情况具体分析，我们在后续讨论中不考虑孤立点。

二、圆方树的构建

对于一个图，如何构造出它的圆方树呢？首先可以发现如果图不连通，可以拆分成每个连通子图考虑，所以我们只考虑连通图。

因为圆方树是基于点双连通分量的，而点双连通分量又基于割点，所以只需要用类似求割点的方法即可。

求割点的常用算法是 Tarjan 算法，如果你会了理解下面的内容就很简单了，如果你不会也没关系。

我们跳过 Tarjan 求割点，直接介绍圆方树使用的算法（其实是 Tarjan 的变体）：

对图进行 DFS，并且中间用到了两个关键数组 dfn 和 low（类似于 Tarjan）。

dfn[u] 存储的是节点 u 的 DFS 序，即第一次访问到 u 时它是第几个被访问的节点。
low[u] 存储的是节点 u 的 DFS 树中的子树中的某个点 v 通过最多一次返祖边或向父亲的树边能访问到的点的最小 DFS 序。
如果没有听说过 Tarjan 算法可能会有点难理解，让我们举个例子吧：

（可以发现这张图其实和上面图片中的图等价）
这里树边从上至下用直线画出，返祖边从下至上用曲线画出。节点的编号便是它的 DFS 序。

则有 low 数组如下：

i	1	2	3	4	5	6	7	8	9
\mathrm{low}[i]	1	1	1	3	3	4	3	3	7

并不是很难理解吧，注意这里 9 的 low 是 7，与一些求割点的做法有差异，因为为了方便，我们规定了可以通过父边向上，但主要思想是相同的。

我们可以很容易地写出计算 dfn 和 low 的 DFS 函数（初始时 dfn 数组清零）：

void Tarjan(int u) {
    low[u] = dfn[u] = ++dfc; // low 初始化为当前节点 dfn
    for (auto v : G[u]) { // 遍历 u 的相邻节点
        if (!dfn[v]) { // 如果未访问过
            Tarjan(v); // 递归
            low[u] = std::min(low[u], low[v]); // 未访问的和 low 取 min
        }
        else low[u] = std::min(low[u], dfn[v]); // 已访问的和 dfn 取 min
    }
}

接下来，我们考虑点双和 DFS 树以及这两个数组之间的关联。

可以发现，每个点双在 DFS 树上是一棵连通子树，并至少包含两个点；特别地，最顶端节点仅往下接一个点。

同时还可以发现每条树边恰好在一个点双内。

我们考虑一个点双在 DFS 树中的最顶端节点 u，在 u 处确定这个点双，因为 u 的子树包含了整个点双的信息。

因为至少有两个点，考虑这个点双的下一个点 v，则有 u，v 之间存在一条树边。

不难发现，此时一定有 \mathrm{low}[v]=\mathrm{dfn}[u]。
更准确地说，对于一条树边 u\to v，u,v 在同一个点双中，且 u 是这个点双中深度最浅的节点当且仅当 \mathrm{low}[v]=\mathrm{dfn}[u]。

那么我们可以在 DFS 的过程中确定哪些地方存在点双，但是还不能准确确定一个点双所包含的点集。

这并不难处理，我们可以在 DFS 过程中维护一个栈，存储还未确定所属点双（可能有多个）的节点。

在找到点双时，点双中除了 u 以外的其他的点都集中在栈顶端，只需要不断弹栈直到弹出 v 为止即可。

当然，我们可以同时处理被弹出的节点，只要将其和新建的方点连边即可。最后还要让 u 和方点连边。

这样就很自然地完成了圆方树的构建，我们可以给方点标号为 n+1 开始的整数，这样可以有效区分圆点和方点。

这部分可能讲述得不够清晰，下面贴出一份代码，附有详尽注释以及帮助理解的输出语句和一份样例，建议读者复制代码并自行实践理解，毕竟代码才是最能帮助理解的（不要忘记开 c++11）。

#include <cstdio>
#include <vector>
#include <algorithm>

const int MN = 100005;

int N, M, cnt;
std::vector<int> G[MN], T[MN * 2];

int dfn[MN], low[MN], dfc;
int stk[MN], tp;

void Tarjan(int u) {
    printf("  Enter : #%d\n", u);
    low[u] = dfn[u] = ++dfc; // low 初始化为当前节点 dfn
    stk[++tp] = u; // 加入栈中
    for (auto v : G[u]) { // 遍历 u 的相邻节点
        if (!dfn[v]) { // 如果未访问过
            Tarjan(v); // 递归
            low[u] = std::min(low[u], low[v]); // 未访问的和 low 取 min
            if (low[v] == dfn[u]) { // 标志着找到一个以 u 为根的点双连通分量
                ++cnt; // 增加方点个数
                printf("  Found a New BCC #%d.\n", cnt - N);
                // 将点双中除了 u 的点退栈，并在圆方树中连边
                for (int x = 0; x != v; --tp) {
                    x = stk[tp];
                    T[cnt].push_back(x);
                    T[x].push_back(cnt);
                    printf("    BCC #%d has vertex #%d\n", cnt - N, x);
                }
                // 注意 u 自身也要连边（但不退栈）
                T[cnt].push_back(u);
                T[u].push_back(cnt);
                printf("    BCC #%d has vertex #%d\n", cnt - N, u);
            }
        }
        else low[u] = std::min(low[u], dfn[v]); // 已访问的和 dfn 取 min
    }
    printf("  Exit : #%d : low = %d\n", u, low[u]);
    printf("  Stack:\n    ");
    for (int i = 1; i <= tp; ++i) printf("%d, ", stk[i]);
    puts("");
}

int main() {
    scanf("%d%d", &N, &M);
    cnt = N; // 点双 / 方点标号从 N 开始
    for (int i = 1; i <= M; ++i) {
        int u, v;
        scanf("%d%d", &u, &v);
        G[u].push_back(v); // 加双向边
        G[v].push_back(u);
    }
    // 处理非连通图
    for (int u = 1; u <= N; ++u)
        if (!dfn[u]) Tarjan(u), --tp;
        // 注意到退出 Tarjan 时栈中还有一个元素即根，将其退栈
    return 0;
}

提供一个测试用例：

这个例子对应的图（包含了重边和孤立点的情况）：

三、圆方树的应用

我们讲一些可以使用圆方树求解的例题。

[APIO2018]铁人两项

这题可以作为圆方树模板题看待。

题意简述：

给定一张简单无向图，问有多少对三元组 \langle s, c, f\rangle（s,c,f 互不相同）使得存在一条简单路径从 s 出发，经过 c 到达 f。

题解：

说到简单路径，就必须提一个关于点双很好的性质：对于一个点双中的两点，它们之间简单路径的并集，恰好完全等于这个点双。
即同一个点双中的两不同点 u,v 之间一定存在一条简单路径经过给定的在同一个点双内的另一点 w。

这个性质的证明：

显然如果简单路径出了点双，就不可能再回到这个点双中，否则会和点双的定义冲突。
所以我们只需考虑证明一个点双连通图中任意三不同点 u,v,c，必存在一条从 u 到 v 的简单路径经过 c。
首先排除点数为 2 的情况，它满足这个性质，但是无法取出 3 个不同点。
对于余下的情况，考虑建立网络流模型，源点向 c 连容量为 2 的边，u 和 v 向汇点连容量为 1 的边。
原图中的双向边 \langle x,y\rangle，变成 x 向 y 连一条容量为 1 的边，y 也向 x 连一条容量为 1 的边。
最后，给除了源点，汇点和 c 之外的每个点赋上 1 的容量，这可以通过拆点实现。
因为源点到 c 的边的容量为 2，那么如果这个网络最大流为 2，则证明一定有路径经过 c。
考虑最大流最小割定理，显然最小割小于等于 2，接下来只要证最小割大于 1。
这等价于证明割掉任意一条容量为 1 的边，是无法使源点和汇点不连通的。
考虑割掉 u 或 v 与汇点连接的点，根据点双的第一种定义，必然存在简单路径从 c 到另一个没割掉的点。
考虑割掉一个节点拆点形成的边，这等价于删除一个点，根据点双的第二种定义，余下的图仍然连通。
考虑割掉一条由原先的边建出的边，这等价于删除一条边，这比删除一个点更弱，显然存在路径。
所以我们证明了最小割大于 1，即最大流等于 2。证毕。

这个结论能告诉我们什么呢？它告诉了我们：考虑两圆点在圆方树上的路径，与路径上经过的方点相邻的圆点的集合，就等于原图中两点简单路径上的点集。

回到题目，考虑固定 s 和 f，求合法的 c 的数量，显然有合法 c 的数量等于 s,f 之间简单路径的并集的点数减 2（去掉 s,f 本身）。

那么，对原图建出圆方树后，两点之间简单路径的点数，就和它们在圆方树上路径经过的方点（点双）和圆点的个数有关。

接下来是圆方树的一个常用技巧：路径统计时，点赋上合适的权值。
本题中，每个方点的权值为对应点双的大小，而每个圆点权值为 -1。

这样赋权后则有两圆点间圆方树上路径点权和，恰好等于原图中简单路径并集大小减 2。

问题转化为统计圆方树上 \sum 两圆点路径权值和。

换个角度考虑，改为统计每一个点对答案的贡献，即权值乘以经过它的路径条数，这可以通过简单的树形 DP 求出。

最后，不要忘记处理图不连通的情况。下面是对应代码：

#include <cstdio>
#include <vector>
#include <algorithm>

const int MN = 100005;

int N, M, cnt;
std::vector<int> G[MN], T[MN * 2];
long long Ans;

int dfn[MN], low[MN], dfc, num;
int stk[MN], tp;

int wgh[MN * 2];

void Tarjan(int u) {
    low[u] = dfn[u] = ++dfc;
    stk[++tp] = u;
    ++num;
    for (auto v : G[u]) {
        if (!dfn[v]) {
            Tarjan(v);
            low[u] = std::min(low[u], low[v]);
            if (low[v] == dfn[u]) {
                wgh[++cnt] = 0;
                for (int x = 0; x != v; --tp) {
                    x = stk[tp];
                    T[cnt].push_back(x);
                    T[x].push_back(cnt);
                    ++wgh[cnt];
                }
                T[cnt].push_back(u);
                T[u].push_back(cnt);
                ++wgh[cnt];
            }
        }
        else low[u] = std::min(low[u], dfn[v]);
    }
}

int vis[MN * 2], siz[MN * 2];

void DFS(int u, int fz) {
    vis[u] = 1;
    siz[u] = (u <= N);
    for (auto v : T[u]) if (v != fz) {
        DFS(v, u);
        Ans += 2ll * wgh[u] * siz[u] * siz[v];
        siz[u] += siz[v];
    }
    Ans += 2ll * wgh[u] * siz[u] * (num - siz[u]);
}

int main() {
    scanf("%d%d", &N, &M);
    for (int u = 1; u <= N; ++u) wgh[u] = -1;
    cnt = N;
    for (int i = 1; i <= M; ++i) {
        int u, v;
        scanf("%d%d", &u, &v);
        G[u].push_back(v);
        G[v].push_back(u);
    }
    for (int u = 1; u <= N; ++u) if (!dfn[u]) {
        num = 0;
        Tarjan(u), --tp;
        DFS(u, 0);
    }
    printf("%lld\n", Ans);
    return 0;
}

顺带一提，刚刚的测试用例在这题的答案是 212。

[CodeForces 487E]Tourists

题意简述：

给定一张简单无向连通图，要求支持两种操作：

修改一个点的点权。
询问两点之间所有简单路径上点权的最小值。

题解：

同样地，我们建出原图的圆方树，令方点权值为相邻圆点权值的最小值，问题转化为求路径上最小值。

路径最小值可以使用树链剖分和线段树维护，但是修改呢？

一次修改一个圆点的点权，需要修改所有和它相邻的方点，这样很容易被卡到 \mathcal{O}(n) 个修改。

这时我们利用圆方树是棵树的性质，令方点权值为自己的儿子圆点的权值最小值，这样的话修改时只需要修改父亲方点。

对于方点的维护，只需要对每个方点开一个 multiset 维护权值集合即可。

需要注意的是查询时若 LCA 是方点，则还需要查 LCA 的父亲圆点的权值。

注意：圆方树点数要开原图的两倍，否则会数组越界，出现玄学错误。

#include <cstdio>
#include <vector>
#include <algorithm>
#include <set>

const int MN = 100005;
const int MS = 524288;
const int Inf = 0x7fffffff;

int N, M, Q, cnt;
int w[MN * 2];
std::vector<int> G[MN], T[MN * 2];
std::multiset<int> S[MN * 2];

int dfn[MN * 2], low[MN], dfc;
int stk[MN], tp;

void Tarjan(int u) {
    low[u] = dfn[u] = ++dfc;
    stk[++tp] = u;
    for (auto v : G[u]) {
        if (!dfn[v]) {
            Tarjan(v);
            low[u] = std::min(low[u], low[v]);
            if (low[v] == dfn[u]) {
                ++cnt;
                for (int x = 0; x != v; --tp) {
                    x = stk[tp];
                    T[cnt].push_back(x);
                    T[x].push_back(cnt);
                }
                T[cnt].push_back(u);
                T[u].push_back(cnt);
            }
        }
        else low[u] = std::min(low[u], dfn[v]);
    }
}

int idf[MN * 2], faz[MN * 2], siz[MN * 2], dep[MN * 2], son[MN * 2], top[MN * 2];

void DFS0(int u, int fz) {
    faz[u] = fz, dep[u] = dep[fz] + 1, siz[u] = 1;
    for (auto v : T[u]) if (v != fz) {
        DFS0(v, u);
        siz[u] += siz[v];
        if (siz[son[u]] < siz[v]) son[u] = v;
    }
}

void DFS1(int u, int fz, int tp) {
    dfn[u] = ++dfc, idf[dfc] = u, top[u] = tp;
    if (son[u]) DFS1(son[u], u, tp);
    for (auto v : T[u])
        if (v != fz && v != son[u])
            DFS1(v, u, v);
}

#define li (i << 1)
#define ri (i << 1 | 1)
#define mid ((l + r) >> 1)
#define ls li, l, mid
#define rs ri, mid + 1, r

int dat[MS];

void Build(int i, int l, int r) {
    if (l == r) { dat[i] = w[idf[l]]; return ; }
    Build(ls), Build(rs);
    dat[i] = std::min(dat[li], dat[ri]);
}

void Mdf(int i, int l, int r, int p, int x) {
    if (l == r) { dat[i] = x; return ; }
    if (p <= mid) Mdf(ls, p, x);
    else Mdf(rs, p, x);
    dat[i] = std::min(dat[li], dat[ri]);
}

int Qur(int i, int l, int r, int a, int b) {
    if (r < a || b < l) return Inf;
    if (a <= l && r <= b) return dat[i];
    return std::min(Qur(ls, a, b), Qur(rs, a, b));
}

int main() {
    scanf("%d%d%d", &N, &M, &Q);
    for (int i = 1; i <= N; ++i)
        scanf("%d", &w[i]);
    cnt = N;
    for (int i = 1; i <= M; ++i) {
        int u, v;
        scanf("%d%d", &u, &v);
        G[u].push_back(v);
        G[v].push_back(u);
    }
    Tarjan(1), DFS0(1, 0), dfc = 0, DFS1(1, 0, 1);
    for (int i = 1; i <= N; ++i) if (faz[i])
        S[faz[i]].insert(w[i]);
    for (int i = N + 1; i <= cnt; ++i)
        w[i] = *S[i].begin();
    Build(1, 1, cnt);
    for (int q = 1; q <= Q; ++q) {
        char opt[3]; int x, y;
        scanf("%s%d%d", opt, &x, &y);
        if (*opt == 'C') {
            Mdf(1, 1, cnt, dfn[x], y);
            if (faz[x]) {
                int u = faz[x];
                S[u].erase(S[u].lower_bound(w[x]));
                S[u].insert(y);
                if (w[u] != *S[u].begin()) {
                    w[u] = *S[u].begin();
                    Mdf(1, 1, cnt, dfn[u], w[u]);
                }
            }
            w[x] = y;
        }
        else {
            int Ans = Inf;
            while (top[x] != top[y]) {
                if (dep[top[x]] < dep[top[y]])
                    std::swap(x, y);
                Ans = std::min(Ans, Qur(1, 1, cnt, dfn[top[x]], dfn[x]));
                x = faz[top[x]];
            }
            if (dfn[x] > dfn[y]) std::swap(x, y);
            Ans = std::min(Ans, Qur(1, 1, cnt, dfn[x], dfn[y]));
            if (x > N) Ans = std::min(Ans, w[faz[x]]);
            printf("%d\n", Ans);
        }
    }
    return 0;
}

[SDOI2018]战略游戏

题意简述：

给出一个简单无向连通图。有 q 次询问：

每次给出一个点集 S（2\le |S|\le n），问有多少个点 u 满足 u\notin S 且删掉 u 之后 S 中的点不全在一个连通分量中。

每个测试点有多组数据。

题解：

先建出圆方树，则变为询问 S 在圆方树上对应的连通子图中的圆点个数减去 |S|。

如何计算连通子图中的圆点个数？有一个方法：

把圆点的权值放到它和它的父亲方点的边上，问题转化为求边权和，这个问题可以参考我这篇题解的方法：题解 P3320 【[SDOI2015]寻宝游戏】。
即把 S 中的点按照 DFS 序排序，计算排序后相邻两点的距离和，答案就是距离和的一半，因为每条边只被经过两次。

最后，如果子图中的深度最浅的节点是圆点，答案还要加上 1，因为我们没有统计到它。

因为有多组数据，要注意初始化数组。

#include <cstdio>
#include <vector>
#include <algorithm>

const int MN = 100005;

int N, M, Q, cnt;
std::vector<int> G[MN], T[MN * 2];

int dfn[MN * 2], low[MN], dfc;
int stk[MN], tp;
void Tarjan(int u) {
    low[u] = dfn[u] = ++dfc;
    stk[++tp] = u;
    for (auto v : G[u]) {
        if (!dfn[v]) {
            Tarjan(v);
            low[u] = std::min(low[u], low[v]);
            if (low[v] == dfn[u]) {
                ++cnt;
                for (int x = 0; x != v; --tp) {
                    x = stk[tp];
                    T[cnt].push_back(x);
                    T[x].push_back(cnt);
                }
                T[cnt].push_back(u);
                T[u].push_back(cnt);
            }
        }
        else low[u] = std::min(low[u], dfn[v]);
    }
}

int dep[MN * 2], faz[MN * 2][18], dis[MN * 2];
void DFS(int u, int fz) {
    dfn[u] = ++dfc;
    dep[u] = dep[faz[u][0] = fz] + 1;
    dis[u] = dis[fz] + (u <= N);
    for (int j = 0; j < 17; ++j)
        faz[u][j + 1] = faz[faz[u][j]][j];
    for (auto v : T[u]) if (v != fz) DFS(v, u);
}
int LCA(int x, int y) {
    if (dep[x] < dep[y]) std::swap(x, y);
    for (int j = 0, d = dep[x] - dep[y]; d; ++j, d >>= 1)
        if (d & 1) x = faz[x][j];
    if (x == y) return x;
    for (int j = 17; ~j; --j)
        if (faz[x][j] != faz[y][j])
            x = faz[x][j], y = faz[y][j];
    return faz[x][0];
}

int main() {
    int Ti; scanf("%d", &Ti);
    while (Ti--) {
        scanf("%d%d", &N, &M);
        for (int i = 1; i <= N; ++i) {
            G[i].clear();
            dfn[i] = low[i] = 0;
        }
        for (int i = 1; i <= N * 2; ++i) T[i].clear();
        for (int i = 1, x, y; i <= M; ++i) {
            scanf("%d%d", &x, &y);
            G[x].push_back(y);
            G[y].push_back(x);
        }
        cnt = N;
        dfc = 0, Tarjan(1), --tp;
        dfc = 0, DFS(1, 0);
        scanf("%d", &Q);
        while (Q--) {
            static int S, A[MN];
            scanf("%d", &S);
            int Ans = -2 * S;
            for (int i = 1; i <= S; ++i) scanf("%d", &A[i]);
            std::sort(A + 1, A + S + 1, [](int i, int j) { return dfn[i] < dfn[j]; });
            for (int i = 1; i <= S; ++i) {
                int u = A[i], v = A[i % S + 1];
                Ans += dis[u] + dis[v] - 2 * dis[LCA(u, v)];
            }
            if (LCA(A[1], A[S]) <= N) Ans += 2;
            printf("%d\n", Ans / 2);
        }
    }
    return 0;
}