强连通分量 —Kosaraju | Tarjan

vivarock

2018-05-27 11:29:20

Personal

# 强连通分量如果两个点能够互相到达,那么说明两个点在一个强连通分量 (成环 )里其概念与 [并查集](https://juruo-oier.blog.luogu.org/bing-zha-ji) 相似不同点在于并查集为无向图,直接遍历,只要能访问到就在一个并查集里而强连通分量操作的是无向图,需要考虑边的方向如图,最左侧的分支不是一个强连通分量,而右两个是 ![](https://www.oyohyee.com/post/img/strongly_connected_components_1.png) 在许多图的题目里,需要对节点进行强连通分量缩点从而简化后续操作的复杂度缩点后,新的图是一个有向无环图(DAG) ,因此可以使用其他算法进行其他的操作强连通分量的算法有 kosaraju tarjan # Kosaraju Kosaraju 采用两次 DFS 及一次对逆图的操作从而求解的首先 DFS 遍历所有节点,当到头后,将节点入栈,返回 DFS 遍历完后在逆图(所有边反向)里按照栈的顺序进行 DFS ,将所有能访问到的点删除,加入到当前连通分量里直到所有点都被删除由于强连通是环,无论图的边如何反向,应该都是能够互相访问的,而不在环里的点是无法访问到的. 要考虑的额外情况就是逆图里是否会有一个点能访问到和它不是强连通的点假设存在这种情况,那么有以下条件: 这两个点单向连通(不连通逆图无法访问) 单向连通的子节点后入栈(这样能在父节点被删除前访问到父节点) 如果两个节点单向连通,有两种情况: 先访问到父节点父节点能遍历到子节点,父节点会后入栈先访问子节点子节点在第一次遍历时,无法遍历到父节点,子节点先入栈,同上因此,该算法可以实现强连通分量缩点的功能步骤如下: DFS 遍历所有节点,当到达终点后入栈在逆图里按照栈的顺序 DFS 所有节点,将所有能够访问到的点连为一个强连通分量并从图里删除重复 2 直到所有点被删除 ```cpp //Kosaraju const int maxm = 100005; struct Edge { int u,v; Edge():u(0),v(0) {} Edge(int a,int b):u(a),v(b) {} }; int pos; Edge edge[maxm]; list<int> L[maxn]; list<int> L2[maxn]; stack<int> s; bool vis[maxn]; vector<int> SCC[maxn];//得到的强连通分量链表 inline void add(int u,int v) { edge[pos] = Edge(u,v); L[u].push_back(pos); L2[v].push_back(pos);//逆图 pos++; } void DFS1(int t) { if(!vis[t]) { vis[t] = true; for(list<int>::iterator i = L[t].begin();i != L[t].end();i++) DFS1(edge[*i].v); s.push(t); } return; } void DFS2(int p,int t) { if(vis[t]) { vis[t] = false; SCC[p].push_back(t); for(list<int>::iterator i = L2[t].begin();i != L2[t].end();i++) DFS2(p,edge[*i].u); } return; } int Kosaraju(int n) { //第一次DFS for(int i = 0;i < n;i++) DFS1(i); //第二次DFS int p = 0; while(!s.empty()) { int t = s.top(); s.pop(); list< list<int> >::iterator it; if(vis[t]) DFS2(p++,t); } return p; } ``` ------------ # Tarjan Tarjan 是求强连通分量的一种非常常用的方法,其依据是 DFS 的遍历的顺序不难得出,一个含环有向图,从一个节点开始遍历,环必然存在在第一个被遍历的环的子树上如最前面的图里,每一个环都存在于一个子树中而环的这棵树的最大的不同就是他能够回到已经访问过的节点上首先看一颗有向的树,首先对树进行遍历,并且记录下访问该节点(u)的时间(次序) 将节点(u)压入栈内,然后开始遍历它的子节点(v) 找到该节点(u)到树根上尽可能上的节点(更早遍历) (下面所有重新标记节点的行为都是为了这一步) 有以下情况: 子节点(v)已访问过,并且在栈里非常显然,该节点(u)可以回到他的某一祖宗(v)处,从祖宗节点(v)到该节点(u)中间的所有节点可以连成环将该节点(u)的访问时间标记为重新标记为该环最小的时间(缩点) 子节点(v)已访问过,不在栈里无法连成环,一个节点的两棵子树间的单向边(图中 3 和 4 的关系) 子节点(v)未访问过继续 DFS 遍历该子节点(v) 遍历完该子节点(v)的所有子节点后,尝试缩点将该节点(u)的时间标记重新标记为该节点(u)与子节点(v)时间标记的最小值 (如果需要修改就证明它的某个后代节点和它的祖宗节点有连接 ) 遍历完该节点(u)的子节点,就可以判断该节点是否在环里了如果该节点的标记被修改过,那么显然这个节点不可能是含环子树最顶部的节点而如果没有被修改过,那么就说明这个节点是环顶部的节点(有可能只有它一个,单独的强连通分量) 由于 DFS 在树上有着天然的顺序,因此栈顶一直到该节点中间所有的节点都在这个环里直接记录即可其中需要考虑的特殊情况有如图的两种情况 2,3之间是双向箭头(互相指向) 根据上面的思路,这时两个点已经缩成一个点, 3 不会出栈(时间标记改变) 2,3之间是单向箭头不存在环的关系,因此不会改变时间节点,3 访问后出栈这样,无论如何,都不会影响后面的结果,不过 4 和 1,2 等祖宗节点是否成环,都不会影响结果因此,该算法成立最后要考虑的就是所有节点分成了多棵树的情况,遍历下所有点全部进行 DFS 即可(已经访问过自然不用再管了) ```cpp //Tarjan 返回强连通分量个数 //节点从0开始,记得初始化变量 struct Edge { int u,v; Edge():u(0),v(0) {} Edge(int a,int b):u(a),v(b) {} }; int pos; Edge edge[maxm]; list<int> L[maxn]; stack<int> s; bool inStack[maxn]; vector<int> SCC[maxn];//得到的强连通分量链表 int cnt,Index; int DFN[maxn],Low[maxn]; inline void add(int u,int v) { edge[pos] = Edge(u,v); L[u].push_back(pos); pos++; } void tarjan(int u) { if(DFN[u] != -1) return; DFN[u] = Low[u] = ++Index; s.push(u); inStack[u] = true; for(list<int>::iterator it = L[u].begin();it != L[u].end();it++) { int v = edge[*it].v; if(DFN[v] == -1) { tarjan(v); Low[u] = min(Low[u],Low[v]); } else if(inStack[v]) { Low[u] = min(Low[u],DFN[v]); } } if(DFN[u] == Low[u]) { int v = s.top(); s.pop(); inStack[v] = false; SCC[cnt++].push_back(v); while(u != v) { v = s.top(); s.pop(); inStack[v] = false; SCC[cnt - 1].push_back(v); } } } int Tarjan(int n) { cnt = 0; Index = 0; while(!s.empty())s.pop(); memset(inStack,false,sizeof(inStack)); memset(DFN,-1,sizeof(DFN)); memset(Low,-1,sizeof(Low)); for(int i = 0;i < n;i++) tarjan(i); return cnt; } ```