图论4——探索网络流的足迹：Dinic算法

frankchenfu

2018-03-04 17:26:27

Personal

## 1. 网络流：定义与简析 ### 1.1 网络流是什么？网络流是一种“类比水流的解决问题方法，与线性规划密切相关”（语出百度百科）。其实，在信息学竞赛中，简单的网络流并不需要太高深的数学知识。首先我们需要知道一些名词是什么意思： * 点（$node$）。就是一个节点。点集通常用$V$表示。其中，有一个源点$s$和一个汇点$t$，所有的流都从源点$s$出发，经过一些边之后到达汇点$t$。 * 边（$edge$）。这个东西和大家在其他图论知识中所用到的差不多，用于连接两个点。边集通常用$E$表示。图$G(V,E)$表示由点集$V$和边集$E$组成的图$G$。在接下来讲到的有关网络流的问题中，边都是有向的。 * 容量（$capacity$，简称$cap$）。对于每一条边，我们都有一个容量，表示这条边最多能经过的流。 ### 1.2 问题简述显然，根据如上定义，到达汇点$t$的流是有限的。**网络流问题(`NetWork Flow Problem`)**中的**最大流**指的就是如何合理安排一种方式，使得从源点$s$到汇点$t$的流最多。感觉枯燥吗？其实我们可以这么感性的理解。你的家里有$10^{10^{10^{10}}}$箱苹果，然后你要通过一些高速公路把他们运到你的亲戚家。由于某些限制，连接$u$和$v$的高速公路$(u,v)$一天只能允许载有不超过$cap(u,v)$的卡车通过。显然，一天之内，能运送的苹果数量是有限的，因为这些高速路的限制只能让你运送其中的一些。那么如何安排这些苹果的运送方式，使得一天之内最后运到你亲戚家的苹果最多？显然，即使你把所有的$10^{10^{10^{10}}}$箱苹果都运送给你的亲戚，但是最后绝大多数都会在高速路收费站被拦下来——超载（并且最后被工作人员吃掉）。最多能够送给亲戚的苹果数（即在最优方案下到达$t$的流）就称之为**最大流**。 ## 2. 网络流：尝试与解决 ### 2.1 贪心分析 A：这个问题不是可以贪心一遍然后$O(n+m)$就解决了吗？ B：怎么贪心？你做一遍试一下啊！ A：就是每一次都尽量多地往汇点送，如果下一条边不能再运送这么多的容量就分到其他条边不就好了吗？ B：（随手一个图） ![](https://cdn.luogu.com.cn/upload/pic/15174.png)。 A：然后我开始详细讲我的贪心算法了。 $\quad$首先我们从$s\to 2\to 5\to t$运送$3$箱苹果，从$s\to 2\to 6\to t$运送$1$箱苹果； $\quad$然后……$s\to 3\to 5\to t$就不行了…… $\quad$最后$s\to 4\to 5\to t$还有$7$箱。这样合计$11$箱。（强行掩饰）那你有更好地解法吗？ B：显然有。如果你没有这么贪心，从$s\to 2\to 5\to t$只运送$2$箱苹果，剩下两箱从$s\to 2\to 6\to t$走，这样$s\to 3\to 5\to t$还可以运一箱。最后$s\to 4\to 5\to t$还有$7$箱。合计$2+2+1+7=12$箱。通过这段对话，我们发现，由于输入顺序未知，贪心很容易产生问题（尽管在这张图中你有一半的可能得到正确答案，而在数据量大的时候，不出错的概率很小）。所以我们考虑正确的解法。 ### 2.2 朴素算法在学习朴素算法之前，我们需要补充一个网络流中常用到的定理。如果设$f(u,v)$为实际从这条边上走过的流量大小，则： 1. 容量原则：$f(u,v)\le cap(u,v)$.这个是显然的，你不可能实际流量比限制容量还大（否则你会因为超载被警察叔叔开罚单）。 2. 反对称性：$f(u,v)=-f(v,u)$.这个也是显然的，你送给亲戚$10$个苹果不就相当于你从亲戚那里拿到了$-10$个苹果吗？（尽管听上去总感觉好像不太正常） 3. 流量守恒：当$u\ne s,t$时，如果规定边$(u,v)$和$(v,u)$都不存在时$f(u,v)=f(v,u)=0$的话，那么$\displaystyle\sum^{v\in V}_ {v} f(u,v) =0$。这个并不是那么好理解，简单来说，因为从$s$点流出的流最终都汇入$t$，所以中间所有边都不会有剩下的流没有出去。只有$s$和$t$会“制造”和“接受”流量。（你不想让高速路的工作人员把你的苹果吃掉，所以一定选取刚好的苹果给亲戚；自然亲戚会全部收到，所以高速路的工作人员没有办法拦下你的苹果）。有了这三条定理，我们就开始讲朴素算法。我们首先给每一条边连上反向边。这条反向边的性质就像上面定理2“反对称性”中的反向边一样。由于目前的网络流算法都基于**增广路思想**，我们还是要介绍一下增广路。 #### 增广路思想增广路定义：一条从源点到汇点的路径，使得路径上任意一条边的残量$>0$（注意是$>$而不是$\ge$，这意味着这条边还可以分配流量），这条路径便称为增广路。我们设$g_{u,v}$表示$(u,v)$这条边上的残量，即剩余流量。 1. 找到一条增广路，记这条路径上的边集为$P$。 2. 记$flow=\displaystyle\min_{(u,v)}^{(u,v)\in P} g_{u,v}$. 3. 将这条路径上的每一条有向边$u,v$的残量$g_{u,v}$减去$flow$，同时对于反向边$v,u$的残量加上$flow$。 4. 重复上述过程，直到找不出增广路，此时我们就找到了最大流。为什么反向边要加上$flow$呢？因为对于下面这个例子： ![](https://cdn.luogu.com.cn/upload/pic/15181.png) 所以需要加上$flow$。 #### 复杂度分析这个复杂度是$O(nm^2)$，而且往往不会少跑很多，所以只能用过$n,m\le 300$的数据。 ------------ ### Dinic算法我们发现朴素算法有的时候会跑得特别特别的慢，因为增广路径查找得很不优秀。比如： ![](https://cdn.luogu.com.cn/upload/pic/15182.png) 如果程序很不友好的在$(3,4)$和$(4,3)$中来回跑，那么显然复杂度会高到离谱。所以在Dinic中，我们引入分层图的概念。 #### 分层图对于每一个点，我们根据从源点$s$开始的`bfs`序，为每一个点分配一个深度$dep_i$，然后通过不断`dfs`寻找增广路，每一次`dfs`当且仅当$dep_v=dep_u+1$是才从$u$到$v$，这样上面的情况就避免了。 #### 复杂度估计那么`Dinic`的复杂度是多少呢？答案是$O(n^2m)$。事实上这只是最差情况下的估计，实际上远没有这么大，对于$n,m\le 10^5$的数据往往是可以轻松过的。 ------------ ### 代码：下面是代码。其中$d$数组即$dep_i$，每次通过bfs构造层次图，然后dfs增广。 ```cpp #include<cstdio> #include<cstring> #include<vector> #include<queue> #include<algorithm> using namespace std; const int MAXN=100010; const int INF=0x3f3f3f3f; class Dinic { private: struct edge { int from,to,cap,flow; }; vector<edge>e; vector<int>f[MAXN]; queue<int>q; bool vis[MAXN]; int d[MAXN]; int cur[MAXN]; bool bfs() { memset(vis,0,sizeof(vis)); while(!q.empty()) q.pop(); q.push(s);d[s]=0;vis[s]=1; while(!q.empty()) { int x=q.front();q.pop(); for(int i=0;i<f[x].size();i++) { edge &y=e[f[x][i]]; if(!vis[y.to]&&y.flow<y.cap) { vis[y.to]=1; d[y.to]=d[x]+1; q.push(y.to); } } } return vis[t]; } int dfs(int x,int a) { if(x==t) return a; if(a==0) return 0; int flow=0,r; for(int &i=cur[x];i<f[x].size();i++) { edge &y=e[f[x][i]]; if(d[x]+1==d[y.to]&&(r=dfs(y.to,min(a,y.cap-y.flow)))>0) { y.flow+=r; e[f[x][i]^1].flow-=r; flow+=r; a-=r; if(a==0) break; } } return flow; } public: int n,m,s,t; void adde(int u,int v,int cap) { e.push_back((edge){u,v,cap,0}); e.push_back((edge){v,u,0,0}); this->m=e.size(); f[u].push_back(m-2); f[v].push_back(m-1); } int maxflow() { int res=0; while(bfs()) { memset(cur,0,sizeof(cur)); res+=dfs(s,INF); } return res; } }; ``` 如果需要使用这个模板，只需要输入$n,s,t$，而$m$将根据加边次数计算。这个模板的技巧在于，存反向边的时候利用了位运算$xor$的技巧：如果边的编号从$0$计数，那么相邻的边编号就是$2x,2x+1$，在计算机中$2x\ xor\ 1=2x+1$，而$(2x+1)\ xor\ 1=2x$。这样可以很方便的读取反向边。