[学习笔记]CDQ分治和整体二分
Owen_codeisking
2018-11-28 18:31:56
## 序言
$CDQ$ 分治和整体二分都是基于分治的思想,把复杂的问题拆分成许多可以简单求的解子问题。但是这两种算法必须离线处理,不能解决一些强制在线的题目。不过如果题目允许离线的话,这两种算法能把在线解法吊起来打(如树套树)。
------------
## 前置知识:分治
个人觉得分治的经典例子便是归并排序。
大家都知道,归并排序就是每次将区间 $[l,r]$ 拆分成 $[l,mid]$ 和 $[mid+1,r]$,然后再 $O(n)$ 合并两个有序数组,再将 $[l,r]$ 的答案传到上一层去。
那么我们可以得到 $T(n)=2\times T(\frac n2)+n$
因为这样递归层数不会超过 $\log n$ 层,所以时间复杂度为 $O(n\log n)$
```cpp
void mergesort(int l,int r){
if(l == r) return ;
int mid=(l+r)>>1;
mergesort(l,mid);
mergesort(mid+1,r);
int p=l,q=mid+1,cnt=l;
while(p<=mid&&q<=r){
if(a[p]<a[q]) t[cnt++]=a[p++];
else t[cnt++]=a[q++];
}
while(p<=mid) t[cnt++]=a[p++];
while(q<=r) t[cnt++]=a[q++];
for(int i=l;i<=r;i++) a[i]=t[i];
}
```
归并排序的另一个用途:求一个序列的逆序对。
我们发现在合并两个有序数组的时候,若 `a[p]>a[q]` 的时候,那么 $a[p]\sim a[mid]$ 的数一定比 $a[q]$ 大,所以我们在归并排序的过程中加入一句 `if(a[p]>a[q]) ans+=mid-p+1`
这种思想在分治中非常有用。
------------
## $CDQ$ 分治
讲 $CDQ$ 分治的时候就少不了经典的多维偏序问题了。
### 二维偏序问题
给定 $n$ 个元素,第 $i$ 个元素有 $a_i$、$b_i$ 两个属性,设 $f(i)$ 表示满足 $a_j\leq a_i$ 且 $b_j\leq b_i$ 的 $j$ 的数量。
对于 $d\in [0,n]$,求满足 $f(i)=d$ 的数量。
首先,我们可以把两个元素抽象成一个点 $(a,b)$,那么我们就是求一个矩形中有多少个点。
比如我们要求这个矩形内有多少个点:
![](https://cdn.luogu.com.cn/upload/pic/44731.png)
首先我们可以按照 $x$ 轴排个序,发现矩形右边的点已经不在答案的贡献里了。那么 $f(i)$ 就是在排序后的数组中找 $1\sim i-1$ 中有几个元素 $b$ 比 $b_i$ 小。
那么我们直接树状数组即可,时间复杂度 $O(n\log n)$
例题:[HDU1541 Stars](http://acm.hdu.edu.cn/showproblem.php?pid=1541)
```cpp
#include <bits/stdc++.h>
#define lowbit(x) ((x)&(-(x)))
using namespace std;
const int maxn=100000+10;
int n,c[maxn],ans[maxn];
struct Stars{
int x,y;
}a[maxn];
bool cmp(Stars a,Stars b){
if(a.x!=b.x) return a.x<b.x;
return a.y<b.y;
}
inline int read(){
register int x=0,f=1;char ch=getchar();
while(!isdigit(ch)){if(ch=='-')f=-1;ch=getchar();}
while(isdigit(ch)){x=(x<<3)+(x<<1)+ch-'0';ch=getchar();}
return (f==1)?x:-x;
}
void add(int x,int y){
for(;x<maxn;x+=lowbit(x)) c[x]+=y;
}
int sum(int x){
int ans=0;
for(;x;x-=lowbit(x)) ans+=c[x];
return ans;
}
int main()
{
n=read();
for(int i=1;i<=n;i++)
a[i].x=read(),a[i].y=read();
sort(a+1,a+n+1,cmp);
int now;
for(int i=1;i<=n;i++){
now=sum(a[i].y+1);
ans[now]++;
add(a[i].y+1,1);
}
for(int i=0;i<n;i++)
printf("%d\n",ans[i]);
return 0;
}
```
自己的题目:[【模板】二维偏序](https://www.luogu.org/problemnew/show/U47402)
### 三维偏序问题
其实三维偏序就是在二维偏序上加一维而已。
我们先按每个元素的属性 $a$ 排个序,然后第二维用归并排序,第三维用树状数组。
我们在归并的时候考虑 $[l,mid]$ 对 $[mid+1,r]$ 的贡献。因为我们已经按属性 $a$ 排过序了,所以在排序属性 $b$ 的时候,无论属性 $a$ 怎么被打乱,$[mid+1,r]$ 所有元素的属性 $a$ 一定不小于 $[l,mid]$ 中所有元素的属性 $a$,所以第二维是成立的。
在满足前两维都是有序的时候,类似二维偏序的解法,我们可以用树状数组来统计答案了。
在【模板】三维偏序中,$a_j\leq a_i$ 且 $b_j\leq b_i$ 且 $c_j\leq c_i$ 中是有取等号的,所以我们需要对元素进行去重,最后统计最终的答案,时间复杂度 $O(n\log^2 n)$
例题:【模板】三维偏序
```cpp
#include <bits/stdc++.h>
#define lowbit(x) ((x)&(-(x)))
using namespace std;
const int maxn=100000+10;
int n,m,c[maxn<<1],ans[maxn],cnt;
struct Element{
int a,b,c,w,f;
}e[maxn],t[maxn];
bool cmp(Element x,Element y){
if(x.a!=y.a) return x.a<y.a;
if(x.b!=y.b) return x.b<y.b;
return x.c<y.c;
}
inline int read(){
register int x=0,f=1;char ch=getchar();
while(!isdigit(ch)){if(ch=='-')f=-1;ch=getchar();}
while(isdigit(ch)){x=(x<<3)+(x<<1)+ch-'0';ch=getchar();}
return (f==1)?x:-x;
}
void update(int x,int y){
for(;x<=m;x+=lowbit(x)) c[x]+=y;
}
int sum(int x){
int ans=0;
for(;x;x-=lowbit(x)) ans+=c[x];
return ans;
}
void CDQ(int l,int r){
int mid=(l+r)>>1;
if(l==r) return ;
CDQ(l,mid);CDQ(mid+1,r);
int p=l,q=mid+1,tot=l;
while(p<=mid&&q<=r){
if(e[p].b<=e[q].b) update(e[p].c,e[p].w),t[tot++]=e[p++];
else e[q].f+=sum(e[q].c),t[tot++]=e[q++];
}
while(p<=mid) update(e[p].c,e[p].w),t[tot++]=e[p++];
while(q<=r) e[q].f+=sum(e[q].c),t[tot++]=e[q++];
for(int i=l;i<=mid;i++) update(e[i].c,-e[i].w);
for(int i=l;i<=r;i++) e[i]=t[i];
}
int main()
{
n=read();m=read();
for(int i=1;i<=n;i++)
e[i].a=read(),e[i].b=read(),e[i].c=read(),e[i].w=1;
sort(e+1,e+n+1,cmp);
cnt=1;
for(int i=2;i<=n;i++){
if(e[i].a==e[cnt].a&&e[i].b==e[cnt].b&&e[i].c==e[cnt].c) e[cnt].w++;
else e[++cnt]=e[i];
}
CDQ(1,cnt);
for(int i=1;i<=cnt;i++) ans[e[i].f+e[i].w-1]+=e[i].w;
for(int i=0;i<n;i++) printf("%d\n",ans[i]);
return 0;
}
```
### 四维偏序问题
四维偏序就比较恶心了,需要 $CDQ$ 套 $CDQ$ 套 树状数组
怎么叫 $CDQ$ 套 $CDQ$ 呢?
我们可以在第二维 $CDQ$ 的时候,记下那些元素在左区间还在右区间。在第三维 $CDQ$ 的时候保持前两维的有序时,加一个树状数组,时间复杂度 $O(n\log^3 n)$
例题:[HDU5126 stars](http://acm.hdu.edu.cn/showproblem.php?pid=5126)
不过这道题带修改,还要判断是什么操作。这里要保证时间的有序和 $x,y,z$ 三维的有序,所以是四维偏序。
并且求在 $(x_1,y_1,z_1)$ 和 $(x_2,y_2,z_2)$ 的点对个数时要将这些限制拆成八个询问,容斥一下就好了。
```cpp
#include <bits/stdc++.h>
#define lowbit(x) ((x)&(-(x)))
using namespace std;
const int maxn=400000+10;
int n,m,mp[maxn],c[maxn],ans[maxn],tot;
struct Element{
int op,x,y,z,w,id,flag;
}e[maxn],t[maxn],d[maxn];
inline int read(){
register int x=0,f=1;char ch=getchar();
while(!isdigit(ch)){if(ch=='-')f=-1;ch=getchar();}
while(isdigit(ch)){x=(x<<3)+(x<<1)+ch-'0';ch=getchar();}
return (f==1)?x:-x;
}
void add(int x,int y){
for(;x<maxn;x+=lowbit(x)) c[x]+=y;
}
int sum(int x){
int ans=0;
for(;x;x-=lowbit(x)) ans+=c[x];
return ans;
}
void CDQ3d(int l,int r){
if(l==r) return ;
int mid=(l+r)>>1;
CDQ3d(l,mid);CDQ3d(mid+1,r);
int p=l,q=mid+1,cnt=l;
while(p<=mid&&q<=r){
if(t[p].y<=t[q].y){
if(t[p].op==1&&t[p].flag==0)
add(t[p].z,1);
d[cnt++]=t[p++];
}
else {
if(t[q].op==2&&t[q].flag==1)
ans[t[q].id]+=t[q].w*sum(t[q].z);
d[cnt++]=t[q++];
}
}
while(p<=mid){
if(t[p].op==1&&t[p].flag==0)
add(t[p].z,1);
d[cnt++]=t[p++];
}
while(q<=r){
if(t[q].op==2&&t[q].flag==1)
ans[t[q].id]+=t[q].w*sum(t[q].z);
d[cnt++]=t[q++];
}
for(int i=l;i<=mid;i++){
if(t[i].op==1&&t[i].flag==0)
add(t[i].z,-1);
}
for(int i=l;i<=r;i++) t[i]=d[i];
}
void CDQ2d(int l,int r){
if(l==r) return ;
int mid=(l+r)>>1;
CDQ2d(l,mid);CDQ2d(mid+1,r);
int p=l,q=mid+1,cnt=l;
while(p<=mid&&q<=r){
if(e[p].x<=e[q].x){
t[cnt++]=e[p++];t[cnt-1].flag=0;
}
else {
t[cnt++]=e[q++];t[cnt-1].flag=1;
}
}
while(p<=mid){
t[cnt++]=e[p++];t[cnt-1].flag=0;
}
while(q<=r){
t[cnt++]=e[q++];t[cnt-1].flag=1;
}
for(int i=l;i<=r;i++) e[i]=t[i];
CDQ3d(l,r);
}
int main()
{
int T=read();
while(T--){
memset(ans,0,sizeof(ans));
m=read();tot=0;
int op,x1,y1,z1,x2,y2,z2,t=0;
for(int i=1;i<=m;i++){
op=read();
if(op==1){
x1=read(),y1=read(),z1=read();
e[++tot]=(Element){1,x1,y1,z1,1,tot,0};
}
else {
x1=read(),y1=read(),z1=read(),x2=read(),y2=read(),z2=read();
t++;
e[++tot]=(Element){2,x2,y2,z2,1,t,0};
e[++tot]=(Element){2,x1-1,y2,z2,-1,t,0};
e[++tot]=(Element){2,x2,y1-1,z2,-1,t,0};
e[++tot]=(Element){2,x2,y2,z1-1,-1,t,0};
e[++tot]=(Element){2,x1-1,y1-1,z2,1,t,0};
e[++tot]=(Element){2,x1-1,y2,z1-1,1,t,0};
e[++tot]=(Element){2,x2,y1-1,z1-1,1,t,0};
e[++tot]=(Element){2,x1-1,y1-1,z1-1,-1,t,0};
}
}
for(int i=1;i<=tot;i++) mp[i]=e[i].z;
sort(mp+1,mp+tot+1);
int cnt=unique(mp+1,mp+tot+1)-mp-1;
for(int i=1;i<=tot;i++) e[i].z=lower_bound(mp+1,mp+cnt+1,e[i].z)-mp;
CDQ2d(1,tot);
for(int i=1;i<=t;i++) printf("%d\n",ans[i]);
}
return 0;
}
```
更高的偏序问题就要用到 $bitset$ 啦,时间复杂度 $O(\frac{n^2}{32})$,今天就不讲了。
习题:[[CQOI2011]动态逆序对](https://www.luogu.org/problemnew/show/P3157)
这道题离线做法就是化为 $Time_i<Time_j$ 且 $Pos_i<Pos_j$ 且 $Val_i<Val_j$,然后用 $CDQ$ 分治解决经典的三维偏序问题
当然,$CDQ$ 分治不只能解决偏序类问题 @foreverlastnig,应该是 $[l,mid]$ 的数对 $[mid+1,r]$ 产生了贡献并计算。
------------
## 整体二分
整体二分类似于一些决策单调性的分治,可以解决诸多区间第 $k$ 小或区间第 $k$ 大的问题。
整体二分 `solve(l,r,L,R)` 表示答案在 $[l,r]$ 中,与操作 $[L,R]$ 有关(操作 $[L,R]$ 不一定对应原来 $[L,R]$ 的操作)
我们就拿静态区间第 $k$ 小来说好了。如果原序列的数 $\leq mid$,那么就在树状数组中对应位置 $+1$。如果碰到询问操作,那么查询询问区间 $[ql,qr]$ 的值相当于查询了区间中值在 $[l,mid]$ 的个数,如果个数 $\leq k$,那么答案在 $[mid+1,r]$ 中,那么把 $k$ 减掉对应的个数,把操作分到右区间。否则答案在 $[l,mid]$ 中,把操作分到左区间。
如果 $l=r$,那么直接把 $ans$ 记录一下就好了。时间复杂度 $O(n\log^2 n)$
不过我刚刚想到,如果将答案离散化一下,常数理论上会小下很多。读者有兴趣可以实现一下。
例题:[【模板】可持久化线段树 1(主席树)](https://www.luogu.org/problemnew/show/P3834)
```cpp
#include <bits/stdc++.h>
#define lowbit(x) ((x)&(-(x)))
using namespace std;
const int maxn=200000+10;
const int inf=1e9;
int n,m,a[maxn],c[maxn],ans[maxn],cnt;
struct Query{
int l,r,k,op,id;
}q[maxn<<1],q1[maxn<<1],q2[maxn<<1];
inline int read(){
register int x=0,f=1;char ch=getchar();
while(!isdigit(ch)){if(ch=='-')f=-1;ch=getchar();}
while(isdigit(ch)){x=(x<<3)+(x<<1)+ch-'0';ch=getchar();}
return (f==1)?x:-x;
}
void add(int x,int y){
for(;x<=n;x+=lowbit(x)) c[x]+=y;
}
int sum(int x){
int ans=0;
for(;x;x-=lowbit(x)) ans+=c[x];
return ans;
}
void solve(int l,int r,int L,int R){
if(L>R) return ;
if(l==r){
for(int i=L;i<=R;i++)
if(q[i].op==2) ans[q[i].id]=l;
return ;
}
int mid=(l+r)>>1,cnt1=0,cnt2=0,x;
for(int i=L;i<=R;i++){
if(q[i].op==1){
if(q[i].l<=mid) q1[++cnt1]=q[i],add(q[i].id,q[i].r);
else q2[++cnt2]=q[i];
}
else {
x=sum(q[i].r)-sum(q[i].l-1);
if(q[i].k<=x) q1[++cnt1]=q[i];
else q[i].k-=x,q2[++cnt2]=q[i];
}
}
for(int i=1;i<=cnt1;i++)
if(q1[i].op==1) add(q1[i].id,-q1[i].r);
for(int i=1;i<=cnt1;i++) q[L+i-1]=q1[i];
for(int i=1;i<=cnt2;i++) q[L+i+cnt1-1]=q2[i];
solve(l,mid,L,L+cnt1-1);
solve(mid+1,r,L+cnt1,R);
}
int main()
{
n=read(),m=read();
int l,r,k;
for(int i=1;i<=n;i++) a[i]=read(),q[++cnt]=(Query){a[i],1,0,1,i};
for(int i=1;i<=m;i++) l=read(),r=read(),k=read(),q[++cnt]=(Query){l,r,k,2,i};
solve(-inf,inf,1,cnt);
for(int i=1;i<=m;i++) printf("%d\n",ans[i]);
return 0;
}
```
那么动态区间第 $k$ 小带修改操作怎么搞呢?
我们可以把原来的减掉再加上后来的,然后跑一遍整体二分就好了。
例题:[Dynamic Rankings](https://www.luogu.org/problemnew/show/P2617)
```cpp
#include <bits/stdc++.h>
#define lowbit(x) ((x)&(-(x)))
using namespace std;
const int maxn=200000+10;
const int inf=1e9;
int n,m,a[maxn],c[maxn],ans[maxn],cnt,tot;
struct Query{
int l,r,k,id,op;
}q[maxn*3],q1[maxn*3],q2[maxn*3];
inline int read(){
register int x=0,f=1;char ch=getchar();
while(!isdigit(ch)){if(ch=='-')f=-1;ch=getchar();}
while(isdigit(ch)){x=(x<<3)+(x<<1)+ch-'0';ch=getchar();}
return (f==1)?x:-x;
}
void add(int x,int y){
for(;x<=n;x+=lowbit(x)) c[x]+=y;
}
int sum(int x){
int ans=0;
for(;x;x-=lowbit(x)) ans+=c[x];
return ans;
}
void solve(int l,int r,int L,int R){
if(L > R) return ;
if(l == r){
for(int i=L;i<=R;i++)
if(q[i].op==2) ans[q[i].id]=l;
return ;
}
int mid=(l+r)>>1,cnt1=0,cnt2=0,x;
for(int i=L;i<=R;i++){
if(q[i].op==1){
if(q[i].l <= mid) q1[++cnt1]=q[i],add(q[i].id,q[i].r);
else q2[++cnt2]=q[i];
}
else {
x=sum(q[i].r)-sum(q[i].l-1);
if(q[i].k <= x) q1[++cnt1]=q[i];
else q[i].k-=x,q2[++cnt2]=q[i];
}
}
for(int i=1;i<=cnt1;i++)
if(q1[i].op==1) add(q1[i].id,-q1[i].r);
for(int i=1;i<=cnt1;i++) q[L+i-1]=q1[i];
for(int i=1;i<=cnt2;i++) q[L+i+cnt1-1]=q2[i];
solve(l,mid,L,L+cnt1-1);
solve(mid+1,r,L+cnt1,R);
}
int main()
{
n=read(),m=read();
int l,r,k;char op;
for(int i=1;i<=n;i++) a[i]=read(),q[++cnt]=(Query){a[i],1,0,i,1};
for(int i=1;i<=m;i++){
op=getchar();
while(!isalpha(op)) op=getchar();
if(op=='Q') l=read(),r=read(),k=read(),q[++cnt]=(Query){l,r,k,++tot,2};
else l=read(),r=read(),q[++cnt]=(Query){a[l],-1,0,l,1},q[++cnt]=(Query){a[l]=r,1,0,l,1};
}
solve(-inf,inf,1,cnt);
for(int i=1;i<=tot;i++) printf("%d\n",ans[i]);
return 0;
}
```
习题:[[ZJOI2013]K大数查询](https://www.luogu.org/problemnew/show/P3332)
我们把这个区间插入变成在线段树上区间增减,然后查询排名就相当于查询区间和。
不过线段树清空的时候直接再加一个懒标记在 $pushdown$ 中下传就好了,不用像树状数组一样把原来加上的值减掉。