树形问题选讲

· · 算法·理论

省流:本篇专供冲击NOIP一等的人使用,坐标HN

博客同步

1.ST表&&倍增法求LCA

一对好兄弟。

1.1 ST表

ST表是一种数据结构,不带修(悲),可以处理满足可加性可重复贡献两条性质的区间信息

e.g.

而且码量小(小到我还是背不下来(悲)),效率高

一般来说,ST表的预处理为O(n\log n),查询直接一个O(1)震惊百万OIer,太快了。

我们就开始学习吧!!!

首先我们要知道一个常识,如何求对数……?

先把这道题切了,并且欣赏一下我和工程大佬抢最优解的搞笑过程(?)

然后,万事开头难,我们先建个额外的ST[maxn]数组,开始啦!!

然后,我们思考如何做到这么优秀的复杂度。

一般来说,给的数据都是一维的,我们的常规思维是加点维度,让空间承担更多可以提前确定的答案,以减少单次查询的运算。那我们怎么加呢?

诶,这个时候我们就要用到一种叫倍增的思想了

朴素的查找肯定是一个个查,但是倍增就不一样了,一个不行,跳一个再找,还不对,跳两个,还不对,跳四个……还不对?!跳八个!!!(逼急了属于是,OIer做题实录)

所以一个个查肯定是查了O(n)次,而倍增可以只查O(\log_{2}n)次,good

很好的算法,使你不知道怎样用它减小查询次数

那我们就可以考虑拓展ST,把它的大小拓展[maxn][\log_2 maxn]

它的第一维代表起点,第二维代表倍增查找的指数,合起来,就表示起点为i,长度为2^j这段区间的答案。

哦,真就这么简单吗?

啊,是的(

接下来就是激动人心的初始化时间了。

因为2^0=1,所以我们可以直接把原数据塞进ST[i][0]里,以i为起点,长度为2^0=1

然后,我们怎么把数据填满整个表呢?

来,在纸上画一条较长的线段,把左端点涂的明显些,这就代表一个长度为2^j的区间,左端点为i

然后再复习一个初中知识:

2^{j}=2 \times 2^{j-1}

所以最开始的区间显然可以分为两个区间:[i,i+2^{j-1}][i+2^{j-1}+1,i+2^{j-1}+2^{j-1}],我们[i,i+2^{j}]的答案就从这两个子区间转移上来,比如说最大值,答案就是两个子区间答案的最大值。

由于我们要填满整个表,填一次O(1),所以时间就是O(n\log n),为表的大小,\therefore 这也是空间复杂度。

好,那接下来怎么查询呢?给定区间[l,r],我们怎么O(1)搞定答案呢?

首先,由于ST表的答案存储依赖长度,我们先把区间长度len=r-l+1搞到手。然后设k=\log_2len,方便查表,没问题吧。

接下来就是重量级:

ans=ans(st[l][k],st[r-(1<<k)][k])

其中ans()为你要求的数据的处理函数。

为什么这样可以呢?,首先,你需要读懂那个位运算,这里不做解释。我们从这个区间中的两个地方跳了2^k长度,总长度就是2^{log_2len}=len,长度是没问题的,不会遗漏。

但是,怎么保证l+2^k一定等于r-2^k呢,证明就不放了。不要慌,因为这两个值不需要相等,它们代表的是两个区间的端点,只要两个区间有交集,结果就不会错,这就是可重复贡献的好处,你可以拿最大值的例子套一套。

同样的,区间和这种东西就无法用ST表维护,因为它不能遗漏,也不能有交集,我们在ST表中不关心交集的大小,但在区间和中,被加两次是相当令人头疼的。

因为查询可以直接差分,所以就是O(1)的!

好了,讲完了,接下来把模板题切了吧!

习题1.1.1

P3865 【模板】ST表 && RMQ问题

注意,在O(n\log n)的循环中,我们外循环是枚举长度指数,内循环则是枚举起点,和数组定义是反过来的(当然,你可以试着把数组反过来定义,可能没这么多问题,但我没试过)而且终止条件是i+2^j-1\le n,终止条件是显然的,因为你不能越界。

AC Code:

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e5+7;
const int log2maxn=25;
#define endl '\n'

int st[maxn][log2maxn];//第一维为数组个数,第二维为数组个数的倍增指数
int logs[maxn];

inline int query(int l,int r)
{
    int k=logs[r-l+1];

    return max(st[l][k],st[r-(1<<k)+1][k]);
}

int main()
{
    ios::sync_with_stdio(false);
    cin.tie(0);
    cout.tie(0);
    int n=0,m=0,l=0,r=0;
    cin>>n>>m;
    logs[1]=0;
    for(int i=2;i<=n;i++)
    {
        logs[i]=logs[i>>1]+1;
    }
    for(int i=1;i<=n;i++)
    {
        cin>>st[i][0];
    }
    //预处理
    for(int j=1;j<=logs[n];j++)//先枚举区间长度指数
    {
        for(int i=1;i<=n-(1<<j)+1;i++)//再枚举区间起点
        {
            st[i][j]=max(st[i][j-1],st[i+(1<<(j-1))][j-1]);
        }
    }
    for(int i=1;i<=m;i++)
    {
        cin>>l>>r;
        cout<<query(l,r);
        if(i<m)cout<<endl;
    }
    return 0;
}

好了,学会了这个有用但不是很有用的数据结构,我们来看它的一个重要应用。

1.2 倍增法求LCA

本文不涉及tarjan法,因为€€£的官方教材上估计是觉得CSP 2022 T3级别的数据tarjan都过不去,所以写了一句“实际中几乎完全被取代”。难绷。

LCA是最近公共祖先的英文缩写(废话),指的是树中的两个节点的最近的(距离最小的)公共祖先。比如说,你和你的兄弟姐妹的LCA肯定是爸爸妈妈,但是别的情况我们不涉及(

特别的,如果两个点本身就是一条脉上的,即某个点是另外一个点的祖先,我们规定这两个点的LCA为深度最小的那个点,这跟\gcd(2,4)=2,\operatorname{lcm}(2,4)=4是一个道理。

好,那怎么求出同一棵树上任两个节点的LCA呢?

一个暴力的想法马上就可以写出来,用两个变量当“指针”,指着这两个点,然后依次跳到它们的父亲,一直到这两个指针指到相同节点为止。这个相同节点就是所求的LCA。

由于我们需要一直往上跳,遍历的节点很多,对于n个结点的树进行q次询问的话,暴力做法的复杂度达到了O(nq),很多题目都无法承受。

那么有什么优化的方法吗?答案是肯定的,我给你在上面暴力流程中画一下关键词:

依次跳到它们的父亲

看到了吧,跟我们之前讲的“一个个查”很类似,那我们也可以异想天开,看看这种树上查询能不能用ST表搞定。

这一回,我们的ST表有实际意义了。对于每个st[i][j],它表示:从节点i向上跳2^j层所到达的节点。我们这里做个约定,由于储存内容是下表的父亲,我们把st暂时改名叫fa,之前写ST表的对数表用来给节点储存深度,改叫dep。其余不变。

首先搞定fa的初始化,由于这不是线性结构的问题了,我们在树上的预处理受到树节点连边的限制。所以,我们把预处理放进树的dfs()

我们首先把传入节点的dep初始化为它父亲的+1,然后,它往上跳一层便是它的父亲,所以把fa[传入节点][0]初始化为它的父亲节点编号。

接下来,我们一直往上跳,直到跳到深度限制(对,就是这么夸张),但是我们肯定不能一个一个跳,我们是枚举指数,就像初始化ST表那样。那么,我们怎么做呢?fa[x][i]有什么规律呢?

我们再回到那个初中等式:

2^{j}=2 \times 2^{j-1}

有没有什么启发?直接看这个式子显然没有。

但是呢,我们可以将“从起点i2^j层”这个过程分成两步,先从i2^{j-1}层,再从新起点跳2^{j-1}层。这样,我们就跳了2\times 2^{j-1}=2^{j}层。成功把这个过程等价了。

如果你还没什么感触的话,你应该想到一个式子:

fa[u][i]=fa[fa[u][i-1]][i-1]

其中,u是最开始的节点。

这下就明白怎么向上更新了吧?但是……请问我们到现在为止,干的事情……跟dfs()有什么关系?

好吧,为了在形式上更像dfs(),我们来考虑一下转移问题。

……还能怎么转移?考虑完了自己的爹,肯定要考虑自己的子孙后代的爹了!(无隐喻

我们就遍历传入节点的子孙,但是如果你加的是双向边的话,那你就很麻烦,因为搞不好判儿子的时候会指父为子,哦,不敢想象……

我们就判定,对于点i的某条边,如果它指向的不是父亲节点,就以这条边的另一个端点作为传入节点,它的父亲节点就是i。顺便说一句,父亲节点也是在dfs()的形参列表里传进去的。

好,这样我们就完成了每个点的初始化,n个点跳了\log_2 n的高度,总时间复杂度为O(n\log_2 n),刚好和ST表的预处理一致。

接下来查询,也没什么别的,就是让dep大的那个点一路往上跳,这里的跳是fa[u][i]。然后当两个点dep一致的时候,就一起跳,只是它们俩的跳这下可以基于ST表(fa),越跳越高,乐。当跳到两个节点的fa相同时,就不跳了。

然后,我们返回其中一个节点的fa[u][0],既然它们的父亲相同了,那再跳一步就到了嘛。

如果第一阶段的单独跳结束后,两个指针刚好重合,那就说明它们在一条脉上,由于已经跳完了,这时返回任意一个节点都可以。记得在一起跳之前判掉。

这样做,你需要O(n\log_2 n)的预处理,q次查询,每次最多查\log_2 n个点,那么查询就是O(q\log_2 n),总的就是O((n+q)\log_2 n)可能会超时,但是对于我们的目标要求已经够用了

好了,模板题来袭!!!

习题1.2.1

P3379 【模板】最近公共祖先(LCA)

本题用了邻接表存树,你用链式前向星也可以。

AC Code:

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e7;
const int log2maxn=25;
#define endl '\n'

vector<int> tree[maxn];
int fa[maxn][30];
int dep[maxn];

inline void adde(int u,int v)
{
    tree[u].push_back(v);
}

void dfs(int u,int father)
{
    dep[u]=dep[father]+1;
    fa[u][0]=father;
    for(int i=1;i<=log2maxn;i++)
    {
        fa[u][i]=fa[fa[u][i-1]][i-1];
    }
    for(int i=0;i<tree[u].size();i++)
    {
        if(tree[u][i]!=father)dfs(tree[u][i],u);
    }
}

int lca(int u,int v)
{
    if(dep[u]<dep[v])
    {
        swap(u,v);
    }
    for(int i=log2maxn;i>=0;i--)
    {
        if(dep[fa[u][i]]>=dep[v])
        {
            u=fa[u][i];
        }
    }
    if(u==v)return v;
    for(int i=log2maxn;i>=0;i--)
    {
        if(fa[u][i]!=fa[v][i])
        {
            u=fa[u][i];
            v=fa[v][i];
        }
    }
    return fa[u][0];
}

int main()
{
    ios::sync_with_stdio(false);
    cin.tie(0);
    cout.tie(0);
    int n=0,m=0,root=0,u=0,v=0,l=0,r=0;
    cin>>n>>m>>root;
    for(int i=1;i<=n-1;i++)
    {
        cin>>u>>v;
        adde(u,v);
        adde(v,u);
    }
    dfs(root,0);
    for(int i=1;i<=m;i++)
    {
        cin>>l>>r;
        cout<<lca(l,r);
        if(i<m)cout<<endl;
    }
    return 0;
}

2. 线段树

众所周知,ST表虽然能上树,但是它终究是个静态的东西,不带修让人很难受,我们现在就开始学习一种OIer根本无法绕开不学的数据结构——线段树!!!(Segment Tree,SGT),它支持动态修改和点查/区查,并且全是O(\log_2 n)级别的,相当的快啊。

而且还有很多变种:

但是这些东西本文基本上都不学……

权值线段树会讲,zkw本来想讲,但是发现没必要(

我们省选再见好吧。

2.1 普通线段树

线段树确实是树形的,但是它维护的还是一个线性序列的信息,它的节点事实上是维护一个区间的信息。

所以,我们可以从根节点开始,一步步递归,分治,把每个节点所代表的区间端点传递下去。为什么可以递归呢?这里引入一个小结论,我们暂时不予证明:

对于一棵二叉树,节点x的左儿子为2x,右儿子为2x+1,写成位运算的形式为x<<1(x<<1)|1

做了这么多题,你应该对下表和信息存储之间的关系有些想法了。现在让我们来看看具体怎么递归。

首先,我们把信息读入原线性数组arr,设其长度为n,然后进行线段树的初始化。根节点所代表的区间自然是[1,n],如果没有到叶子节点,我们就别停,设当前传递到了区间[l,r],我们取mid=\lfloor \frac{l+r}{2}\rfloor,以[l,mid][mid+1,r]两个区间分别递归。

哦,什么时候停呢,不是叶子节点就递归,那是叶子节点就停呗!什么节点算叶子节点呢?当然是分无可分的时候,即l==r,分不出来了。这个时候,我们就设tree[pos]=arr[l],代表[l,l],当然就是arr[l]嘛!其中pos为当前递归位置,也可以认为是当前节点个数,不过就不利于理解下面的知识了(

当然,在递归建树完成后,我们还要进行一些小操作,每个节点既然代表了区间信息,那我们总得把信息拉到上面的节点来吧,不能沉在底下的叶子吧,你在ST表那里也干了这种活。

比如说区间和,我们可以直接把节点i的左右儿子的答案加在一起,作为节点i的答案。为什么呢?有没有发现,我们递归建树时,刚好把[l,r]对半切开,无缝分成两个儿子所代表的区间?所以我们统计该节点的答案时,只要把它儿子们的答案相加就可以了。我们把这个操作叫做pushup(),很形象吧,把底下的答案拉上去。

在每个节点的两个儿子的递归都跑完了后,我们就把答案pushup()上来,如果有目的的话,就是方便查询)

初始化完了,我们来讨论区修和区查,单点就是特殊情况嘛。

首先谈谈区间修改,我们怎么做呢,就是把待修改区间传递下去,对于每个节点i,如果它所代表的区间能够被我们所要修改的区间包括的话,那我们肯定传到足够小的区间了,把这个节点的答案更新,然后直接返回,跑。

不然的话,那就说明区间还分的不够小,我们取熟悉的mid,但是是这个节点的左右端点。然后判断一下,如果传入的左端点在中间值左边,那就说明在这个节点代表区间的左半边有贡献,左半边怎么表示?左儿子嘛!同理,右端点比中间值大的话,右半边就也需更改,就是右儿子嘛!最后改完了,别忘了pushup()

查询也是很简单,在修改的基础上改一下:

关于这些区间左右儿子,怎么体现呢?在修改和查询的函数里都加个pos参数,直接传儿子编号就行了,和初始化一样。最初调用时,我们赋1就可以,从根开始搜嘛。

这就是线段树的基本操作了,下面先来写道模板题。

习题2.1.1

P3372 【模板】 线段树 1

首先,线段树的数组要开4倍空间,严谨证明?从没给过好吧

这里再了解一个知识:懒标记(lazytag)

说是能延迟修改,但是我没看出来(

反正如果要继续向下修改/查询的话,就要把左右儿子的懒标记加上父亲的,同时改掉左右儿子的答案,最后把父亲的懒标记清空(传下去了,不要了)。这个操作叫pushdown(),就是把懒标记传下去。这个如果改到了叶子,那就直接加上懒标记就行了。

好了,你已经了解完了,可以先试试,我没有能力搞来好图片演示,靠干讲实在不太行。可以对着我的代码调(

AC Code:

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e6+7;
#define int long long

int arr[maxn];
struct node
{
    int l;
    int r;
    int sum;
    int lazy;
};
node tree[maxn*4];

inline int lson(int pos)
{
    return pos<<1;
}

inline int rson(int pos)
{
    return (pos<<1)|1;
}

inline void pushup(int pos)
{
    tree[pos].sum=tree[lson(pos)].sum+tree[rson(pos)].sum;
}

inline void pushdown(int pos)
{
    if(tree[pos].lazy!=0)
    {
        tree[lson(pos)].lazy+=tree[pos].lazy;
        tree[rson(pos)].lazy+=tree[pos].lazy;
        tree[lson(pos)].sum+=tree[pos].lazy*(tree[lson(pos)].r-tree[lson(pos)].l+1);
        tree[rson(pos)].sum+=tree[pos].lazy*(tree[rson(pos)].r-tree[rson(pos)].l+1);
        tree[pos].lazy=0;
    }
}

void build(int pos,int l,int r)
{
    tree[pos].l=l;
    tree[pos].r=r;
    tree[pos].lazy=0;
    if(l==r)
    {
        tree[pos].sum=arr[l];
        return;
    }
    int mid=(l+r)>>1;
    build(lson(pos),l,mid);
    build(rson(pos),mid+1,r);
    pushup(pos);
    return;
}

int query(int L,int R,int pos)
{
    if(tree[pos].l>=L&&tree[pos].r<=R)
    {
        return tree[pos].sum;
    }
    pushdown(pos);
    int mid=(tree[pos].l+tree[pos].r)>>1;
    int sum=0;
    if(L<=mid)sum+=query(L,R,lson(pos));
    if(R>mid)sum+=query(L,R,rson(pos));
    return sum;
}

void update(int L,int R,int pos,int val)
{
    if(tree[pos].l>=L&&tree[pos].r<=R)
    {
        tree[pos].sum+=val*(tree[pos].r-tree[pos].l+1);
        tree[pos].lazy+=val;
        return;
    }
    else
    {
        pushdown(pos);
        int mid=(tree[pos].l+tree[pos].r)>>1;
        if(L<=mid)update(L,R,lson(pos),val);
        if(R>mid)update(L,R,rson(pos),val);
        pushup(pos);
    }
}

signed main()
{
    int n=0,m=0,op=0,x=0,y=0,k=0;
    cin>>n>>m;
    for(int i=1;i<=n;i++)
    {
        cin>>arr[i];
    }
    build(1,1,n);
    for(int i=1;i<=m;i++)
    {
        cin>>op>>x>>y;
        if(op==1)
        {
            cin>>k;
            update(x,y,1,k);
        }
        else
        {
            cout<<query(x,y,1);
            if(i<m)cout<<endl;
        }
    }
    return 0;
}

习题2.1.2

P3373 【模板】 线段树 2

这里有两个懒标记那就开两个呗(,传递时改区间答案,记得先乘上乘法的lztag,再加上加法的。主要是为了符合运算律。主要是加法tag更新时要乘上乘法的tag,这一点很麻烦。可以像下面一样写个专门的函数计算。

而且乘法懒标记要赋为1!赋0就改不动了!

AC Code:

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e6+7;
#define int long long

int arr[maxn];
struct node
{
    int l;
    int r;
    int sum;
    int add;
    int mul;
};
node tree[maxn*4];

inline int lson(int pos)
{
    return pos<<1;
}

inline int rson(int pos)
{
    return (pos<<1)|1;
}

inline void calc(int pos,int add,int mul,int mod)
{
    tree[pos].sum=(tree[pos].sum*mul+(add*(tree[pos].r-tree[pos].l+1)))%mod;
    tree[pos].mul=(mul*tree[pos].mul)%mod;
    tree[pos].add=(tree[pos].add*mul+add)%mod;
}

inline void pushup(int pos)
{
    tree[pos].sum=tree[lson(pos)].sum+tree[rson(pos)].sum;
}

inline void pushdown(int pos,int mod)
{
    calc(lson(pos),tree[pos].add,tree[pos].mul,mod);
    calc(rson(pos),tree[pos].add,tree[pos].mul,mod);
    tree[pos].add=0;
    tree[pos].mul=1;
}

void build(int pos,int l,int r)
{
    tree[pos].l=l;
    tree[pos].r=r;
    tree[pos].add=0;
    tree[pos].mul=1;
    if(l==r)
    {
        tree[pos].sum=arr[l];
        return;
    }
    int mid=(l+r)>>1;
    build(lson(pos),l,mid);
    build(rson(pos),mid+1,r);
    pushup(pos);
    return;
}

int query(int L,int R,int pos,int mod)
{
    if(tree[pos].l>=L&&tree[pos].r<=R)
    {
        return tree[pos].sum;
    }
    pushdown(pos,mod);
    int mid=(tree[pos].l+tree[pos].r)>>1;
    int sum=0;
    if(L<=mid)sum+=query(L,R,lson(pos),mod)%mod;
    if(R>mid)sum+=query(L,R,rson(pos),mod)%mod;
    return sum;
}

void update(int L,int R,int pos,int add,int mul,int mod)
{
    if(tree[pos].l>=L&&tree[pos].r<=R)
    {
        calc(pos,add,mul,mod);
        return;
    }
    else
    {
        pushdown(pos,mod);
        int mid=(tree[pos].l+tree[pos].r)>>1;
        if(L<=mid)update(L,R,lson(pos),add,mul,mod);
        if(R>mid)update(L,R,rson(pos),add,mul,mod);
        pushup(pos);
    }
}

signed main()
{
    int n=0,m=0,mod=0,op=0,x=0,y=0,k=0;
    cin>>n>>m>>mod;
    for(int i=1;i<=n;i++)
    {
        cin>>arr[i];
    }
    build(1,1,n);
    for(int i=1;i<=m;i++)
    {
        cin>>op>>x>>y;
        if(op==1)
        {
            cin>>k;
            update(x,y,1,0,k,mod);
        }
        else if(op==2)
        {
            cin>>k;
            update(x,y,1,k,1,mod);
        }
        else
        {
            cout<<query(x,y,1,mod)%mod;
            if(i<m)cout<<endl;
        }
    }
    return 0;
}

习题2.1.3

P8856 [POI2002]火车线路

来看一道线段树的初级应用,这里也讲解一下,线段树如何解RMQ问题。

思路很简单,把时间轴看成是原线性数组,初始每个元素都为s,,然后初始化。每次查询在这段时间里的座位数的最小值,如果大于需要的座位,那就可以买,整段区间减掉座位,不然就不可以总司令

用线段树求这种动态RMQ问题和求区间和有什么区别呢?

……

没有什么区别(

结束。额……确实只有这种区别(

哦,数据表明,到第D天,人家下车了,不占座位了,所以所有查询和修改的区间都应为[O,D) or [O,D-1]

AC Code:

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e5+7;

struct node
{
    int l;
    int r;
    int val;
    int lazy;
};
node tree[maxn*4];

inline int lson(int pos)
{
    return pos<<1;
}

inline int rson(int pos)
{
    return (pos<<1)|1;
}

inline void pushup(int pos)
{
    tree[pos].val=min(tree[lson(pos)].val,tree[rson(pos)].val);
}

inline void pushdown(int pos)
{
    if(tree[pos].lazy)
    {
        tree[lson(pos)].lazy+=tree[pos].lazy;
        tree[rson(pos)].lazy+=tree[pos].lazy;
        tree[lson(pos)].val+=tree[pos].lazy;
        tree[rson(pos)].val+=tree[pos].lazy;
        tree[pos].lazy=0;
    }
}

void build(int pos,int l,int r,int s)
{
    tree[pos].l=l;
    tree[pos].r=r;
    tree[pos].lazy=0;
    if(l==r)
    {
        tree[pos].val=s;
        return;
    }
    int mid=(l+r)>>1;
    build(lson(pos),l,mid,s);
    build(rson(pos),mid+1,r,s);
    pushup(pos);
    return;
}

void change(int pos,int l,int r,int val)
{
    if(tree[pos].l>=l&&tree[pos].r<=r)
    {
        tree[pos].val+=val;
        tree[pos].lazy+=val;
        return;
    }
    else
    {
        pushdown(pos);
        int mid=(tree[pos].l+tree[pos].r)>>1;
        if(l<=mid)change(lson(pos),l,r,val);
        if(r>mid)change(rson(pos),l,r,val);
        pushup(pos);
    }
}

int query(int pos,int l,int r)
{
    if(tree[pos].l>=l&&tree[pos].r<=r)
    {
        return tree[pos].val;
    }
    pushdown(pos);
    int mid=(tree[pos].l+tree[pos].r)>>1;
    int res=0x3f3f3f3f;
    if(l<=mid)res=min(query(lson(pos),l,r),res);
    if(r>mid)res=min(query(rson(pos),l,r),res);
    return res;
}

int main()
{
    int n=0,num=0,m=0,l=0,r=0,k=0;
    cin>>n>>num>>m;
    build(1,1,n,num);
    for(int i=1;i<=m;i++)
    {
        cin>>l>>r>>k;
        if(query(1,l,r-1)>=k)
        {
            cout<<"T";
            change(1,l,r-1,-k);
        }
        else cout<<"N";
        if(i<m)cout<<endl;
    }
    return 0;
}

比分块来说,SGT可能更优,但也更容易被卡(,而且确实没有分块好写。

2.2 权值线段树

权值线段树肯定是沿袭了线段树的基本框架,但是原线性数组已被确定为题目所给值域,所以不用初始化了。

所以我们tree数组就可以确定为int类型,表示每个数值出现的次数,当然你硬是要用node类型也可以,但值域不大,不用优化时,我们显然可以偷懒,直接写成int,降低编码难度。

如果不用初始化,那我们修改和查询的区间传什么呢?你……肯定是在整个线性数组范围内查找啊,之前线段树是[1,n],那我们现在变成以值域作为线性数组,那最初传入的区间就是值域嘛!即[-maxn,maxn]。如果题目中没有给负数,那就[0,maxn],如果0也不给,那你照着写呗,总不能都是我给结论吧(

好,接下来我们了解一下权值线段树的功能:

相当于在线性数组上加减一个数,出现次数\pm 1

比它小的数有多少个,加上它自己1个。

因为线段树的每个叶子都是线性序列上的节点,所以我们只要找到第k小的叶子就可以了。

区间第k小请转向主席树 or 树套树

查查自己多大,再查查自己前后面是谁,搞定。

现在我们来一步步实现这些操作。

首先,把前面线段树的修改函数先拷过来。然后l==r的那个判叶子代码改成tree[pos]++或tree[pos]--,就表示我们在这个位置添加或者删除一个数了,pushup()还是要的,毕竟还要把每个区间的数据逐级拉上来。

我们的mid取传入区间的中间值,如果我们要修改的数比中间值小,显然要找左儿子,否则就找右儿子。

关于查询第k小的数呢,我们直接以k为基础判断,对于当前节点,如果k小于等于它的左边界,那不行,找找左儿子,显然传这个区间的一半作为值域,mid是老朋友了。不然的话,就说明整个左子树都小于k,那么我们就找右子树,但是右子树要减掉左子树的大小,因为左子树占了名额嘛。如果找到合适的叶子了,我们就返回叶子的边界(也就是第k小的数嘛)

那么,我们怎么进行这个逆操作,即查询一个数是多大呢?先把刚写的第k小拷过来,然后略作改动。具体就是如果这个数小于我们的老朋友mid,那就查左子树,反之,就查它在右子树中的排名,然后加上左子树的大小,左子树也占了名额嘛。

有了这两个互逆操作,我们查前驱后继就简单多了,首先,看看自己要传入的数是第几小,然后再查第(几-1)或(几+1)的数就可以了。

事实上,这几个功能跟我们接下来要讲的平衡树极为接近,所以我们可以找平衡树的板子来练习权值线段树。

习题2.2.1

P3369 【模板】普通平衡树

当你学了平衡树后,你肯定会觉得还是权值线段树好写,而且平衡树不一定能跑得比权值线段树快,只是权值线段树的区间比较大(虽然也没看到题目卡),比如说本题的值域就为\pm 1e7,加上线段树的四倍空间,我们可以把数组开到8 \times 10^7,要通过本题有点困难,我们来介绍权值线段树(其实普通线段树也可以)的一种空间优化:动态开点。

什么是动态开点呢?我们给线段树开四倍空间,这些空间不管你用不用都要开在那里,很没必要。动态开点就是需要修改(在权值线段树里体现在添加或删除一个数)时才开这个点,如果有数从来没出现过,我们就不开这个点了,这样就可以把实际空间节省到点数\times 4,当然你开4倍空间时还是要写1e7这个值域的。

区别主要体现在插入和删除上,我们设一个变量root表示根节点并赋0,将传入的pos改为引用传递(在函数里的修改是改你传进来的变量,所以不能传一个数),然后先把pos传进去。再设一个tot表示总点数。

在添删的操作里,如果传入的pos为空,那我们就直接把tot加一,然后把root赋成新的tot。因为传进来的都是左右儿子,如果他们为空,那肯定要新加点。

加了动态开点以后,节点的左右边界会变得不确定(因为省了一些点),建议直接开个结构体存着。这里的root是传了个引用,一开始赋成0,后面会自动改的,即根节点的编号。

然后就没了,没了?没了。

下面没给朴素写法(朴素写法又不是AC Code),直接加了动态开点,以供对照。

AC Code:

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e5+7;//询问数
const int maxn2=1e7+5;//值域

int tree[maxn*4];//每个节点储存内容
struct interval
{
    int l;
    int r;
};
interval node[maxn*4];//每个点所代表的边界
int tot=0;//点数

inline void pushup(int pos)
{
    tree[pos]=tree[node[pos].l]+tree[node[pos].r];
}

void ins(int &pos,int l,int r,int val)//插入
{
    if(!pos)pos=++tot;//新增一个点
    if(l==r)//只有叶子值域才会缩成一个点
    {
        tree[pos]++;//rp++
        return;//要是不返回你就死定了
    }
    int mid=(l+r)>>1;//二分
    if(val<=mid)ins(node[pos].l,l,mid,val);//插入的数比当前节点代表的区间的中间值还小,那就往左边找
    else ins(node[pos].r,mid+1,r,val);//要不还是往右边找吧
    pushup(pos);//别忘了把这个数汇报给上级
}

void del(int &pos,int l,int r,int val)//删除,和插入基本一致
{
    if(!pos)pos=--tot;//关于这个点,它死了。别忘了把这个点销户
    if(l==r)
    {
        tree[pos]--;
        return;
    }
    int mid=(l+r)>>1;
    if(val<=mid)del(node[pos].l,l,mid,val);
    else del(node[pos].r,mid+1,r,val);
    pushup(pos);
}

int kth(int pos,int l,int r,int k)//全局第k个
{
    if(l==r)return l;//找到合适的叶子了,很明显叶子的边界就是排名
    int mid=(l+r)>>1;//二分again
    if(k<=tree[node[pos].l])return kth(node[pos].l,l,mid,k);//你要找的数在左子树上
    else return kth(node[pos].r,mid+1,r,k-tree[node[pos].l]);//你要找的数在右子树上,同时,左子树占了名额,把它们都减去
}

int getrank(int pos,int l,int r,int val)//全局排名查询
{
    if(l==r)return 1;//找到了!
    int mid=(l+r)>>1;//二分again again
    if(val<=mid)return getrank(node[pos].l,l,mid,val);//去左边那桌
    else return getrank(node[pos].r,mid+1,r,val)+tree[node[pos].l];//去右边那桌,记得把左边的名额带过来
}

int main()
{
    int n=0,op=0,x=0,root=0;
    cin>>n;
    for(int i=1;i<=n;i++)
    {
        cin>>op>>x;
        if(op==1)
        {
            ins(root,-maxn2,maxn2,x);
        }
        if(op==2)
        {
            del(root,-maxn2,maxn2,x);
        }
        if(op==3)
        {
            cout<<getrank(root,-maxn2,maxn2,x);
            if(i<n)cout<<endl;
        }
        if(op==4)
        {
            cout<<kth(root,-maxn2,maxn2,x);
            if(i<n)cout<<endl;
        }
        if(op==5)
        {
            int num=getrank(root,-maxn2,maxn2,x);//前驱肯定是第k-1个数
            cout<<kth(root,-maxn2,maxn2,num-1);
            if(i<n)cout<<endl;
        }
        if(op==6)
        {
            int num=getrank(root,-maxn2,maxn2,x+1);//后继肯定是第k+1个数
            cout<<kth(root,-maxn2,maxn2,num);
            if(i<n)cout<<endl;
        }
    }
    return 0;
}

2.3 树状数组

学了线段树,你可能会被它的码量深深折服(

其实它还有种码量小的对手(当然实际应用中不是这么回事),叫树状数组

二者的思维比较相近,都是把线性结构转为树形结构。但

它是怎么做到的呢?这个问题比较抽象。简单来说,它删掉了一棵普通的二叉树的一些节点,与线段树一样,原数组沉在最底下,然后上面的辅助节点的编号进行二进制展开后最后面的1屁股后面的零坨一样多,零坨越多,转化成树的深度越浅。

似乎很抽象,我们举个例子,假设原数组长度为8

然后我们把1-8展开成二进制:

\begin{aligned} 1=000\color{#66CCFF}{1}\\ 2=00\color{#EE0000}{10}\\ 3=001\color{#66CCFF}{1}\\ 4=0\color{#006666}{100}\\ 5=010\color{#66CCFF}{1}\\ 6=01\color{#EE0000}{10}\\ 7=011\color{#66CCFF}{1}\\ 8=1000 \end{aligned}

容易发现,相同颜色标记的数字都满足这个特点。所以,对有8个元素的数组,我们构建树状数组后,应该是如下结构:

每层有什么节点清楚了……清楚了吗?n个节点都这么推吗?,如何让计算机去数最后面的零坨?

我们在这里介绍一种运算:lowbit()

首先我们先给待求数按位取反,然后+1,由计算机基本原理可知,这个操作相当于直接取负,所以不要怕实现复杂。

然后,我们拿着这个数和原数进行按位与,C++就一个&,我们不管了。

比如说6,我们展示它有内容的字节(int有四个字节嘛),演示一下这个过程:

\begin{aligned} 原数:00000110\\ 变换:11111010\\ 结果:00000010 \end{aligned}

你看,是不是就拿到了一个数最后一个1和后面的零坨?

数学证明就不要深究了……whk数学能拿多少分,还能看得懂这种证明。( (无恶意)

我们就规定,树状数组tree[i]储存的是原数组的右端点为i的信息。

???

那左端点呢?1吗?nonono,那跟前缀和数组还有什么区别

我们又在这里定义,tree[i]的所储存的区间的长度是lowbit(i),这样的话,手模一下上面的例子,tree[i]的元素各自存储的区间为:

\begin{aligned} tree[1]=[1,1]\\ tree[2]=[1,2]\\ tree[3]=[3,3]\\ tree[4]=[1,4]\\ tree[5]=[5,5]\\ tree[6]=[5,6]\\ tree[7]=[7,7]\\ tree[8]=[1,8] \end{aligned}

然后呢?这么规定有什么用?

别急啊,首先,我们思考一下线段树的几个功能

因为前面说了区修区查一起搞很复杂,所以,我们分点修+区查区修+点查两种情况来讨论。

我们考虑对单点进行修改,比如说,我们改arr[1],那跟tree数组有什么关系呢?一看先前的表,哦,tree[1],tree[2],tree[4],tree[8]都涉及到了arr[1]这个位置,那都要改咯。

但是每一个点都会牵扯到这么多区间吗?我们怎么进行tree[i]更改的转移呢?

我们研究1,2,4,8这四个数的关系,这时,我们就请出我们的利器lowbit(),既然都说了有关系,先拿它试试呗:

\begin{aligned} lowbit(1)=1\\ lowbit(2)=2\\ lowbit(4)=4 \end{aligned}

哦,似乎有点好玩的事情。

\begin{aligned} 1+lowbit(1)=2\\ 2+lowbit(2)=4\\ 4+lowbit(4)=8 \end{aligned}

哦!我们在线段树里就发现了,深度越浅的节点区间越大,所以当修改了一个点时,我们要把它的修改值传上去,就可以一直给它的下标+lowbit(它的编号),这样做可以不重不漏,好耶!

但这只是个孤证啊!没事,我们再改个arr[5],查表,先改tree[5],加个lowbit(5)=1,转移到了tree[6],再加个lowbit(6)=2,就到了tree[8]了!可以证明没有哪个包含arr[5]的区间被落下。

那就这样了,假如我们要修改arr[i],我们只要修改它对应的tree[i],然后一路加lowbit()转移,转移一次修改一次,直到tree[n]修改完成,因为tree[n]代表了[1,n],这肯定是最大的,所以不用再修改了。我们就退出。

那区间查询呢?好像有点不方便。比如我们要查询[1,6],查表,可以直接返回tree[4]+tree[6],那查询[3,6]呢?不行了吧。

但是我们可以观察到,查找[1,i]这个区间,基本上就是修改的逆操作,我们可以直接减减减lowbit(),减到tree[1]打止。

那我们有一个构想,对于可差分的信息,比如区间和,[l,r]的答案显然就是[1,r]的答案减去[1,l-1]的答案,那么我们只要查询两次,再把答案相减就可以了,那么不可差分的信息怎么维护?对不起,不好搞,对于我们无法解决的问题,我们就把它扔进限制条件,让后世OIer们受苦吧)

当然,存在一种O(\log^2n)(对你没看错)的做法可以这么做,但我们用不上,所以鸽了,咕咕咕。

由于这种模式下查询时tree下标往前走,修改时往后走,我们可以记成“向前查,向后修”

习题2.3.1

P3374 【模板】树状数组 1

本题为div.点修+区查

AC Code:

#include<bits/stdc++.h>
using namespace std;
const int maxn=5e5+7;

int treearr[maxn];

inline int lowbit(int x)
{
    return x&-x;
}

void change(int n,int pos,int val)
{
    while(pos<=n)
    {
        treearr[pos]+=val;
        pos+=lowbit(pos);
    }
}

int query(int pos)
{
    int t=0;
    while(pos>0)
    {
        t+=treearr[pos];
        pos-=lowbit(pos);
    }
    return t;
}

int main()
{
    int n=0,m=0,buf=0,op=0,x=0,val=0,l=0,r=0;
    cin>>n>>m;
    for(int i=1;i<=n;i++)
    {
        cin>>buf;
        change(n,i,buf);
    }
    for(int i=1;i<=m;i++)
    {
        cin>>op;
        if(op==1)
        {
            cin>>x>>val;
            change(n,x,val);
        }
        else
        {
            cin>>l>>r;
            cout<<query(r)-query(l-1);
            if(i<m)cout<<endl;
        }

    }
    return 0;
}

我们前面点查修改一次要从树上爬下去,是O(\log_2 n)的。如果暴力扫的话会是O(n\log_2 n),题目受不住。

我在这时看了一眼自己的代码……所以为什么要暴力扫?

我们在区间查询时提到了两点:

一次查询,查的是[1,i]

查询和修改刚好方向相反

那么,我们也可以发现,区修实质上可以沿用点修的函数,点修影响了包含这个点的区间,可以认为,在它修改的区间内,最大的是[i,n](虽然实际上没有改这么多)如果这些区间中有的不能改,我们可以把它改回来就是了。

我们试试这个猜想,对于区间[3,5],我们修改一下3

改tree[3],即[3,3]\\ lowbit(3)=1,3+1=4\\ 改tree[4],即[1,4]\\ lowbit[4]=4,4+4=8\\ 改tree[8],即[1,8]

我们发现,实质上,你可以认为修改对[3,8]都产生了影响,但我们只要修改[3,5],所以应该把[6,8]的影响抵消掉

怎么做?不难发现,以6为起点,数值相反,再做一次区修嘛!6是甚么?右端点5再加一嘛!

好,因为只爬了两次,我们依然只有O(\log_2 n)

我们居然把O(n\log_2 n)打成了O(\log_2 n),整整一个n啊!这就是算法的力量!

接下来是最后一关了!点查怎么写?

由于树状数组区修区查奇怪的不相容性质,搭配区修,点查也爬两次会出现一点小错误怎么都算不对。我们在这种情况下读入数据时应直接把数据读入原数组arr,然后点查i结果就是给i的区查函数的结果加上arr[i]。原理我们不予证明,因为树状数组此时的性质已经变为了差分数组。

习题2.3.2

P3368 【模板】树状数组 2

本题为div.区修+点查

AC Code:

#include<bits/stdc++.h>
using namespace std;
const int maxn=5e5+7;

int treearr[maxn];
int arr[maxn];

inline int lowbit(int x)
{
    return x&-x;
}

void change(int n,int pos,int val)
{
    while(pos<=n)
    {
        treearr[pos]+=val;
        pos+=lowbit(pos);
    }
}

int query(int pos)
{
    int t=0;
    while(pos>0)
    {
        t+=treearr[pos];
        pos-=lowbit(pos);
    }
    return t;
}

int main()
{
    int n=0,m=0,op=0,x=0,val=0,l=0,r=0;
    cin>>n>>m;
    for(int i=1;i<=n;i++)
    {
        cin>>arr[i];
    }
    for(int i=1;i<=m;i++)
    {
        cin>>op;
        if(op==1)
        {
            cin>>l>>r>>val;
            change(n,l,val);
            change(n,r+1,-val);
        }
        else
        {
            cin>>x;
            cout<<query(x)+arr[x];
            if(i<m)cout<<endl;
        }

    }
    return 0;
}

树状数组比线段树的优点就是码量巨小,好调试,没别的。

3.平衡树选讲

平衡树是一种较为强劲但真的很麻烦的二叉搜索树。

一般平衡树的时间都比权值线段树长,但是空间只需一倍,而不是8倍,但有动态开点后还管什么!平衡树主要还能解决区间翻转,比如所谓“文艺平衡树”,这个权值线段树比较困难,不好实现对应的操作。

多种平衡树的主要作用都是防止二叉查找树退化成链。一般的,当插入的节点过多过密时,线段树基本上就只有一条链有实际信息了。比如想象一下插入{1,4,5}三种元素的其中一个,插1e7次,那查询时肯定有许多冗余区间,而且会把树高退化到O(n),更不利于查找。平衡树就是通过给每个点一个随机权值,使树高维持在O(\log_2 n),防止成链。

平衡树基于这两个指标维护树高和查找的操作也是多种多样而且很抽象的,一般来说,平衡树和它们维护树高的操作如下:

是不是只有最后一个最特殊?那就是我们要学的(

具体来说,对于每个点,我们赋两个值:$val$和$randval$,前者就是你要添加/删除的数,后者用$rand()$决定。对于$val$,我们采用二叉搜索树来存储,即左子树每个节点的值都小于根节点,右子树每个结点的值都大于根节点,但我们再根据$randval$,把这棵树稍作修改,使其符合小根堆的性质。堆结构就是用来维持树高稳定的。所以叫平衡树。 好,我们先来了解平衡树结点的结构,它一般如下所示: ```cpp struct node { int l; int r; int size; int val; int randval; } node tree[maxn]; ``` 在权值线段树里你也感受到了,每个结点的所有儿子并无一个稳定的规律,所以这里的$l$,$r$都是指向当前节点的左右儿子,其余的前面已经提到过了。 新建一个节点就只要填表了。我们设一个$idx$表示当前总点数。 ```cpp void newnode(int &x,int val) { x=++idx;//直接更改新点数,不返回了 tree[idx].val=val; tree[idx].size=1; tree[idx].randval=rand(); } ``` 回到操作,普通$treap$维持堆结构的操作就是左旋和右旋,当$randval$不对劲时,根据$randval$的大小,把根节点和左右儿子对调。就像是旋转了一样。 这么转来转去确实太容易把人转糊涂了,所以有旋treap在赛场上的使用率最低( 而$范夶(\mathrm{b\check{i}})奆(\mathrm{ju\grave{a}n})$不是怎么想的,他提出了两个新操作:分裂与合并 怎么做呢? 分裂有两种,要么按**节点值域**将一棵树分成两棵,并删掉一些边,使其仍符合平衡树的结构;要么按**子树大小**分。前者一般用在普通平衡树,后者一般用在文艺平衡树。受限于例题要求,本文只讲按**节点值域**分裂。 按值域分裂,我们先确定参数,和线段树差不多: ```cpp void split(int pos,int val,int &x,int &y); ``` 它们分别表示当前位置、按什么值分裂,新的两棵树的树根,可以看成是对节点的左右儿子的关系的更改。根节点和左右儿子的关系就是树的边嘛,这样就让我们联想到加边和删边,也就是分裂和合并中必备的操作。 好,首先,如果当前位置$pos$为空,那我们可能走错节点了,应该把传进来的$x$和$y$都改成$0$,表示我们发现这两个边应该要删掉。然后就撤。 $pos$不为空呢?还记得$treap$的$tree$性质吗?由于按值分裂,我们就考虑传入的$val$和当前节点的$val$的关系。 如果当前节点的$val\le$传入的$val$,那根据$tree$性质,比当前节点$val$大的肯定是右儿子,我们就以右儿子作为$pos$,并且别忘了我们还要分裂,当前节点和右儿子必须分开,也就是它们连的边要删掉。 分裂完以后,可能会出现新的树,所以我们要及时把$x$,$y$的引用改成对应的$pos$,表示节点儿子的更新。(指指点点)(C++的引用太折磨人啦) 既然删了边,那也要考虑连上边,但是好消息是这里不需要了,我们传的$x$和$y$都是引用,既然传的是当前节点的左右儿子指针,那么指针也会被自动修改成分裂后正确的儿子。 如果是$<$,那么我们显然要找左子树,而且也要删掉当前节点和左子树的边。 最后,我们再更新下节点的$size$值,使其符合修改后的实际。也是从前几天的线段树copy一下$pushup()$就行了(但是要把根节点自己算进去,所以最后还要加1)。 最后,你应该写出如下函数: **不管是分裂&&合并、还是左旋&&右旋、还是旋转,都建议手模到懂了代码到底在干什么为止** ```cpp void split(int pos,int val,int &x,int &y) { if(!pos) { x=y=0; return; } if(tree[pos].val<=val) { x=pos; split(tree[x].r,val,tree[x].r,y); pushup(x); } else { y=pos; split(tree[y].l,val,x,tree[y].l); pushup(y); } } ``` 这里给一组样例,忽略了$size$的变化,你可以手模一下: ```plain text 6 5 //边的方向:u→v 7 5 8 3 6 13//每个点的大小 1 2 1 3 2 4 2 5 3 6 ``` 然后我们再来看看合并。先给出合并的函数原型: ```cpp int merge(int x,int y); ``` 这里的两个参数就是要合并的两棵树的根节点,然后返回值就是新树的根节点。还是很简单的。接下来就开始实现 首先判一下,如果有任意一棵子树为空,那我们就直接返回另一个,你问怎么写?`x=0`能不能推出`x+y=y`?对的,我们直接返回`x+y`。 如果两棵子树都不为空,那肯定就要准备合并了,我们在这里规定一个前提,**两棵子树都必须是$val$有序的,且有一棵子树的$val$必须全部小于另一棵树的$val$**。这样,我们就只关心哪棵树的根作为新树的根,两棵树内部就不用调整边了。这可是不能乱搞的,合并是分裂的逆操作,我们做完一次分裂以后,再做一次合并要能复原。所以分裂断掉的边,合并还要补上。 我们这时就要想起$treap$的$heap$性质,如果我们随意确定根节点的话,很可能会让树链化。所以这时,我们使用$randval$来判断。$randval$小的放在上面,以维护小根堆的形态。 同样的,合并也是递归的过程,由于只要把$randval$小的放上面,我们的递归就很简单了。 你可以写出如下代码: ```cpp int merge(int x,int y) { if(!x||!y)return x+y; else { if(tree[x].key<tree[y].key) { tree[x].r=y; pushup(x); return x; } else { tree[y].l=x; pushup(y); return y; } } } ``` 砹氩,我们花了这么长的篇幅讲这两种基本操作,接下来该讲讲怎么用它们两个实现那几个具体功能了吧? 首先是添加/删除数。我们平衡树把相同的数作为不同的节点,因为开出来的$randval$很可能不相同。所以增删数就相当于加减节点。那我们来思考,怎么样分裂合并会让节点数发生改变呢? 首先是增加数,我们首先将原树按要加的这个数分裂,这样,分裂完的左子树应该全部小于等于要加的数,右子树就应该全部大于,为了维护堆的性质,如果把新节点和右子树先合并,那左右子树值域就可能有交叉,那不行。所以,我们先将新节点作为一棵树和左子树合并,然后新左子树再和右子树合并。 简单说就是“**分裂一次,合并两次**” 删掉一个数,就先按要删的数将原数分开,左子树肯定是小于等于这个数的,所以我们再对左子树进行(传入数-1)的分裂,第二次右子树的根节点就存在第三个变量里备用。这样第三个变量为根的子树,就是我们要删的数的全部节点了!(为什么是传入数-1?应该不会有~~毒瘤题目~~绝世好题在数据结构出浮点数吧?那把多和少的剥掉了,不就剩等于的了?) 然后有一个很搞笑的操作(真的很搞笑):把第三个变量这棵子树的左右儿子合并,也就是说,原来的根节点就变成了光杆司令,左右儿子抱团了嘛。那么我们就相当于删了根节点,所以我们就成功删了一个点。也就删了这个数。 最后再进行一次合并,也是一样的,优先合并小的和等于的,再合并大的。完工! 同样的,这个是“**分裂两次,合并三次**” 那我们再思考一下怎么进行另一对互逆操作,**根据排名查数**和**根据数查排名**。 根据数查排名倒是相当好想,我们根据(传入数-1)将树分裂,那么左子树肯定都小于等于(传入数-1),也就严格小于传入数,我们就统计出了小于传入数的数的个数,怎么统计?就是左子树的大小嘛!再+1就是排名了。完事别忘了把树装回去。 根据排名查数则略嫌麻烦,有逆操作的经验,我们也考虑用左子树的大小做文章,如果传入排名刚好等于当前节点的左子树大小+1,那我们就直接返回这个节点是哪个数就可以了,不然的话,我们就做递归。 如果传入排名小于等于左子树的大小(严格小于左子树大小+1),我们就查左子树的传入排名。如果比左子树大小+1还大,那我们就只能往右区间找了,记得减掉左子树占的名额(大小+1)。 ### 习题3.1.1 [P3369 【模板】普通平衡树](https://www.luogu.com.cn/problem/P3369) 有没有发现我上面讲的内容就是这道题?快动手吧! AC Code: ```cpp #include<bits/stdc++.h> using namespace std; const int maxn=1e7; #define int long long struct node { int l; int r; int val; int sval; int size; }; node tree[maxn]; int root=0; int idx=0; void newnode(int &x,int v) { x=++idx; tree[idx].val=v; tree[idx].sval=rand(); tree[idx].size=1; } void pushup(int pos) { tree[pos].size=tree[tree[pos].l].size+tree[tree[pos].r].size+1; } void split(int pos,int val,int &x,int &y)//按值分裂,取决于树的路径长,O(log n) { if(!pos) { x=y=0; return; } if(tree[pos].val<=val) { x=pos; split(tree[x].r,val,tree[x].r,y); pushup(x); } else { y=pos; split(tree[y].l,val,x,tree[y].l); pushup(y); } } int merge(int x,int y)//只需要考虑两棵树根节点的大小,因为它们内部都是有序的。返回值为新树的根节点,O(log n) { if(!x||!y)return x+y; if(tree[x].sval<tree[y].sval) { tree[x].r=merge(tree[x].r,y); pushup(x); return x; } else { tree[y].l=merge(x,tree[y].l); pushup(y); return y; } } void ins(int v) { int x,y,z; split(root,v,x,y); newnode(z,v); root=merge(merge(x,z),y); } void del(int v) { int x,y,z; split(root,v,x,z); split(x,v-1,x,y); y=merge(tree[y].l,tree[y].r); root=merge(merge(x,y),z); } int kth(int pos,int k) { if(k==tree[tree[pos].l].size+1) { return tree[pos].val; } else if(k<=tree[tree[pos].l].size) { return kth(tree[pos].l,k); } else { return kth(tree[pos].r,k-tree[tree[pos].l].size-1); } } int pre(int val) { int x,y; split(root,val-1,x,y); int ans=kth(x,tree[x].size); root=merge(x,y); return ans; } int suc(int val) { int x,y; split(root,val,x,y); int ans=kth(y,1); root=merge(x,y); return ans; } int getrank(int val) { int x,y; split(root,val-1,x,y); int ans=tree[x].size+1; root=merge(x,y); return ans; } signed main() { int n=0,op=0,s=0; cin>>n; for(int i=1;i<=n;i++) { cin>>op>>s; if(op==1) { ins(s); } if(op==2) { del(s); } if(op==3) { cout<<getrank(s); if(i<n)cout<<endl; } if(op==4) { cout<<kth(root,s); if(i<n)cout<<endl; } if(op==5) { cout<<pre(s); if(i<n)cout<<endl; } if(op==6) { cout<<suc(s); if(i<n)cout<<endl; } } return 0; } ``` 按道理讲,平衡树有~~入坟~~入门五题,但是我太菜了,先只做这一道吧。 # 4.树形结构的应用 有些数据结构,名字根本不带“树”,但事实上也是利用了树形结构的思想,我们对目标要求范围内的这种数据结构进行简单的讲解。 ## 4.1 并查集 > 这个东西,我自己看了一年也没看明白,但是这是雅苯教练给我讲的第一个知识点,在此鸣谢! 设想有$n$个元素(理论上是任意的数据结构),我们只有两种操作: - 把任两个元素扔进一个大的“集合”里 - 查询两个元素是否在一个“集合”内 一个暴力的想法是直接开个$set$数组。每个元素的初始值为自己的下标。对于“扔进一个大‘集合’”这个操作,我们可以把两个元素对应下标的值**改成一个一样的数**,“查询”就直接查询两个元素的$set$值是否相等就可以了。这两个实现的复杂度都肯定是$O(1)$的…… 一定是$O(1)$吗?设想下面一组数据: ``` 5 4 ;五个元素,四个操作 1 1 3 ;合并1 3,下列"1"指令同理 1 2 5 1 3 5 2 1 2 ;查询1 2是否在一个集合内。 ``` 首先看看上文加粗的字,“一样的数”怎么定义?这是个好问题。我们姑且先定义“一样的数”为指令的第一个操作数。 好,看看合并指令执行完后,$set$是个什么情况: ``` 1 2 1 4 2 ``` 执行最后一条指令,当然“**FALSE啦**”! 真FALSE?你手模一遍: 最后的情况本来是: ```plain text set 1: 1 2 3 5 set 2: 4 ``` 明明就是TRUE嘛! 那怎么办?肯定是“一样的数”定义错了!可惜,你除了改成“第二个操作数”,还能改成什么?事实上,你在线性序列里,根本无法保证查询操作的正确,就算能做到,也不是$O(1)$的,搞不好并没有多项式解法( 那我们怎么做呢?作为$AK\space IOI$的种子选手,这种操作都实现不了?$doge

一种想法是把集合不再局限在“线性序列”的刻板印象里,而是一棵树,那就好判断了,如果两个点所在的“集合树”的根节点相同,那肯定就在一个集合里,反之亦然。

怎么找根节点?不要讲了吧?既然每个节点的父亲一开始都定义成自己的编号了,如果编号依然等于自己,那就说明这个点掌握了自己的人生(雾),肯定是根节点啊!

一个口胡证明:两棵有根树不可能有公共点,比如考虑以下以邻接表给出的树,无向边会成链,所以是有向边:

5 4
1 2
1 3
4 3
4 5

显然若把14当作两个根节点,那这两棵树就可以有一个公共点3,那这样,谁来做代表集合的树根呢(

这样我们就有了集合确定的唯一性,而且因为借助树的结构,我们要判根很容易,极限情况下是O(\log_2 n)(树的最大高度),但是还有更优解,接下来介绍两个并查集的常见优化:

  1. 路径压缩

每往上跳一层,我们就把当前节点的父亲改成当前节点的父节点的父亲,如此循环,最后原本在一条链上的节点都和根节点直接相连,下次查找路径就短了。

  1. 按秩合并/启发式合并

因为你显然不能保证两棵待合并的“集合树”都已经路径压缩至最优,所以它们的高度肯定是\ge 2的。那为了压查找的时间,我们就可以按树的高度进行抉择,把高度小的树根节点的父节点设为高度大的树的根节点。这种方法就叫按秩合并,要这么做,需要开个rank数组维护每个点所在高度,而且集合合并会变得较为复杂(

因此,我们在赛场上常使用另一种可能不那么稳定,但是好写的多的优化:启发式合并。

讲的很高深,事实上,直观也可以感受到,树的高度越高,节点就应该越多,所以我们可以按两棵树的大小决策,把节点少的树加进节点多的树。这么做一下,可以让单次合并复杂度直接降到O(\alpha(n))。这个数学证明是真的很复杂,所以就不放了QAQ

为什么说不稳定呢?因为如果其中有一棵树路径压缩很彻底,而另一棵就压缩的很少,显然这时可能会将压缩少的树放去压缩多的树,从而跑更长的路。但是问题不大的

有时因为集合的边维护了某种信息,这时不能简单的路径压缩,我们就只使用按秩合并或启发式合并。

但是呢,一旦合并到一个集合里,就很难在多项式时间里把两个点分开。只是提一嘴,没考过(

关于这个“树”怎么存呢?事实上,只要开个对应的fa数组,维护每个点对应的父亲就可以了。初始化也和暴力一样,初始化为每个元素的对应下标。再开个sz数组维护大小,每个元素的sz初始为1,结束!

习题4.1.1

P3367 【模板】并查集

这就是模板题了。动手吧!

为什么这么多人不喜欢写merge() (

AC Code:

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e4+5;

int fa[maxn];
int size[maxn];

void set_make(int len)
{
  for(int i=1;i<=len;i++)
  {
    fa[i]=i;
    size[i]=1;
  }
}

int find(int val)
{
  if(fa[val]==val)return val;
  return fa[val]=find(fa[val]);
}

void merge(int x,int y)
{
  x=find(x);
  y=find(y);
  if(size[x]>size[y])swap(x,y);
  fa[x]=y;
  size[x]+=size[y];
}

int main()
{
  int n=0,m=0,z=0,x=0,y=0;
  cin>>n>>m;
  set_make(n);
  for(int i=1;i<=m;i++)
  {
    cin>>z;
    if(z==1)
    {
      cin>>x>>y;
      //cout<<"Union set "<<x<<" with set "<<y<<endl;
      merge(x,y);
    }
    if(z==2)
    {
      cin>>x>>y;
      //cout<<x<<" is in set "<<find(x)<<endl;
      //cout<<y<<" is in set "<<find(y)<<endl;
      cout<<(find(x)==find(y)?"Y":"N");
      if(i<m)cout<<endl;
    }
  }
  return 0;
}

好像判集合写丑了,汗。

习题4.1.2

P1551 亲戚

看了半天回想,这实在找不出不是双倍经验的理由(

完了,这个判同祖先怎么也写得这么丑(

哦,题目原因,没事)

AC Code:

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e4+5;

int fa[maxn];
int size[maxn];

void set_make(int len)
{
  for(int i=1;i<=len;i++)
  {
    fa[i]=i;
    size[i]=1;
  }
}

int find(int val)
{
  if(fa[val]==val)return val;
  return fa[val]=find(fa[val]);
}

void merge(int x,int y)
{
  x=find(x);
  y=find(y);
  if(size[x]>size[y])swap(x,y);
  fa[x]=y;
  size[x]+=size[y];
}

int main()
{
  int n=0,m=0,p=0,mx=0,my=0,px=0,py=0;
  cin>>n>>m>>p;
  set_make(n);
  for(int i=1;i<=m;i++)
  {
    cin>>mx>>my;
    merge(mx,my);
  }
  for(int i=1;i<=p;i++)
  {
    cin>>px>>py;
    cout<<((find(px)==find(py))?"Yes":"No");
    if(i<p)cout<<endl;
  }
  return 0;
}

习题4.1.3

P1525 [NOIP2010 提高组] 关押罪犯

说了要把这道题作为并查集的典题的,差点忘了。

这一题代表一种常考题型,叫做“种类并查集”或者“种族并查集”,主要就是解决这种“敌人”问题

我们假想,对于每个元素i都有一个“共轭”兄弟i',它们名义上是一个点,但属性截然相反。比如ij是敌人,那ij'i'j就是好朋友。

我们考虑将关系建模成节点的边,那我们就可以采用简单的贪心策略,将这些边按边权从大到小排序,从最小的开始选,每次选条边,就尝试将边的两个端点各自和对方的“共轭”兄弟合并,如果已经被合并过了,那就说明不能这么安排,此时这条边的边权就是答案。

砹氩这个merge()写的更丑了,有时间要把这些讲解题目的远古代码都重构一遍!!

事实上:咕值++

怎么在程序中表示i'j'呢?我们可以直接开两倍的fasz,然后,对于每个节点k,直接令k+nk',好写好记。

而且,既然使用了“边”的概念,那么这道题就可以用些图论的算法过,比如标签里的“tarjan”和“二分图”,这些与本讲无关,所以略去,作为思考。

AC Code:

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e5+7;

int n=0,m=0;
int fa[maxn];
int size[maxn];

struct relation
{
  int a,b,c;

  friend bool operator <(const relation &a,const relation &b)
  {
    if(a.c<b.c)return true;
    else return false;
  }

};

relation arr[maxn];

void set_make(int len)
{
  for(int i=1;i<=len;i++)
  {
    fa[i]=i;
    size[i]=1;
  }
}

int find(int val)
{
  if(fa[val]==val)return val;
  return fa[val]=find(fa[val]);
}

bool merge(int x,int y)
{
  int x1=find(x);
  int y1=find(y);
  int x2=find(x+n);
  int y2=find(y+n);
  if(x1==y1)return false;
  fa[x1]=y2;
  fa[y1]=x2;
  return true;
}

int main()
{
  cin>>n>>m;
  set_make(2*n);
  for(int i=1;i<=m;i++)
  {
    cin>>arr[i].a>>arr[i].b>>arr[i].c;
  }
  sort(arr,arr+m+1);
  /*for(int i=1;i<=m;i++)
  {
    cout<<arr[i].c<<' ';
  }
  cout<<endl;*/
  for(int i=m;i>=1;i--)
  {
    //cout<<arr[i].a<<' '<<arr[i].b<<endl;
    if(merge(arr[i].a,arr[i].b)==false)
    {
      cout<<arr[i].c;
      return 0;
    }
  }
  cout<<0;
  return 0;
}

习题4.1.4

P1892 [BOI2003]团伙

这题也是种类并查集的碘

对于这题,如果ij是敌人,我们就把ij'ji'两对好朋友节点合并,如果ij本来就是朋友,那就直接合并。

最后统计有多少个集团,也就是集合的个数,输出就可以了。

总算有个优美的merge()

AC Code:

#include<bits/stdc++.h>
using namespace std;
const int maxn=1e3+5;
const int maxm=5e3+7;

int fa[maxn*2];
int sz[maxn*2];

void set_make(int n)
{
    for(int i=1;i<=n;i++)
    {
        fa[i]=i;
        sz[i]=1;
    }
}

int find(int x)
{
    if(fa[x]==x)return fa[x];
    else return fa[x]=find(fa[x]);
}

bool merge(int x,int y)
{
    x=find(x);
    y=find(y);
    if(x==y)return false;
    else
    {
        fa[x]=y;
        return true;
    }
}

int main()
{
    int n=0,m=0,u=0,v=0;
    int res=0;
    char order;
    cin>>n>>m;
    set_make(n*2);
    for(int i=1;i<=m;i++)
    {
        cin>>order;
        cin>>u>>v;
        if(order=='E')
        {
            merge(u+n,v);
            merge(v+n,u);
        }
        if(order=='F')
        {
            merge(u,v);
        }
    }
    for(int i=1;i<=n;i++)
    {
        if(fa[i]==i)res++;
    }
    cout<<res;
    return 0;
}

2024/8/24 23:32:00 初稿!完结撒花!!!