可并堆之左偏树

HolseLee · 2018-09-29 19:35:20 · 算法·理论

可并堆(Mergeable\ Heap)是一类抽象数据类型，它除了支持一般的优先队列的基本操作以外，还支持额外的合并操作。而可并堆有多种，包括斜堆，左偏树，二项堆，配对堆，斐波那契堆等。
这里我们只介绍左偏树(Leftist\ Tree)，它是最常用的一种可并堆。至于为什么说最常用，我们会在后面讲到。（~~先挖个坑~~）

讲的可能不太好还请包涵，如果有错也希望能及时指出，也欢迎大家在评论区讨论。

本文同步发表在博主的另一个博客上。

感谢Planet6174提供的图片。

定义

左偏树是 一种具有左偏性质的堆有序二叉树 （这里要注意，堆有序二叉树和二叉堆并不是同一种东西，因此左偏树并不是二叉堆）。每一个节点存储的信息包括左右子节点、关键值以及距离（当然也有很多时候我们需要维护父节点）。

节点的距离可以这样定义：
某个节点被称为 外节点，仅当这个节点的左子树或右子树为空。某一个节点的距离即该节点到与其最近的外节点经过的边数。易得，外节点的距离为0，空节点距离为-1。特别的，我们把根结点的距离称为这棵左偏树的距离。

下图为一棵左偏树：

基本性质及引理

警告，下方一大波文字来袭!!! 对于定理和文字恐惧的人可以先跳过，不过你一定会回来的。（~~23333~~）

首先说明，下文中的val表示节点的键值，dist表示节点的距离。

性质1：堆的性质，即对于任意节点p，val[p]\geq(或\leq) val[lson],val[rson]。
性质2：
左偏树，顾名思义，就是向左偏的树,就是这个性质在图像可视化后的诠释。这个性质的存在主要是为了保证左偏树的复杂度,因为左偏，因此我们把操作全部向右进行，这样就可以极大地降低操作复杂度。
性质3：
很好理解，由性质二以及外节点的距离为$0$可以得出。
引理1：如果一棵左偏树的距离为k，则这颗左偏树节点数最少为2^{k+1}-1。
证明：因为左偏树的左子树距离一定大于等于右子树的距离，并且左偏树的距离等于右子树距离加一，那么一颗左偏树的距离一定且要求节点数最少时，节点数最少时任意节点的左子树大小等于右子树大小，满足这样性质的二叉树就是完全二叉树。
定理1：对于一个有n个节点的左偏树，最大距离不超过\log(n+1)-1，即max\{dist\}\leq \log(n+1)-1。
证明：设max\{dist\}=k，那么显然节点数最少的左偏树是一棵完全二叉树，此时节点数为2^{k+1}-1，故n\geq 2^{k+1}-1，移项得：k\leq \log(n+1)-1。

基本操作

1，合并Merge
合并操作是可并堆最重要的操作，以小根堆为例,合并x与y。

令x为x,y中权值较小的一个，然后继续向下合并，在x的右子树最右链中找到第一个比y大的位置,将y作为其父亲,然后继续不断递归调用合并y的右子树和以该节点为根的右子树即可,同时注意维护相关信息。更新以后可能会发现，右子树dist比左子树大,只要交换两个子树即可。

下图为合并过程：

int Merge(int x,int y)
{
    if(!x||!y)return x+y;
    if(t[x].val>t[y].val||(t[x].val==t[y].val&&x>y))
    swap(x,y);
    int &ul=t[x].ls,&ur=t[x].rs;
    ur=Merge(ur,y);
    t[ur].fa=x;
    if(t[ul].dist<t[ur].dist)swap(ul,ur);
    t[x].dist=t[ur].dist+1;
    return x;
}

2，删除根节点Erase
将根节点的权值赋为-1,然后合并左右子树，维护相关信息即可。

inline void Erase(int x)
{
    int ul=t[x].ls,ur=t[x].rs;
    t[x].val=-1;t[ul].fa=0;t[ur].fa=0;
    t[x].fa=merge(ul,ur);
}

3，删除任意节点Delete
这里先解释一下，一般来说可并堆是不支持删除某一给定权值的点的，因此我们这里说的任意节点是指知道编号的任意节点。

首先和根节点一样，先把删除节点的权值赋为-1，然后合并其左右子树得到新的左偏树，我们再把得到的这个左偏树接到删除节点的父节点上，同时维护父节点的子节点信息。

但是，删除掉节点后我们可能会发现不满足左偏性质了，那么我们就需要判断是否需要交换左右子树，并且要一直向上重复判断，直到到了某一结点时左偏性质没有被破坏了或者已经到了根节点。

int Delete(int x)
{
    int fx=t[x].fa;
    int ka=merge(t[x].ls,t[x].rs);
    t[ka].fa=fx;
    int &ul=t[fx].ls, &ur=t[fx].rs;
    ul==x ? ul=ka : ur=ka;
    while( fx ) {
        if( t[ul].dist < t[ur].dist )
            swap( ul,ur );
        if( t[fx].dist==t[ur].dist+1 )
            return root;
        t[fx].dist=t[ur].dist+1;
        ka=fx; fx=t[x].fa;
　　　　　ul=t[fx].ls,ur=t[fx].rs;
    }
    return ka;
}

4，建树Build
如果我们直接一个一个的Merge来建树也没有什么问题，但是这样显然效率非常低下（算上Merge，这样建树复杂度是O(n\log n)的）。

我们可以稍微优化一下，把每个节点当作节点数为1的左偏树存入队列中，然后每次取出队首的两个左偏树合并，把合并后的左偏树放入队列，重复操作直到队列中只剩下一个左偏树。

如图：（图中未注明权值）

也就是采用两两合并的方法，这样就只需要合并\log n次，再算上Merge的复杂度，这样建树的复杂度基本上可以看作O(n)（请读者自证，~~还是作者太懒了~~）。

int Build()
{
    queue<int>Q;
    for(int i=1; i<=n; ++i) Q.push(i);
    int x,y,z;
    while( Q.size()>1 ) {
        x=Q.front(); Q.pop();
        y=Q.front(); Q.pop();
        z=Merge(x,y);Q.push(z);
    }
    return Q.front();
}

左偏树的应用

常见的左偏树题型

一般来说左偏树能处理所有的二叉堆的问题和所有的可并堆的问题。
但是通常遇到的较难的左偏树题都不是直接进行对集合的操作，这些集合的关系可能更加复杂。最常见的例子就是树上点的集合关系维护的问题。

例题派遣

题目链接

一句话题意：从树中选出一个节点作为管理者，然后在它的子树中（包括它自己）选出若干节点，要求使花费总和小于m，并且使得收益最大。

【思路】我们可以用左偏树维护点的关系。

除了左右子节点和高度以外，这个左偏树一共还需要维护该节点花费，总花费，总人数三条信息。

从根节点开始dfs，然后从下往上递归转移。当转移到第x个节点时，我们将它与它所有子节点形成的左偏树合并，然后进行判断，将花费大的节点全部弹出直到花费小于等于m为止，然后更新答案即可。当然，这里左偏树要建立大根堆，因为小根堆维护花费和不大于m会非常麻烦。然后注意一些细节就行了。

代码请戳这里

例题棘手的操作

题目链接

一句话题意，给你一棵树然后进行一堆蛇皮怪物一般的操作。

【思路】一堆操作真是令人头大，实际上仔细思考的话这些操作还是不难实现的。

需要维护两个左偏树，第一个维护正常的操作信息，第二个维护所有点中的最大值。具体操作方法可以参考我的另一篇博客。

【总结】如果对左偏树不太熟悉，那么第一道例题中是较难看出左偏树的解法的。一般出题人如果考察左偏树的知识点的话，往往不会直接给你裸的集合关系让你维护。（~~出题人：我怎么能这么容易让你把题给切了呢？~~）

一般这些集合或者集合内的元素一开始就有很多条件限制（上题中是树状结构），因此往往需要我们自己推导这些集合的关系，然后得出左偏树维护的方法。

而第二题这种纯码农题就不用多说了，全靠一双眼睛Debug。

左偏树的可持久化

左偏树的另外一个重要的应用就是可持久化。

为什么左偏树可以可持久化呢？
因为左偏树具有二叉树结构且能动态合并，因此能够可持久化。可以证明合并的复杂度为单次O(\log n)

可持久化左偏树实现起来也非常简单，构建方法类似于可持久化线段树，动态开点就行了。

模板代码：

struct Node {
    int ls,rs,fa,dist,val;  
}t[N*20]//可持久化数据结构套路，空间开大点

int siz;//动态开点用

int Merge(int x,int y,int opt)//opt控制是否新建节点
{
    if(!x||!y)return x+y;
    if(t[x].val>t[y].val||(t[x].val==t[y].val&&x>y))
    swap(x,y);
    if( opt ) t[++siz]=t[x], x=siz;
    int &ul=t[x].ls,&ur=t[x].rs;
    ur=Merge(ur,y);
    t[ur].fa=x;
    if(t[ul].dist<t[ur].dist)swap(ul,ur);
    t[x].dist=t[ur].dist+1;
    return x;
}

其余操作基本不变，按题目要求变化。

为什么你会在比赛中选择左偏树

(~~填上上面的坑~~)
有这么多的可并堆可以选择，为什么偏偏就是左偏树最常见呢？
先看一张表：

这里还要解释一下，斜堆是一种与左偏树非常类似的可并堆。为了降低操作复杂度，左偏树采用的方法是将重量集中在左子树，而斜堆则是采取一种随机的思想，每次合并完都要交换左右子树，这使得左右子树的大小是随机分配的，因此一般来说，斜堆的均摊复杂度为O(\log n)，而左偏树则是最坏复杂度O(\log n)。所以实现的时候，左偏树往往会比斜堆稍快。（当然具体也要看数据咯）

然后二项堆、斐波那契堆虽然复杂度极其优秀，但是编程复杂度极大（尤其是斐波那契堆），考场上选择它们实在是不理智。（~~当然如果你是平板电视julao，这话当我没说~~）

另外关于配对堆，实际上配对堆确实非常优秀，不仅有和斐波那契堆相当的时间复杂度，而且代码实现比较容易，空间需求也大大减小（在不带decrease\_key操作的时候甚至比左偏树小）。不过现在配对堆可能并没有那么普及，而且由于均摊复杂度，使得配对堆无法实现可持久化，而且配对堆的复杂度承受在pop操作上，所以在pop操作频繁的题目中不建议使用。（具体的数据可以参见Wikipedia，这里博主就不放了）

因此左偏树往往是考场上需要使用可并堆时的第一选择。

参考资料：
李煜东：《算法竞赛进阶指南》
黄源河：《左偏树的特点及应用》
以及相关网络资料