1. 程式人生 > >樹鏈剖分的學習記錄

樹鏈剖分的學習記錄

先來回顧兩個問題: 1,將樹從x到y結點最短路徑上所有節點的值都加上z

這也是個模板題了吧

我們很容易想到,樹上差分可以以O(n+m)的優秀複雜度解決這個問題

2,求樹從x到y結點最短路徑上所有節點的值之和

lca大水題,我們又很容易地想到,dfs O(n)預處理每個節點的dis(即到根節點的最短路徑長度)

然後對於每個詢問,求出x,y兩點的lca,利用lca的性質distance ( x , y ) = dis ( x ) + dis ( y ) - 2 * dis ( lca )求出結果

時間複雜度O(mlogn+n)

現在來思考一個bug: 如果剛才的兩個問題結合起來,成為一道題的兩種操作呢?

剛才的方法顯然就不夠優秀了(每次詢問之前要跑dfs更新dis)

樹鏈剖分華麗登場 樹剖是通過輕重邊剖分將樹分割成多條鏈,然後利用資料結構來維護這些鏈(本質上是一種優化暴力)

首先明確概念:

重兒子:父親節點的所有兒子中子樹結點數目最多(size最大)的結點;

輕兒子:父親節點中除了重兒子以外的兒子;

重邊:父親結點和重兒子連成的邊;

輕邊:父親節點和輕兒子連成的邊;

重鏈:由多條重邊連線而成的路徑;

輕鏈:由多條輕邊連線而成的路徑;

比如上面這幅圖中,用黑線連線的結點都是重結點,其餘均是輕結點,

2-11就是重鏈,2-5就是輕鏈,用紅點標記的就是該結點所在重鏈的起點,也就是下文提到的top結點,

還有每條邊的值其實是進行dfs時的執行序號。

變數宣告:

const int maxn=1e5+10;
struct edge{
    int next,to;
}e[2*maxn];
struct Node{
    int sum,lazy,l,r,ls,rs;
}node[2*maxn];
int rt,n,m,r,a[maxn],cnt,head[maxn],f[maxn],d[maxn],size[maxn],son[maxn],rk[maxn],top[maxn],id[maxn];
名稱 解釋
f[u] 儲存結點u的父親節點
d[u] 儲存結點u的深度值
size[u] 儲存以u為根的子樹節點個數
son[u] 儲存重兒子
rk[u] 儲存當前dfs標號在樹中所對應的節點
top[u] 儲存當前節點所在鏈的頂端節點
id[u] 儲存樹中每個節點剖分以後的新編號(DFS的執行順序)

我們要做的就是(樹鏈剖分的實現):

1,對於一個點我們首先求出它所在的子樹大小,找到它的重兒子(即處理出size,son陣列), 解釋:比如說點1,它有三個兒子2,3,4

2所在子樹的大小是5

3所在子樹的大小是2

4所在子樹的大小是6

那麼1的重兒子是4

ps:如果一個點的多個兒子所在子樹大小相等且最大

那隨便找一個當做它的重兒子就好了

葉節點沒有重兒子,非葉節點有且只有一個重兒子

2,在dfs過程中順便記錄其父親以及深度(即處理出f,d陣列),操作1,2可以通過一遍dfs完成

void dfs1(int u,int fa,int depth)    //當前節點、父節點、層次深度
{
    f[u]=fa;
    d[u]=depth;
    size[u]=1;    //這個點本身size=1
    for(int i=head[u];i;i=e[i].next)
    {
        int v=e[i].to;
        if(v==fa)
            continue;
        dfs1(v,u,depth+1);    //層次深度+1
        size[u]+=size[v];    //子節點的size已被處理,用它來更新父節點的size
        if(size[v]>size[son[u]])
            son[u]=v;    //選取size最大的作為重兒子
    }
}
//進入
dfs1(root,0,1);

dfs跑完大概是這樣的,大家可以手動模擬一下

3,第二遍dfs,然後連線重鏈,同時標記每一個節點的dfs序,並且為了用資料結構來維護重鏈,我們在dfs時保證一條重鏈上各個節點dfs序連續(即處理出陣列top,id,rk)

void dfs2(int u,int t)    //當前節點、重鏈頂端
{
    top[u]=t;
    id[u]=++cnt;    //標記dfs序
    rk[cnt]=u;    //序號cnt對應節點u
    if(!son[u])
        return;
    dfs2(son[u],t);
/*我們選擇優先進入重兒子來保證一條重鏈上各個節點dfs序連續,
一個點和它的重兒子處於同一條重鏈,所以重兒子所在重鏈的頂端還是t*/
    for(int i=head[u];i;i=e[i].next)
    {
        int v=e[i].to;
        if(v!=son[u]&&v!=f[u])
            dfs2(v,v);    //一個點位於輕鏈底端,那麼它的top必然是它本身
    }
}

dfs跑完大概是這樣的,大家可以手動模擬一下

4,兩遍dfs就是樹鏈剖分的主要處理,通過dfs我們已經保證一條重鏈上各個節點dfs序連續,那麼可以想到,我們可以通過資料結構(以線段樹為例)來維護一條重鏈的資訊 回顧上文的那個題目,修改和查詢操作原理是類似的,以查詢操作為例,其實就是個LCA,不過這裡使用了top來進行加速,因為top可以直接跳轉到該重鏈的起始結點,輕鏈沒有起始結點之說,他們的top就是自己。需要注意的是,每次迴圈只能跳一次,並且讓結點深的那個來跳到top的位置,避免兩個一起跳從而插肩而過。

int sum(int x,int y)
{
    int ans=0,fx=top[x],fy=top[y];
    while(fx!=fy)    //兩點不在同一條重鏈
    {
        if(d[fx]>=d[fy])
        {
            ans+=query(id[fx],id[x],rt);    //線段樹區間求和,處理這條重鏈的貢獻
            x=f[fx],fx=top[x];    //將x設定成原鏈頭的父親結點,走輕邊,繼續迴圈
        }
        else
        {
            ans+=query(id[fy],id[y],rt);
            y=f[fy],fy=top[y];
        }
    }
    //迴圈結束,兩點位於同一重鏈上,但兩點不一定為同一點,所以我們還要統計這兩點之間的貢獻
    if(id[x]<=id[y])
        ans+=query(id[x],id[y],rt);
    else
        ans+=query(id[y],id[x],rt);
    return ans;
}

大家如果明白了樹鏈剖分,也應該有舉一反三的能力(反正我沒有),修改和LCA就留給大家自己完成了

5,樹鏈剖分的時間複雜度 樹鏈剖分的兩個性質:

1,如果(u, v)是一條輕邊,那麼size(v) < size(u)/2;

2,從根結點到任意結點的路所經過的輕重鏈的個數必定都小於logn;

可以證明,樹鏈剖分的時間複雜度為O(nlog^2n)

模板題

#include<iostream>
#include<cstdio>
using namespace std;
const int maxn=1e5+10;
struct edge{
    int next,to;
}e[2*maxn];
struct Node{
    int sum,lazy,l,r,ls,rs;
}node[2*maxn];
int rt,n,m,r,a[maxn],cnt,head[maxn],f[maxn],d[maxn],size[maxn],son[maxn],rk[maxn],top[maxn],tid[maxn];
void add_edge(int x,int y)
{
    e[++cnt].next=head[x];
    e[cnt].to=y;
    head[x]=cnt;
}
void dfs1(int u,int fa,int depth)
{
    f[u]=fa;
    d[u]=depth;
    size[u]=1;
    for(int i=head[u];i;i=e[i].next)
    {
        int v=e[i].to;
        if(v==fa)
            continue;
        dfs1(v,u,depth+1);
        size[u]+=size[v];
        if(size[v]>size[son[u]])
            son[u]=v;
    }
}
void dfs2(int u,int t)
{
    top[u]=t;
    tid[u]=++cnt;
    rk[cnt]=u;
    if(!son[u])
        return;
    dfs2(son[u],t);
    for(int i=head[u];i;i=e[i].next)
    {
        int v=e[i].to;
        if(v!=son[u]&&v!=f[u])
            dfs2(v,v);
    }
}
void pushup(int x)
{
    node[x].sum=(node[node[x].ls].sum+node[node[x].rs].sum+node[x].lazy*(node[x].r-node[x].l+1));
}
void build(int li,int ri,int cur)
{
    if(li==ri)
    {
        node[cur].ls=node[cur].rs=-1;
        node[cur].l=node[cur].r=li;
        node[cur].sum=a[rk[li]];
        return;
    }
    int mid=(li+ri)>>1;
    node[cur].ls=cnt++;
    node[cur].rs=cnt++;
    build(li,mid,node[cur].ls);
    build(mid+1,ri,node[cur].rs);
    node[cur].l=node[node[cur].ls].l;
    node[cur].r=node[node[cur].rs].r;
    pushup(cur);
}
void update(int li,int ri,int c,int cur)
{
    if(li<=node[cur].l&&node[cur].r<=ri)
    {
        node[cur].sum+=c*(node[cur].r-node[cur].l+1);
        node[cur].lazy+=c;
        return;
    }
    int mid=(node[cur].l+node[cur].r)>>1;
    if(li<=mid)
        update(li,ri,c,node[cur].ls);
    if(mid<ri)
        update(li,ri,c,node[cur].rs);
    pushup(cur);
}
int query(int li,int ri,int cur)
{
    if(li<=node[cur].l&&node[cur].r<=ri)
        return node[cur].sum;
    int tot=node[cur].lazy*(min(node[cur].r,ri)-max(node[cur].l,li)+1);
    int mid=(node[cur].l+node[cur].r)>>1;
    if(li<=mid)
        tot+=query(li,ri,node[cur].ls);
    if(mid<ri)
        tot+=query(li,ri,node[cur].rs);
    return tot;
}
int sum(int x,int y)
{
    int ans=0,fx=top[x],fy=top[y];
    while(fx!=fy)
    {
        if(d[fx]>=d[fy])
        {
            ans+=query(tid[fx],tid[x],rt);
            x=f[fx];
        }
        else
        {
            ans+=query(tid[fy],tid[y],rt);
            y=f[fy];
        }
        fx=top[x];
        fy=top[y];
    }
    if(tid[x]<=tid[y])
        ans+=query(tid[x],tid[y],rt);
    else
        ans+=query(tid[y],tid[x],rt);
    return ans;
}
void updates(int x,int y,int c)
{
    int fx=top[x],fy=top[y];
    while(fx!=fy)
    {
        if(d[fx]>=d[fy])
        {
            update(tid[fx],tid[x],c,rt);
            x=f[fx];
        }
        else
        {
            update(tid[fy],tid[y],c,rt);
            y=f[fy];
        }
        fx=top[x];
        fy=top[y];
    }
    if(tid[x]<=tid[y])
        update(tid[x],tid[y],c,rt);
    else
        update(tid[y],tid[x],c,rt);
}
int main()
{
    cin>>n>>m>>r;
    for(int i=1;i<=n;i++)
        cin>>a[i];
    for(int i=1;i<n;i++)
    {
        int x,y;
        cin>>x>>y;
        add_edge(x,y);
        add_edge(y,x);
    }
    cnt=0;
    dfs1(r,0,1);
    dfs2(r,r);
    cnt=0;
    rt=cnt++;
    build(1,n,rt);
    for(int i=1;i<=m;i++)
    {
        int op,x,y,z;
        cin>>op;
        if(op==1)
        {
            cin>>x>>y>>z;
            updates(x,y,z);
        }
        else if(op==2)
        {
            cin>>x>>y;
            cout<<sum(x,y)<<endl;
        }
        else if(op==3)
        {
            cin>>x>>z;
                        //子樹也有連續區間的性質
            update(tid[x],tid[x]+size[x]-1,z,rt);
        }
        else if(op==4)
        {
            cin>>x;
            cout<<query(tid[x],tid[x]+size[x]-1,rt)<<endl;
        }
    }
    return 0;
}