1. 程式人生 > 實用技巧 >[NOI2015]荷馬史詩 - Huffman樹

[NOI2015]荷馬史詩 - Huffman樹

題目描述

追逐影子的人,自己就是影子。 ——荷馬

llison 最近迷上了文學。她喜歡在一個慵懶的午後,細細地品上一杯卡布奇諾,靜靜地閱讀她愛不釋手的《荷馬史詩》。但是由《奧德賽》和《伊利亞特》組成的鴻篇鉅製《荷馬史詩》實在是太長了,Allison 想通過一種編碼方式使得它變得短一些。

一部《荷馬史詩》中有 n 種不同的單詞,從 1 到 n 進行編號。其中第 i 種單詞出現的總次數為 wi。Allison 想要用 k 進位制串 si 來替換第 i 種單詞,使得其滿足如下要求:

對於任意的 1≤i,j≤n,i≠j,都有:si 不是 sj 的字首

現在 Allison 想要知道,如何選擇 si,才能使替換以後得到的新的《荷馬史詩》長度最小。在確保總長度最小的情況下,Allison 還想知道最長的 si 的最短長度是多少?

一個字串被稱為 k 進位制字串,當且僅當它的每個字元是 0 到 k−1 之間(包括 0 和 k−1)的整數。

字串 Str1 被稱為字串 Str2 的字首,當且僅當:存在 1≤t≤m,使得 Str1=Str2[1..t]。其中,m 是字串 Str2 的長度,Str2[1..t] 表示 Str2 的前 t 個字元組成的字串。

輸入描述:

第 1 行包含 2 個正整數 n,k,中間用單個空格隔開,表示共有 n 種單詞,需要使用 k 進位制字串進行替換。
接下來 n 行,第 i+1 行包含 1 個非負整數 wi,表示第 i 種單詞的出現次數。

輸出描述:

包括 2 行。
第 1 行輸出 1 個整數,為《荷馬史詩》經過重新編碼以後的最短長度。
第 2 行輸出 1 個整數,為保證最短總長度的情況下,最長字串 si 的最短長度。

示例1

輸入

4 2
1
1
2
2

輸出

12
2

說明

用 X(k) 表示 X 是以 k 進製表示的字串。
一種最優方案:令 00(2) 替換第 1 種單詞,01(2) 替換第 2 種單詞,10(2) 替換第 3 種單詞,11(2) 替換第 4 種單詞。在這種方案下,編碼以後的最短長度為:
1×2+1×2+2×2+2×2=12
最長字串 si 的長度為 2。

一種非最優方案:令 000(2) 替換第 1 種單詞,001(2) 替換第 2 種單詞,01(2) 替換第 3 種單詞,1(2) 替換第 4 種單詞。在這種方案下,編碼以後的最短長度為:
1×3+1×3+2×2+2×1=12
最長字串 si 的長度為 3。與最優方案相比,文章的長度相同,但是最長字串的長度更長一些。

#include<iostream>
#include<cstdio>
#include<queue>
using namespace std;
const int N=1002019;
#define int long long
int n,k,ans,mxd,tot,val[N],v[N];
struct Edge{int to,next;}e[N<<1];
void add(int x,int y){
    e[++tot].to=y; e[tot].next=v[x]; v[x]=tot;
}
struct node{
    int id,w,dep;
    // id :編號, w :權值, dep :子樹深度 . 
    node(int a,int b,int c){id=a;w=b;dep=c;};
    bool operator >(const node &rhs)const{
    	return rhs.w==w?rhs.dep<dep:rhs.w<w;
    }
};
priority_queue<node,vector<node>,greater<node> > q;
void dfs(int x,int d){ // 統計答案 
    if(x<=n)ans+=val[x]*d,mxd=max(mxd,d);
    for(int p=v[x];p;p=e[p].next)dfs(e[p].to,d+1);
}
int read(){
    int x=0,f=1; char ch=getchar();
    while(ch<'0' || ch>'9'){if(ch=='-')f=-1;ch=getchar();}
    while(ch>='0' && ch<='9'){x=x*10+ch-'0';ch=getchar();}
    return x*f;
}
#undef int
int main()
{
    #define int long long
    n=read(); k=read();
    for(int i=1;i<=n;i++)
    	q.push(node(i,val[i]=read(),0));
    while((n-1)%(k-1)!=0)q.push(node(++n,0,0));
    // 插入若干虛擬結點
    int id=n,n1=n;
    while(n1-=k-1,n1>=1){
    	int th=0,mx=0; ++id; // 新建編號為 id 的點 th 
        for(int i=1;i<=k;i++,q.pop()){ // 取出 k 個最優元素
	    node nw=q.top(); th+=nw.w;
	    mx=max(mx,nw.dep); add(id,nw.id);
	} q.push(node(id,th,mx+1)); // 插入該結點 
    } dfs(id,0); // 統計答案 
    printf("%lld\n%lld",ans,mxd);
    return 0;
}