哈夫曼樹（資料結構）

阿新 • • 發佈：2019-01-11

設二叉樹具有n個帶權值的葉子節點，從根節點到葉子節點的路徑長度與對應葉子節點權值的乘積之和叫做二叉樹的“帶權路徑長度”。
對於一組帶有權值的葉子節點，帶權路徑長度最小的二叉樹叫做“最優二叉樹”（例如哈夫曼樹，哈夫曼樹是最優二叉樹，最優二叉樹不一定是哈夫曼樹）。
如何建立一顆哈夫曼樹？
建立n個根節點，權值為{w1,w2,,,,wn},帶到森林{T1,T2,,,,Tn};從森林中選取權值最小的兩顆二叉樹，合併為新的二叉樹，新二叉樹根節點的權值為兩權值之和；將新二叉樹加入森林，被歸併的兩顆二叉樹不再看做是二叉樹；重複選取合併操作，直至森林只有一顆二叉樹，得到的二叉樹就是哈夫曼樹。
哈夫曼樹不一定唯一，但最小帶權路徑長度都相同。
只要權值個數（葉節點個數）嚴格大於1，哈夫曼樹中便不存在度為1的節點，權值個數（葉節點個數）為n，則哈夫曼樹的節點個數為（2n-1）。
哈夫曼樹對應的編碼為哈夫曼編碼，是一種最優字首編碼。

7.建立哈夫曼樹的思路：
分析：含n個字元則哈夫曼樹有（2n-1）個節點，動態開闢（2n-1）個節點的記憶體，用順序儲存結構儲存。構造樹時，從葉子節點往上走，識別字符或者解碼時從上往下走，故節點要包含雙親，左右孩子下標和權值。
具體思路：
1）動態開闢所有節點的儲存空間，初始化各葉節點和分支節點（已知各葉節點的權值，其他各項初始化為0，具體原因下面分析。）
2）構造哈夫曼樹關鍵是逐步確定各分支節點的相關資訊：求出最小的二叉樹，據此設定當前各分支節點各成員的值。
3）開闢空指標陣列。開闢臨時存放單個編碼的陣列，從葉出發逆向尋根，每向上一步都將當前編碼符記錄到臨時陣列最後一個空位置，待到達根則臨時陣列中得到臨時編碼，後將該編碼複製到指標陣列的適當位置即可。

構建哈夫曼樹，求哈夫曼編碼程式碼：


typedef struct
{
    unsigned int weight;
    unsigned int parent,lchild,rchild;
} HTNode;
typedef HTNode *HuffmanTree;
typedef char* *HuffmanCode;//用於存放編碼的陣列

int minn(HuffmanTree &HT,int k)
{
    int i = 0;
    int min_weight = 0;
    int min_index= 0;
    //HT[i]->parent != 0說明該節點不能再用來做其他節點的孩子 

    while(HT[i].parent != 0)
    {
        ++i;
    }
    //記下最小的權值及其對應於HT的下標
    min_weight = HT[i].weight;
    min_index = i;
    //選出weight最小的元素後，將其parent置為-1，使得下一次比較選取時將其排除在外
    HT[i].parent = -1;
    return min_weight;
}

Status Select(HuffmanTree &HT,int k,int &min1,int &min2)
{
    min1 = minn(HT,k);//從未用過的前k個數裡選出一個最小的數
    min2 = minn(HT,k);//從未用過的前k個數裡選出一個最小的數(在minn的具體實現裡會控制不再選取第一次選出的數)
    return true;
}


//w為權值陣列，HT為要建立的哈夫曼樹，HC為存放單個編碼的陣列，n為葉子節點個數
Status HuffmanCoding(HuffmanTree &HT,HuffmanCode &HC,int *w,int n)
{
    if(n <= 1)
        return ERROR;
    int m = 2*n-1;//整棵哈夫曼樹的節點個數
    HT = (HTNode*)malloc((m+1)*sizeof(HTNode));//分配空間的時候多分配一個，從第一個開始存，0號不存
    int i = 1;
    //先初始化葉子，只知道權值
    for(i = 1; i <= n; ++i,++w)
    {
        HT[i].weight = *w;
        HT[i].parent = 0;
        HT[i].lchild = 0;
        HT[i].rchild = 0;
    }
    //初始化分支節點，各個資訊賦值為0
    for(i = n+1; i <= m; ++i,++p)
    {
        HT[i].weight = 0;
        HT[i].lchild = 0;
        HT[i].rchild = 0;
        HT[i].parent = 0;
    }

    //哈夫曼樹共有2n-1個節點，前n個節點是葉子節點，已經有資訊了，剩下的節點從第n+1個開始放
    for(i = n+1; i <= m; ++i)
    {
        Select(HT,i-1,min1,min2);

        HT[min1].parent = i;
        HT[min2].parent = i;
        HT[i].weight = min1 + min2;
        HT[i].lchild = min1;
        HT[i].rchild = min2;
        HT[i].parent = 0;
    }

    //共有n個節點，每個節點對應一個字首編碼
    HC = (HuffmanCode*)malloc((n+1)*sizeof(char*));
    char * cd = (char*)malloc(sizeof(char)*n);//存編碼的臨時空間，編碼最長為(n-1)
    cd[n-1] = '\0';
    //逐個葉節點求其編碼（HT中1-n是葉子節點）
    for(int i = 1; i <= n; ++i)
    {
       int start = n-1;
       int c;
       unsigned int f;
       //葉節點逆向求編碼
       for(f=HT[i].parent,c=i;f != 0; c = f,f = HT[f].parent)
       {
           if(HT[f].lchild == c)
            cd[--start] = '0';
           else
            cd[--start] = '1';
       }
       //上一個編碼用了n-start個空間，再分配n-start個空間
       HC[i] = (char*)malloc(sizeof(char)*(n-start));
       strcpy(HC[i],&cd[start]);
    }
}

(Select函式！！！minn函式！！！構建哈夫曼樹的思路！！！)

哈夫曼樹（資料結構）

設二叉樹具有n個帶權值的葉子節點，從根節點到葉子節點的路徑長度與對應葉子節點權值的乘積之和叫做二叉樹的“帶權路徑長度”。對於一組帶有權值的葉子節點，帶權路徑長度最小的二叉樹叫做“最優二叉樹”（例如哈夫曼樹，哈夫曼樹是最優二叉樹，最優二叉樹不一定是哈夫曼樹）。

資料結構---哈夫曼樹（詳解）

main.cpp #include”HuffmanTree.h”int main() { HuffmanTree HT; int *w,i,n; unsigned in

哈夫曼樹（c語言）資料結構

for(i=1;i<=len;i++){if(ht[i].w<min2&&ht[i].p==0&&i!=*s1){min2=ht[i].w;*s2=i;}}//找到另一個最小的元素 } hfmsNode *createhfms(int n)//構造哈夫曼樹 {

資料結構之哈夫曼樹（c語言）

哈夫曼樹利用靜態連結串列建立赫夫曼樹，建樹過程中要求左子樹權值小於右子樹權值，求各結點的編碼。要求：葉子結點的個數n及結點值由鍵盤錄入。本題給出程式程式碼,要求修改以滿足測試要求. #include "stdio.h" #include "malloc.h" #in

資料結構-哈夫曼樹（python實現）

好，前面我們介紹了一般二叉樹、完全二叉樹、滿二叉樹，這篇文章呢，我們要介紹的是哈夫曼樹。哈夫曼樹也叫最優二叉樹，與哈夫曼樹相關的概念還有哈夫曼編碼，這兩者其實是相同的。哈夫曼編碼是哈夫曼在1952年提出的。現在哈夫曼編碼多應用在文字壓縮方面。接下來，我們就來介紹哈夫曼樹到底是個什麼東西？哈夫曼編碼又是什麼，

哈夫曼樹（Huffman-Tree）的構造及應用

　　本文以學習筆記的性質談一談哈夫曼樹較為嚴謹的貪心做法。哈夫曼樹的構造　　有這樣一棵k叉樹，它的葉子節點有權值，第i個葉子節點權值為wi(wi>0)wi(wi>0)，他的深度為lili，要求最小化∑wi∗li∑wi∗li，這樣問題的

資料結構實驗之二叉樹六：哈夫曼編碼（SDUT 3345）

題解：離散中的“最小生成樹（最優樹）”。 #include <bits/stdc++.h> using namespace std; void qusort(int l, int r, int a[]) { int x = a[l]; int i = l, j =

※資料結構※→☆非線性結構（tree）☆============哈夫曼樹順序儲存結構（tree Huffman sequence）（二十二）

/** @(#)$Id: AL_TreeHuffmanSeq.h 70 2013-10-08 10:31:44Z xiaoting $ @brief Tree (tree) that contains n (n> 0) nodes of a finite set, where: (1) E

資料結構與演算法 (七) 哈夫曼樹（Huffman）與哈夫曼編碼

1.演算法思想哈夫曼樹又稱最優二叉樹，是一種帶權路徑長度最短的二叉樹。所謂樹的帶權路徑長度，就是樹中所有的葉結點的權值乘上其到根結點的路徑長度（若根結點為0層，葉結點到根結點的路徑長度為葉結點的層數）。樹的路徑長度是從樹根到每

資料結構之哈夫曼樹（最優二叉樹）

文字壓縮是一種非常重要的技術，自然涉及到了壓縮編碼。哈夫曼編碼——一種最基本的壓縮編碼方法幾個術語： 1、路徑：樹中兩個節點之間的分支序列 2、路徑長度：路徑上的分支數目

哈夫曼樹（C++優先隊列的使用）

name sub pan main 道理輸出 tor 數據排序。給定n個權值作為n個葉子結點，構造一棵二叉樹，若帶權路徑長度達到最小，稱為哈夫曼樹(Huffman Tree)。哈夫曼樹是帶權路徑長度最短的樹，權值較大的結點離根較近。構造假設有n個權

哈夫曼樹（優先佇列實現）

#include<iostream> #include<cstdio> #include<queue> using namespace std; int main(){ int t; cin>>t; while(t--)

HuffmanTree哈夫曼樹（赫夫曼樹）及哈夫曼編碼

今天帶領大家學一下哈夫曼一. 概念：赫夫曼樹又叫做最優二叉樹，它的特點是帶權路徑最短。 1）路徑：路徑是指從樹中一個結點到另一個結點的分支所構成的路線， 2）路徑長度：路徑長度是指路徑上的分支數目。 3）樹的路徑長度：樹的路徑長度是指從根到每個結點的路徑長度之和

哈夫曼樹（最優二叉樹）的構造【二叉樹的應用】

對於給定一個長度為m序列，構造一顆以序列值為權的m個外部結點的擴充二叉樹，使得帶權的外部路徑長度WPL最小，就稱這顆擴充二叉樹為哈夫曼（Huffman）樹（最優二叉樹）。構造Huffman Tree 的演算法也就是哈夫曼演算法。演算法基本思想：1）給定m個權

樹之哈夫曼樹（最優二叉樹）

本文來介紹哈夫曼樹。哈夫曼樹又叫最優二叉樹，是一種特殊的二叉樹。這種二叉樹最重要的特徵就是：樹的帶權路徑長度(Weighted Path Length of Tree，簡記為WPL)最小。本文給出了哈弗曼演算法的實現過程，程式碼部分已經描述的比較詳細，這裡就

GZIP壓縮原理分析（32）——第五章 Deflate演算法詳解（五23）動態哈夫曼編碼分析（12）構建哈夫曼樹（04）

*構建literal/length樹部落格http://www.cnblogs.com/esingchan/p/3958962.html中這樣說道：“ZIP之所以是通用壓縮，它實際上是針對位元組作為

GZIP壓縮原理分析（29）——第五章 Deflate演算法詳解（五20）動態哈夫曼編碼分析（09）構建哈夫曼樹（01）

現在已經完成了對字串“As mentioned above,there are many kinds of wireless systems other than cellular.”進行壓縮的第一步

哈夫曼樹（最優二叉樹）

最優二叉樹，也稱哈夫曼（Haffman）樹，是指對於一組帶有確定權值的葉結點，構造的具有最小帶權路徑長度的二叉樹。二叉樹的路徑長度則是指由根結點到所有葉結點的路徑長度之和。如果二叉樹中的葉結點都具有一定的權值，則可將這一概念加以推廣。設二叉樹具有n個帶權值的葉結點，那麼從

GZIP壓縮原理分析（31）——第五章 Deflate演算法詳解（五22）動態哈夫曼編碼分析（11）構建哈夫曼樹（03）

*構建distance樹現在已經知道壓縮會在壓縮結果中儲存葉子節點深度資訊（即碼字長度）從而讓解壓方間接得到碼錶，但是問題來了，構造樹的資訊只包括碼字長度，可解壓方怎麼知道這個碼字長度是哪個原碼的（注意，“原碼”與“原始碼”的差別，前者是指原始資料，後者是指程式碼）？有什

完成基於哈夫曼樹（最優二叉樹）的壓縮及解壓小程式的收穫

收穫 1）更有條理的構造我的程式碼了：先從main方法下手，將自己想要的實現程式的功能以註釋的方式寫出來，然後再逐漸細化每一部分的功能，每部分的功能都有非常明確的輸入部分，將這些輸入的內容加工，進行輸出（也就是下一部分功能的實現的輸入部分）就是這部分功能

哈夫曼樹（資料結構）

相關推薦