Huffman編碼

阿新 • • 發佈：2020-12-05

Huffman編碼

哈夫曼編碼(Huffman Coding)，是一種編碼方式，哈夫曼編碼是可變字長編碼(VLC)的一種。Huffman於1952年提出一種編碼方法，該方法完全依據字元出現概率來構造異字頭的平均長度最短的碼字，有時稱之為最佳編碼，一般就叫做Huffman編碼。

預備知識
- 哈夫曼樹的儲存結構
  
  typedef struct
  
  {
  
  unsigned int weight;
  
  unsigned int parent, lchild, rchild;
  
  }HTNode,*HuffmanTree; //動態分配陣列儲存哈夫曼樹
- 哈夫曼編碼的儲存結構
  
  typedef char * *HuffmanCode；
  
  //動態分配陣列儲存哈夫曼編碼表
實驗題目

從鍵盤接收任意一個字串。以字串中某字元出現的次數，作為該字元的權值。利用得到的權值構造huffman樹、並輸出每個字元對應的huffman編碼。

程式碼執行的預編譯命令

#include <stdio.h>
#include <malloc.h>
#include <string.h>

所用的函式的宣告以及結構體定義

#include "CommonDef.h"
typedef struct{
	int weight;
	int parent,lchild,rchild;
}HTNode,*HuffmanTree;
typedef struct{
	char ch;
	int weight;
	}ww,*W;
typedef char **HuffmanCode;
void select(HuffmanTree *HT,int n,int *s1,int *s2);
void HuffmanCoding(HuffmanTree *HT,W *w,int n);
void Huffman(HuffmanTree HT,HuffmanCode *HC,W *w,int n);

具體的函式實現

Huffman樹的構建

void HuffmanCoding(HuffmanTree *HT,W *w,int n){
	HuffmanTree p;
	int s1,s2,m,i;
	if(n<=1) return;
	m=2*n-1;
	*HT=(HuffmanTree)malloc((m+1)*sizeof(HTNode));
	for(p=*HT+1,i=1;i<=n;i++,p++){
		p->weight=w[i-1]->weight;
		p->lchild=0;
		p->parent=0;
		p->rchild=0;
	}
	for(;i<=m;i++,p++){
		p->weight=0;
		p->lchild=0;
		p->parent=0;
		p->rchild=0;
	}
	for(i=n+1;i<=m;i++){
		select(HT,i-1,&s1,&s2);
		(*HT)[s1].parent=i;
		(*HT)[s2].parent=i;
		(*HT)[i].lchild=s1;(*HT)[i].rchild=s2;
		(*HT)[i].weight=(*HT)[s1].weight+(*HT)[s2].weight;
	}
	for(p=*HT+1,i=1;i<=m;i++){
	printf("%d %d %d %d\n",p->weight,p->parent,p->lchild,p->rchild);
	p++;
	}
}

構建Huffman樹中找查最小值與次小值的實現

void select(HuffmanTree *HT,int n,int *s1,int *s2){
	int i=1,min,cmin;
	HuffmanTree p;
	p=*HT+1;
	while(p->parent!=0){
		p++;
		i++;}
	min=p->weight;*s1=i;//最小 
		p++;i++;
    while(p->parent!=0){
		p++;
		i++;}
	cmin=p->weight;*s2=i;//次小 
	
	for(i=1,p=*HT+1;i<=n;i++,p++){
		if(p->parent==0){
		if(p->weight<min){
			cmin=min;
			min=p->weight;
			*s2=*s1;
			*s1=i;
		}
		else if(p->weight<cmin&&(*s1!=i)){
			cmin=p->weight;
			*s2=i;
		}
	}
	}
}

通過Huffman樹實現Huffman編碼

void Huffman(HuffmanTree HT,HuffmanCode *HC,W *w,int n){
	char *cd;
	int i,start,c,f;
	*HC=(HuffmanCode)malloc((n+1)*sizeof(char *));
	cd=(char *)malloc(n*sizeof(char));
	cd[n-1]='\0';
	for(i=1;i<=n;i++){
		start=n-1;
		for(c=i,f=HT[i].parent;f!=0;c=f,f=HT[f].parent){
			if(HT[f].lchild==c) cd[--start]='0';
			else cd[--start]='1';
		}
		(*HC)[i]=(char *)malloc((n-start)*sizeof(char));
    	strcpy((*HC)[i],&cd[start]);
	}
	free(cd);
}

測試程式碼

int main(){
	W w[26];
	int n,n1,i,j;
	int zifu[26]={0};
	char *s;
	FILE *fp1,*fp2; 
	HuffmanTree HT;
	HuffmanCode HC;
	s=(char *)malloc(100*sizeof(char));
	fp1=fopen("input.txt","r");
	fp2=fopen("output.txt","w");
	if(!fp1)
	{
		printf("can't open file\n");
		return -1;
	}
	fscanf (fp1,"%s",s);
	n=strlen(s);
	for(i=0;i<26;i++){
		w[i]=(W)malloc(sizeof(ww));//結構體陣列分配空間 
	}
	for(i=0;i<n;i++){
		zifu[s[i]-'a']++;
	}
	for(i=0,j=0;i<26;i++){
		if(zifu[i]!=0){
			w[j]->ch=i+'a';
			w[j]->weight=zifu[i];//給每個陣列賦值 
			j++;
		}
	}
	n1=j;
	for(i=0;i<n1;i++){
		printf("%c的權值%d\n",w[i]->ch,w[i]->weight);
		fprintf(fp2,"%c的權值%d\n",w[i]->ch,w[i]->weight);
	}	
	HuffmanCoding(&HT,w,n1);
	Huffman(HT,&HC,w,n1);
	for(i=1;i<=n1;i++){
		printf("%c的編碼：%s\n",w[i-1]->ch,(HC)[i]);
		fprintf(fp2,"%c的編碼：%s\n",w[i-1]->ch,(HC)[i]);
	}
	return 0;
}

一些注意事項

測試程式碼中的資料是從檔案讀入，然後再寫入檔案中。讀入的檔案全為字母，我的測試資料中全用的小寫字母。
程式碼首先對讀入字母進行統計出現的個數，然後再實現編碼。
本來只把算出來的編碼寫入檔案中，但是為了更好觀看，也列印在螢幕中了。
本來程式碼中無法對應每個字母，如圖

為了更好看出每個字母對應的編碼，採用了結構體來儲存每個字母的權值，這樣既可以儲存權值，也可以把字母儲存進去。

測試資料

input檔案的資料： aaaaabbbbbbbbbbbbbbbbbbbbbbbbbbbbcccccccddddddddeeeeeeeeeeeeeefffffffffffffffffffffffggghhhhhhhhhhh
所得到的Huffman編碼

B - 多元Huffman編碼問題

Description 在一個操場的四周擺放著n堆石子。現要將石子有次序地合併成一堆。規定每次至少選2 堆最多選k堆石子合併成新的一堆，合併的費用為新的一堆的石子數。試設計一個演算法，計算出將n堆石子合併成一堆的最大總

多元Huffman編碼變形—回溯法

一、問題描述描述在一個操場的四周擺放著n堆石子。現要將石子有次序地合併成一堆。規定在合併過程中最多可以有m(k)次選k堆石子合併成新的一堆，2≤k≤n，合併的費用為新的一堆的石子數。試設計一個演算法，計算出將

Huffman編碼

Huffman編碼哈夫曼編碼(Huffman Coding)，是一種編碼方式，哈夫曼編碼是可變字長編碼(VLC)的一種。Huffman於1952年提出一種編碼方法，該方法完全依據字元出現概率來構造異字頭的平均長度最短的碼字，有時稱之為最佳

1760多元Huffman編碼問題（貪心）

Description 在一個操場的四周擺放著n堆石子。現要將石子有次序地合併成一堆。規定每次至少選2 堆最多選k堆石子合併成新的一堆，合併的費用為新的一堆的石子數。試設計一個演算法，計算出將n堆石子合併成一堆的最大

Huffman編碼的C語言實現

（1）輸入一段100—200字的英文短文，存入一檔案a中。（2）寫函式統計短文出現的字母個數n及每個字母的出現次數（3）寫函式以字母出現次數作權值，建Haffman樹（n個葉子），給出每個字母的Haffman編碼。（4）

霍夫曼 Huffman 編碼簡單瞭解

霍夫曼編碼（也叫哈夫曼編碼）即時碼：必須是唯一可譯碼，對一組即時碼來說，其中的任意一個碼字都只能與一種訊號存在對應關係，而且任意一個碼字都不能是其他碼字的字首。

資料結構和演算法——Huffman樹和Huffman編碼

Huffman樹是一種特殊結構的二叉樹，由Huffman樹設計的二進位制字首編碼，也稱為Huffman編碼在通訊領域有著廣泛的應用。在word2vec模型中，在構建層次Softmax的過程中，也使用到了Huffman樹的知識。

資訊理論——Huffman編碼、Shannon-Fano-Elias編碼筆記

學到這一講不禁再一次被資訊理論的魅力所征服～同時也感到優秀的大學的課程資源確實更好，羨慕。。。

huffman樹編碼

1.構造總節點2*n-1 2.從中選擇最少的兩個 3.從後向前編碼 void select(HTnode *HT,int n,int *s1,int *s2){

哈夫曼（huffman）樹和哈夫曼編碼

目錄歡迎關注正文哈夫曼樹哈夫曼樹也叫最優二叉樹（哈夫曼樹）問題：什麼是哈夫曼樹？

赫夫曼編碼碼(Huffman Coding)

基本介紹 1) 赫夫曼編碼也翻譯為哈夫曼編碼(Huffman Coding)，又稱霍夫曼編碼，是一種編碼方式, 屬於一種程式演算法

【hust資料結構】huffman樹及編碼/解碼實驗

做了好久... 最後調出來還是蠻有成就感的，總結一個部落格出來吧2333 要求一些細節

音訊編碼 Audio Converter

需求 iOS中將採集到的原始音訊資料(PCM)進行編碼以得到壓縮資料型別(AAC...). 本例最終實現的是通過Audio Unit採集到PCM資料,將其壓縮轉為AAC資料,並以錄製的形式儲存在沙盒中.可調整編碼後音訊資料格式,取樣率,編碼

Uber Go 語言編碼規範

Uber Go 語言編碼規範 Uber 是一家美國矽谷的科技公司，也是 Go 語言的早期 adopter。其開源了很多 golang 專案，諸如被 Gopher 圈熟知的 zap、jaeger 等。2018 年年末 Uber 將內部的 Go 風格規範開源到 GitHub，經

哈夫曼樹(Huffman樹)原理分析及實現（C++）

1 構造原理假設有n個權值，則構造出的哈夫曼樹有n個葉子結點。 n個權值分別設為 w1、w2、…、wn，則哈夫曼樹的構造規則為：

在 Python 中使用 JSON 時需要注意的編碼問題

寫這篇文章的緣由是我使用 reqeusts 庫請求介面的時候,直接使用請求引數裡的 json 欄位傳送資料,但是伺服器無法識別我傳送的資料,排查了好久才知道 requests 內部是使用 json.dumps 將字串轉成 json 的,而 json.dump

在 Swift 中對 JSON 進行自定義編碼和解碼的小技巧

原文地址：Custom encoding and decoding JSON in Swift 原文作者：Leandro Fournier 譯文出自：掘金翻譯計劃

一個低階錯誤引發Netty編碼解碼中文異常

前言最近在調研Netty的使用，在編寫編碼解碼模組的時候遇到了一箇中文字串編碼和解碼異常的情況，後來發現是筆者犯了個低階錯誤。這裡做一個小小的回顧。

從 String.getBytes 理解 Java 編碼和解碼

背景週末一直在想 String.getBytes 原理。查閱了一些資料，終於用程式碼驗證了自己的想法。本篇不會涉及太多原始碼相關的知識。

告別硬編碼，mysql 如何實現按某欄位的不同取值進行統計

上週我突然意識到，我在grafana上寫的 sql 語句存在多處硬編碼。這篇筆記將記錄如何實現沒有硬編碼的 sql 語句，以及自學程式設計過程中如何應對自己的笨拙程式碼和難題不斷的狀況。

Huffman編碼

Huffman編碼

預備知識

實驗題目

程式碼執行的預編譯命令

所用的函式的宣告以及結構體定義

具體的函式實現

Huffman樹的構建

構建Huffman樹中找查最小值與次小值的實現

通過Huffman樹實現Huffman編碼

測試程式碼

一些注意事項

測試資料

相關推薦