1. 程式人生 > >圖示建立哈夫曼樹的過程

圖示建立哈夫曼樹的過程

字元編碼:
計算機裡每個字元在沒有壓縮的文字檔案中由一個直接(如常見的ASCII碼)或兩個直接(如比較新的Unicode,它可以在各種語言中通用)表示,在這些方案中,每個字元需要相同的位數。下圖列出裡用ASCII碼錶示的一些字元,可以看到每個字元都用8個位來表示

這裡寫圖片描述
有很多壓縮資料的方法,對文字來說,最常用的方法是減少表示最常用字元的位數量,如英語中,E是最常用字母,所以用盡可能少的位為E編碼是很合理的,反之,Z是很少用到的,所以用多些位表示也沒有關係。

假設要傳送訊息:SUSIE SAYS IT IS EASY.字母S出現得最多,其次是空格,用表格來列出每種字元出現的次數,這樣的表叫做頻率表。
這裡寫圖片描述

編碼時,出現最多的字元應該最少。
下面是建立哈夫曼樹的過程:
這裡寫圖片描述
這裡寫圖片描述