LZW 壓縮演算法的C++實現

阿新 • • 發佈：2019-02-14

最近老師佈置了一個上機作業，實現LZW 。剛好最近對STL掌握的還不錯，寫起來就比較容易，又一次體會到了C++模版庫的強大，要不然程式碼量就*2了。

不知道老師的要求是對ASCCI碼所有的字元進行壓縮編碼還是隻對輸入字串的進行編碼，不過演算法都一樣，我是對根據輸入的串進行構造字典表，如果直接對256個字元進行構造，那更簡單了。

結下來就先說一說LZW的演算法，它屬於無失真壓縮的一種，尤其對輸入重複的串壓縮的越徹底。

基礎思想：

利用字元的重用性，每當輸出一個編碼，就講一個新的string 存放到字典表中

演算法流程：

1.初始化，將所有的單字元放入字典表中（這裡的字元是指輸入字串中不重複的字元）

2.讀入一個輸入給字首串，賦值給W

3.讀入一個輸入字元，賦值給K

判斷：

if 沒有這樣的K（指輸入的字串結束了），就輸出最後一個W代表的碼字,break;

if WK（指將WK兩個字串合併成一個）存在於字典表

{W=WK;repeat3;}

if WK不再字典表

{輸出W代表的碼字，WK加進字典表；W=K;repeat3;}

具體可以看看下面的示例：

輸入串ABABB

構造初始字典表並同時進行編號（即流程中所說的碼字）：

A	1
B	2

接下來第一個流程：

W=A

K=B

判斷WK=AB不在字典表中，輸出W代表的碼字A--1，WK=AB加入字典表，W=K=B，repeat3

A	1
B	2
AB	3

第二個流程：

W=B

K=A

判斷WK=BA不在字典表中，輸出W代表的碼字B--2，WK=BA加入字典表，W=K=A，repeat3

A	1
B	2
AB	3
BA	4

第三個流程：

W=A

K=B

判斷WK=AB在字典表中，W=WK=AB，repeat3

第四個流程：

W=AB

K=B

判斷WK=ABB不再字典表中，輸出W代表的碼字AB--3，WK=ABB加入字典表，W=K=B,repeat3

A	1
B	2
AB	3
BA	4
ABB	5

第五個流程：

W=B

K='\0' 輸入窮盡，輸出W代表的碼字B--2

綜上最後的壓縮後的編碼為 1232.

我這個可能是按照流程走的一遍比較麻煩，不過如果大家有耐心的話走一遍就全部明白了

解碼就是壓縮的逆過程，根據輸入的編碼流從字典表中找字元，簡單。

實現程式碼如下：

#include <iostream>
#include <cstdio>
#include <cstring>
#include <map>
#include <algorithm>
#include <vector>
using namespace std;
long len=0;//原字串的長度
long loc=0;//去重之後字串的長度
map<string,long> dictionary;
vector <long> result;
#define MAX 100;
void LZWcode(string a,string s)
{
    //memset(&result,0,sizeof(int));
    string W,K;
    for(long i=0;i<loc;i++)
    {
        string s1;
        s1=s[i];//將單個字元轉換為字串
        dictionary[s1]=i+1;
    }
    W=a[0];
    loc+=1;
    for(int i=0;i<len-1;i++)
    {
        K=a[i+1];
        string firstT=W;
        string secontT=W;
        if(dictionary.count(firstT.append(K))!=0)//map的函式count(n),返回的是map容器中出現n的次數
            W=firstT;
        else
        {
            result.push_back(dictionary[W]);
            dictionary[secontT.append(K)]=loc++;
            W=K;
        }
    }
    if(!W.empty())
        result.push_back(dictionary[W]);
    for(int i=0;i<result.size();i++)
        cout<<result[i];
}

void LZWdecode(int *s,int n)
{
    string nS;
    for(int i=0;i<n;i++)
        for(map<string,long>::iterator it=dictionary.begin(); it!=dictionary.end();it++)
            if(it->second==s[i])
            {
                cout<<it->first<<" ";
            }
    for(map<string,long>::iterator it=dictionary.begin(); it!=dictionary.end();it++)//輸出壓縮編碼的字典表
        cout<<it->first<<" "<<it->second<<endl;
}
int main(int argc, char const *argv[])
{
    cout<<"本程式的解碼是根據輸入的編碼字元進行的解碼，並不是全256 的字元"<<endl;
    cout<<"選擇序號："<<endl;
    cout<<"1.壓縮編碼   2.解碼"<<endl;
    int n;
    while(scanf("%d",&n)!=EOF)
    {
        switch(n)
        {
            case 1:
            {
                char s[100],a[100];
                cout<<"輸入一串字元："<<endl;
                cin>>s;
                len=strlen(s);
                for(int i=0;i<len;i++)
                    a[i]=s[i];
                sort(s,s+len);//排序
                loc=unique(s,s+len)-s;//去重
                LZWcode(a,s);
                break;
            }
            case 2:
            {
                cout<<"輸入解碼陣列的長度:"<<endl;
                int changdu;
                cin>>changdu;
                cout<<"輸入解碼數串（每個數串以空格隔開）:"<<endl;
                int s[changdu];
                for(int i=0;i<changdu;i++)
                    cin>>s[i];
                LZWdecode(s, changdu);
                break;
            }
            default:
                cout<<"你的輸入不正確，請從重新開始"<<endl;
        }
        if(n==2)
        {
            auto iter=result.begin();   // 每次正確輸入結束後對結果進行清零
            while(iter!=result.end())
                result.erase(iter++);
        }
    }
    return 0;
}

[原始碼和文件分享]基於C++實現的LZW壓縮演算法

1 特點基於C++實現的LZW壓縮演算法，特點如下所示：使用stl::map鍵值對作為字典儲存感覺算是簡單的檔案操作字典無限長，字典自生長。但是字典只能解析儲存ascii編碼之類存在，中文符號之類的碰到就掛 2 邏輯設計 2.1 總體思路

LZW 壓縮演算法的C++實現

最近老師佈置了一個上機作業，實現LZW 。剛好最近對STL掌握的還不錯，寫起來就比較容易，又一次體會到了C++模版庫的強大，要不然程式碼量就*2了。不知道老師的要求是對ASCCI碼所有的字元進行壓縮編碼還是隻對輸入字串的進行編碼，不過演算法都一樣，我是對根據輸入的串進行構

哈夫曼壓縮演算法C語言實現——步驟，詳細註釋原始碼

哈夫曼壓縮演算法的詳細實現步驟： 1、定義哈夫曼樹節點，用結構體。 2、利用C語言檔案讀寫，統計字元個數。 3、根據字元個數建立哈夫曼樹（不懂haffman資料結構的自己查下資料，我這裡就不再重複了） 4、根據哈夫曼樹為每個出現的字元編碼 5、壓縮：這裡涉及到位操作，用ch

JPEG影象壓縮解壓演算法——C++實現

/** * 作者：戴文治 * 時間：2017年11月17日 * 描述：JPEG壓縮與解壓演算法 * 測試環境：Dev-C++ 5.9.2 */ #include<iostream> #include<string> #include<cstdlib> #include&l

Nakatsu演算法--C++實現

期末論文選的是最長公共子序列的其他解法，偶然發現Nakatsu演算法對於最長公共子序列求解速度很快。嘔心瀝血寫的程式碼=。=| 希望可以給以後想學習用Nakatsu演算法的朋友們一個參考。注：Nakatsu求的是最佳匹配度，子序列可能所含字元不正確，

《演算法》第四版algs4:sort排序演算法C++實現

具體程式碼： https://github.com/Nwpuer/algs4-in-cpp/blob/master/sort.h 這一章的實現，相比於書上我做了輕微的改變，主要目的是把程式碼寫的更加簡潔易懂，更加關注演算法是如何實現的，換言之，更關注演算法的本質，而不是如何去設計一個C+

n個顧客等待服務-貪心演算法c++實現

#include<iostream> #include<algorithm> using namespace std; typedef struct pers{ int id; int time; }

整數刪除數字求最小值-貪心演算法 c++實現

#include<iostream> #include<string.h> using namespace std; void calculate(char *a,int k) { int len=strlen(a); &nb

常用排序演算法C++實現

#ifndef SORT_H #define SORT_H class Sort { private: Sort(); Sort(const Sort&); Sort& operator = (const Sort&); te

排序演算法-c實現

#include <stdio.h> #include <stdlib.h> #include<cstring> void quicksort(int arr[],int left,int right) { if (left > r

K-menas聚類演算法C++實現

基本介紹： k-means 演算法接受輸入量 k ；然後將n個數據物件劃分為 k個聚類以便使得所獲得的聚類滿足：同一聚類中的物件相似度較高；而不同聚類中的物件相似度較小。聚類相似度是利用各聚類中物件的均值所獲得一個“中心物件”（引力中心）來進行計算的。工作過程：　　k-m

七種內排序演算法C++實現

七種內排序演算法，目前只寫了程式碼，原理解析待補充： 1.交換類排序：冒泡、快排； 2.選擇類排序：選擇、堆排序； 3.插入類排序：直接插入、希爾； 4.歸併排序測試用例： 5 1 2 4 3 -3 10 100 293 123 212 293 434 5

【資料結構】十一種排序演算法C++實現

練習了十一種排序演算法的C++實現：以下依次為，冒泡、選擇、希爾、插入、二路歸併、快排、堆排序、計數排序、基數排序、桶排序，可建立sort.h和main.cpp將程式碼放入即可執行。如有錯誤，請指出更正，謝謝交流。 // sort.h # include <

快速排序演算法C++實現[評註版]

經常看到有人在網上發快速排序的演算法，通常情況下這些人是在準備找工作，或者看<演算法導論>這本書，而在他們釋出的程式碼通常是差不多的版本，估計也是網上copy一下，自己改改，跑過了就算了，但是通常這樣玩根本沒有太大作用，如果到一家公司，給你一臺不能上網的筆記本，20分鐘，你是根本寫不

base64加密演算法C++實現

　　base64編碼原理：維基百科 - Base64 　　其實編碼規則很簡單，將字串按每三個字元組成一組，因為每個字元的 ascii 碼對應 0~127 之間（顯然，不考慮其他字符集編碼），即每個字元的二進位制以 8 bit 儲存，$ 3 \times 8 = 4 \times 6 $，這樣就可以很方便的轉

狄克斯特拉 Dijkstra 演算法 C#實現

今天在看《演算法圖解》，看了加權最小路徑演算法，決定用程式碼實現一下。首先是畫有向圖，在網上找了一下，有不錯的開源軟體graphviz,該原始碼託管在GitLab上。該軟體是一個圖形視覺化軟體。畫了一個有向圖如下：畫圖用的程式碼： digraph dijkstra{ start->A[lab

prim 演算法 c++實現

1.概述　　設G =(V,E)是無向連通帶權圖，即一個網路。E中每條邊(v,w)的權為c[v][w]。如果G的子圖G’是一棵包含G的所有頂點的樹，則稱G’為G的生成樹。生成樹上各邊權的總和稱為該生成樹的耗費。在G的所有生成樹中，耗費最小的生成樹稱為G的最小生成樹。

kruskal 演算法 c++實現

Kruskal是另一個計算最小生成樹的演算法，其演算法原理如下。首先，將每個頂點放入其自身的資料集合中。然後，按照權值的升序來選擇邊。當選擇每條邊時，判斷定義邊的頂點是否在不同的資料集中。如果是，將此邊插入最小生成樹的集合中，同時，將集合中包含每個頂點的聯合體

影象處理(Image Processing) ---------- 影象和影像壓縮(Compression)(C#實現)

空間域壓縮： Fractal Coding ：https://blog.csdn.net/weixin_35811044 Run Length Coding: 影象中連續出現的相同Pixel，只記錄一個但需多一個符號記錄其出現的次數，無失真壓縮。Ex.111110000

AES加密演算法C++實現

（1）aes.h #ifndef aes_h__ #define aes_h__ class AES { public: AES(unsigned char* key); virtual ~AES(); unsigned char* Cipher(unsigned char* inpu

LZW 壓縮演算法的C++實現

相關推薦