1. 程式人生 > >二維碼的生成原理

二維碼的生成原理

二維碼的基礎原理是什麼?

二維條碼是指在一維條碼的基礎上擴展出另一維具有可讀性的條碼,使用黑白矩形圖案表示二進位制資料,被裝置掃描後可獲取其中所包含的資訊。一維條碼的寬度記載著資料,而其長度沒有記載資料。二維條碼的長度、寬度均記載著資料。二維條碼有一維條碼沒有的“定位點”和“容錯機制”。容錯機制在即使沒有辨識到全部的條碼、或是說條碼有汙損時,也可以正確地還原條碼上的資訊。二維條碼的種類很多,不同的機構開發出的二維條碼具有不同的結構以及編寫、讀取方法。

堆疊式/行排式二維條碼,如,Code 16K、Code 49、PDF417(如右圖)等。

矩陣式二維碼,最流行莫過於QR CODE,二維碼的名稱是相對與一維碼來說的,比如以前的條形碼就是一個“一維碼”。

它的優點有:二維碼儲存的資料量更大;可以包含數字、字元,及中文文字等混合內容;有一定的容錯性(在部分損壞以後可以正常讀取);空間利用率高等。

二維碼編碼過程

1、資料分析:確定編碼的字元型別,按相應的字符集轉換成符號字元; 選擇糾錯等級,在規格一定的條件下,糾錯等級越高其真實資料的容量越小。

2、資料編碼:將資料字元轉換為位流,每8位一個碼字,整體構成一個數據的碼字序列。其實知道這個資料碼字序列就知道了二維碼的資料內容。

下面小草就用一個案例帶你瞭解二維碼的編碼過程,以對資料01234567編碼為例

1)分組:012 345 67

2)轉成二進位制:012→0000001100      345→0101011001     67 →1000011

3)轉成序列:0000001100 0101011001 1000011

4)字元數 轉成二進位制:8→0000001000

5)加入模式指示符(上圖數字)0001:0001 0000001000 0000001100 0101011001 1000011

對於字母、中文、日文等只是分組的方式、模式等內容有所區別,基本方法是一致的。二維碼雖然比起一維條碼具有更強大的資訊記載能力,但也是有容量限制,通過下面這個表格小草帶你瞭解二維碼的容量到底有多大。

3、糾錯編碼:按需要將上面的碼字序列分塊,並根據糾錯等級和分塊的碼字,產生糾錯碼字,並把糾錯碼字加入到資料碼字序列後面,成為一個新的序列。在二維碼規格和糾錯等級確定的情況下,其實它所能容納的碼字總數和糾錯碼字數也就確定了,比如:版本10,糾錯等級時H時,總共能容納346個碼字,其中224個糾錯碼字。就是說二維碼區域中大約1/3的碼字時冗餘的。對於這224個糾錯碼字,它能夠糾正112個替代錯誤(如黑白顛倒)或者224個據讀錯誤(無法讀到或者無法譯碼),這樣糾錯容量為:112/346=32.4%

4、構造最終資料資訊:在規格確定的條件下,將上面產生的序列按次序放如分塊中按規定把資料分塊,然後對每一塊進行計算,得出相應的糾錯碼字區塊,把糾錯碼字區塊 按順序構成一個序列,新增到原先的資料碼字序列後面。如:D1, D12, D23, D35, D2, D13, D24, D36, … D11, D22, D33, D45, D34, D46, E1, E23,E45, E67, E2, E24, E46, E68,…

5 、構造矩陣:在構造矩陣之前,我們先來了解一個普通二維碼的基本結構。

    位置探測圖形、位置探測圖形分隔符、定點陣圖形:用於對二維碼的定位,對每個QR碼來說,位置都是固定存在的,只是大小規格會有所差異;

    校正圖形:規格確定,校正圖形的數量和位置也就確定了;

    格式資訊:表示改二維碼的糾錯級別,分為L、M、Q、H;

    版本資訊:即二維碼的規格,QR碼符號共有40種規格的矩陣(一般為黑白色),從21×21(版本1),到177×177(版本40),每一版本符號比前一版本 每邊增加4個模組。

    資料和糾錯碼字:實際儲存的二維碼資訊,和糾錯碼字(用於修正二維碼損壞帶來的錯誤)。

瞭解了二維碼的基本結構後,將探測圖形、分隔符、定點陣圖形、校正圖形和碼字模組放入矩陣中,並把上面的完整序列填充到相應規格的二維碼矩陣的區域中。

6、掩膜:將掩摸圖形用於符號的編碼區域,使得二維碼圖形中的深色和淺色(黑色和白色)區域能夠比率最優的分佈。

7、格式和版本資訊:生成格式和版本資訊放入相應區域內。版本7-40都包含了版本資訊,沒有版本資訊的全為0。二維碼上兩個位置包含了版本資訊,它們是冗餘的。版本資訊共18位,6X3的矩陣,其中6位時資料為,如版本號8,資料位的資訊時 001000,後面的12位是糾錯位。