二維碼原理與編碼介紹
一 簡介
二維條碼(二維碼)是用某種特定的幾何圖形按一定規律在平面(二維方向)分佈的黑白相間的圖形記錄資料符號資訊的。
二維碼是DOI(Digital Object Unique Identifier,數字物件唯一識別符)的一種。
在程式碼編制上巧妙地利用構成計算機內部邏輯基礎的“0”、“1”位元流的概念,使用若干個與二進位制相對應的幾何形體來表示文字數值資訊,
通過圖象輸入裝置或光電掃描裝置自動識讀以實現資訊自動處理。在許多種類的二維條碼中,
常用的碼制有:Data Matrix,MaxiCode, Aztec,QR Code, Vericode,PDF417,Ultracode, Code 49, Code 16K 等,
QR Code碼是1994年由日本DW公司發明。QR來自英文「Quick Response」的縮寫,即快速反應的意思,源自發明者希望QR碼可讓其內容快速被解碼。
QR碼最常見於日本、韓國;併為目前日本最流行的二維空間條碼。
但二維碼的安全性也正備受挑戰,帶有惡意軟體和病毒正成為二維碼普及道路上的絆腳石。
發展與防範二維碼的濫用正成為一個亟待解決的問題。
每種碼制有其特定的字符集;每個字元佔有一定的寬度;具有一定的校驗功能等。
同時還具有對不同行的資訊自動識別功能及處理圖形旋轉變化等特點。
二維碼是一種比一維碼更高階的條碼格式。一維碼只能在一個方向(一般是水平方向)上表達資訊,而二維碼在水平和垂直方向都可以儲存資訊。
一維碼只能由數字和字母組成,而二維碼能儲存漢字、數字和圖片等資訊,因此二維碼的應用領域要廣得多。
二 QR CODE 介紹
QR(Quick-Response) code是被廣泛使用的一種二維碼,解碼速度快。它可以儲存多用型別。
如下圖時一個qrcode的基本結構,其中:位置探測圖形、位置探測圖形分隔符、定點陣圖形:
用於對二維碼的定位,對每個QR碼來說,位置都是固定存在的,只是大小規格會有所差異;
校正圖形:規格確定,校正圖形的數量和位置也就確定了;
格式資訊:表示改二維碼的糾錯級別,分為L、M、Q、H;
版本資訊:即二維碼的規格,QR碼符號共有40種規格的矩陣(一般為黑白色),
從21x21(版本1),到177x177(版本40),每一版本符號比前一版本 每邊增加4個模組。
資料和糾錯碼字:實際儲存的二維碼資訊,和糾錯碼字(用於修正二維碼損壞帶來的錯誤)。
三 編碼過程
資料分析:確定編碼的字元型別,按相應的字符集轉換成符號字元;
選擇糾錯等級,在規格一定的條件下,糾錯等級越高其真實資料的容量越小。
資料編碼:將資料字元轉換為位流,每8位一個碼字,整體構成一個數據的碼字序列。
其實知道這個資料碼字序列就知道了二維碼的資料內容。
資料可以按照一種模式進行編碼,以便進行更高效的解碼,
例如:對資料:01234567編碼(版本1-H),1)分組:012 345 672)轉成二進位制:
012→0000001100
345→0101011001
67 →10000113)
轉成序列:0000001100 0101011001 10000114)
字元數 轉成二進位制:8→00000010005)
加入模式指示符(上圖數字)0001:0001 0000001000 0000001100 0101011001 1000011
對於字母、中文、日文等只是分組的方式、模式等內容有所區別。
基本方法是一致的
四 糾錯編碼
按需要將上面的碼字序列分塊,並根據糾錯等級和分塊的碼字,產生糾錯碼字,
並把糾錯碼字加入到資料碼字序列後面,成為一個新的序列。
在二維碼規格和糾錯等級確定的情況下,其實它所能容納的碼字總數和糾錯碼字數也就確定了,
比如:版本10,糾錯等級時H時,總共能容納346個碼字,其中224個糾錯碼字。
就是說二維碼區域中大約1/3的碼字時冗餘的。對於這224個糾錯碼字,
它能夠糾正112個替代錯誤(如黑白顛倒)或者224個據讀錯誤(無法讀到或者無法譯碼),
這樣糾錯容量為:112/346=32.4%
五 構造最終資料資訊
在規格確定的條件下,將上面產生的序列按次序放如分塊中,按規定把資料分塊,
然後對每一塊進行計算,得出相應的糾錯碼字區塊,把糾錯碼字區塊 按順序構成一個序列,
新增到原先的資料碼字序列後面。
如:D1, D12, D23, D35, D2, D13, D24, D36, ... D11, D22, D33, D45, D34, D46, E1, E23,E45, E67, E2, E24, E46, E68,...
構造矩陣:將探測圖形、分隔符、定點陣圖形、校正圖形和碼字模組放入矩陣中。
來源: http://jingyan.baidu.com/article/86f4a73e520e3b37d6526981.html