QRCode二維碼總結
QR碼生成原理-QR Code(ISO 18004)編碼方式
一、什麼是QR碼
QR碼屬於矩陣式二維碼中的一個種類,由DENSO(日本電裝)公司開發,由JIS和ISO將其標準化。QR碼的樣子其實在很多場合已經能夠被看到了
1. 位置探測圖形、位置探測圖形分隔符:用於對二維碼的定位,對每個QR碼來說,位置都是固定存在的,只是大小規格會有所差異;這些黑白間隔的矩形塊很容易進行影象處理的檢測。
2. 校正圖形:根據尺寸的不同,矯正圖形的個數也不同。矯正圖形主要用於QR碼形狀的矯正,尤其是當QR碼印刷在不平坦的面上,或者拍照時候發生畸變等。
3. 定點陣圖形:這些小的黑白相間的格子就好像座標軸,在二維碼上定義了網格。
4. 格式資訊:表示該二維碼的糾錯級別,分為L、M、Q、H;
5. 資料區域:使用黑白的二進位制網格編碼內容。8個格子可以編碼一個位元組。
6. 版本資訊:即二維碼的規格,QR碼符號共有40種規格的矩陣(一般為黑白色),從21x21(版本1),到177x177(版本40),每一版本符號比前一版本 每邊增加4個模組。
7. 糾錯碼字:用於修正二維碼損壞帶來的錯誤。
2.2 QR二維碼的識別原理
2.2.1定位 手機拍攝QR 碼影象時,可能會同時採集到條碼周圍其他的影象。這些干擾影象會增加影象處理的複雜度,因此,可以把這些沒必要的干擾影象通過裁切的方式去除。校正後,直接對正方形A'B'C'D'外的區域裁切,就可以去除其餘背景。 QR 碼符號中有3 個位置探測圖形,分別位於符號影象4 個角中的3 個角,每個 4 位置探測影象都是由固定深淺顏色的模組組成。模組深淺顏色順序為深色—淺色—深色—淺色—深色,各元素寬度的比例為1∶ 1∶ 3∶ 1∶ 1(如下圖所示)。
即使影象有旋轉,位置探測影象的模組顏色順序和寬度比例也不變。對二值化後的影象按行、列分別逐點掃描,把同一灰度級的相鄰畫素記錄為線段。如果有5 段線段的長度比例符合1∶ 1∶ 3 ∶ 1 ∶ 1,且深淺顏色順序為深—淺—深—淺—深,則記錄該線段。掃描完後,把行相鄰的線段分為1 組,去除與所有線段都不相鄰的行線段( 可能是隨機的干擾線段) 。同樣處理列線段,把行線段組和列線段組中相互交叉的組分類,求出交叉的行、列線段組的中心點,即為位置探測圖形的中心。 2.2.2 預處理 基本原理:QR 碼作為手機二維碼,其應用模式如下圖所示。手機等智慧裝置通過攝像頭採集帶有條碼符號的影象,對影象進行灰度化、二值化、旋轉校正等預處理,進行條碼檢測。如果檢測到非QR 碼,則重新採集; 如果是QR 碼,則進行影象資訊的取樣。用Reed - Solomon 碼的譯碼演算法對取到的資料進行糾錯譯碼,統計出現的錯誤數量。如果錯誤數量超出糾錯容量,則糾錯譯碼失敗,重新採集影象; 如果可以正確進行糾錯譯碼,則把糾錯後的資訊進行各種資料模式下的譯碼,恢復出編碼資訊,繼而根據應用模式進行資訊輸出、傳送簡訊或網址跳轉等後續處理。
二、QR碼的特點
說到QR碼的特點:
一)是高速讀取(QR就是取自“Quick Response”的首字母),對讀取速度的體驗源自於我手機上的一個軟體,象上面貼出的碼圖,通過攝像頭從拍攝到解碼到顯示內容也就三秒左右,對攝像的角度也沒有什麼要求;
二)是高容量、高密度;理論上內容經過壓縮處理後可以存7089個數字,4296 個字母和數字混合字元,2953個8位位元組資料,1817個漢字;
三)是支援糾錯處理;糾錯處理相對複雜,目前我還沒有深入瞭解,按照QR碼的標準文件說明,QR碼的糾錯分為4個級別,分別是:
level L : 最大 7% 的錯誤能夠被糾正;
level M : 最大 15% 的錯誤能夠被糾正;
level Q : 最大 25% 的錯誤能夠被糾正;
level H : 最大 30% 的錯誤能夠被糾正;
四)是結構化;看似無規則的圖形,其實對區域有嚴格的定義,下圖就是一個模式2、版本1的QR圖結構(關於QR碼的"模式"、"版本"將在後面進行介紹):
在上圖21*21的矩陣中,黑白的區域在QR碼規範中被指定為固定的位置,稱為尋像圖形(finder pattern) 和 定點陣圖形(timing pattern)。尋像圖形和定點陣圖形用來幫助解碼程式確定圖形中具體符號的座標。
黃色的區域用來儲存被編碼的資料內容以及糾錯資訊碼。
藍色的區域,用來標識糾錯的級別(也就是Level L到Level H)和所謂的"Mask pattern",這個區域被稱為“格式化資訊”(format information)。
五)是擴充套件能力。QR碼的Structure Append特點,使一個QR碼可以分解成多個QR碼,反之,也可以將多個QR碼的資料組合到一個QR碼中來:
三、QR碼的模式和版本
前面提到過QR碼的模式(Model)和版本(Version)。QR碼分為Model1和Model2兩種模式,Model1是對QR的初始定義,Model2是對Model1的擴充套件,目前使用較為普遍的是Model2,本文的所有說明也僅用於Model2。
QR圖的大小(size)被定義為版本(Version),版本號從1到40。版本1就是一個21*21的矩陣,每增加一個版本號,矩陣的大小就增 加4個模組(Module),因此,版本40就是一個177*177的矩陣。(版本越高,意味著儲存的內容越多,糾錯能力也越強)。
三、QR碼支援的編碼內容
QR碼支援編碼的內容包括純數字、數字和字元混合編碼、8位位元組碼和包含漢字在內的多位元組字元。其中:
數字:每三個為一組壓縮成10bit。
字母數字混合:每兩個為一組,壓縮成11bit。
8bit位元組資料:無壓縮直接儲存。
多位元組字元:每一個字元被壓縮成13bit。
QR碼編碼原理(編碼)
編碼就是把常見的數字、字元等轉換成QR碼的方法。說具體的編碼之前,先說一下QR碼的最大容量問題。
一、最大容量
QR碼的最大容量取決於選擇的版本、糾錯級別和編碼模式(Mode:數字、字元、多位元組字元等)。以版本1、糾錯級別為Level Q的QR碼為例,可以儲存27個純數字,或17個字母數字混合字元或11個8bit位元組資料。如果要儲存同樣多的內容同時提高糾錯級別,則需要採用更高的版本。版本1~9 資料容量、糾錯碼容量對照如下表:
版本 |
(error correcting level) |
(count of data code words) |
count of EC code words |
(numeric) |
(alphanumeric) |
8bit |
1 |
L |
19 |
7 |
41 |
25 |
17 |
M |
16 |
10 |
34 |
20 |
14 |
|
Q |
13 |
13 |
27 |
16 |
11 |
|
H |
9 |
17 |
17 |
10 |
7 |
|
2 |
L |
34 |
10 |
77 |
47 |
32 |
M |
28 |
16 |
63 |
38 |
26 |
|
Q |
22 |
22 |
48 |
29 |
20 |
|
H |
16 |
28 |
34 |
20 |
14 |
|
3 |
L |
55 |
15 |
127 |
77 |
53 |
M |
44 |
26 |
101 |
61 |
42 |
|
Q |
34 |
36 |
77 |
47 |
32 |
|
H |
26 |
44 |
58 |
35 |
24 |
|
4 |
L |
80 |
20 |
187 |
114 |
78 |
M |
64 |
36 |
149 |
90 |
62 |
|
Q |
48 |
52 |
111 |
67 |
46 |
|
H |
36 |
64 |
82 |
50 |
34 |
|
5 |
L |
108 |
26 |
255 |
154 |
106 |
M |
86 |
48 |
202 |
122 |
84 |
|
Q |
62 |
72 |
144 |
87 |
60 |
|
H |
46 |
88 |
106 |
64 |
44 |
|
6 |
L |
136 |
36 |
322 |
195 |
134 |
M |
108 |
64 |
255 |
154 |
106 |
|
Q |
76 |
96 |
175 |
108 |
74 |
|
H |
60 |
112 |
139 |
84 |
58 |
|
7 |
L |
156 |
40 |
370 |
224 |
154 |
M |
124 |
72 |
293 |
178 |
122 |
|
Q |
88 |
108 |
207 |
125 |
86 |
|
H |
66 |
130 |
154 |
93 |
64 |
|
8 |
L |
194 |
48 |
461 |
279 |
192 |
M |
154 |
88 |
365 |
221 |
152 |
|
Q |
110 |
132 |
259 |
157 |
108 |
|
H |
86 |
156 |
202 |
122 |
84 |
|
9 |
L |
232 |
60 |
552 |
335 |
230 |
M |
182 |
110 |
432 |
262 |
180 |
|
Q |
132 |
160 |
312 |
189 |
130 |
|
H |
100 |
192 |
235 |
143 |
98 |
如果要了解更詳細的QR碼容量資訊,可以到電裝的網站去看看:
下面,就舉例說明將“ABCDE123”轉換成為版本1、Level H的QR碼轉換方法。
二、模式識別符號(Mode Indicator)
QR碼的模式(Mode)就是前文提到的數字、字元、8bit 位元組碼、多位元組碼等。對於不同的模式,都有對應的模式識別符號(Mode Indicator)來幫助解碼程式進行匹配,模式識別符號是4bit的二進位制數:
1、數字模式(numeric mode ): 0001
2、混合字元模式(alphanumeric mode) : 0010
3、8bit byte mode: 0100
4、日本漢字(KANJI mode) : 1000
5、中國漢字(GB2312):1101
由於示例文字串是混合字元,因此將選擇alphanumeric mode,其標識碼為:0010
三、文字串計數識別符號(Character count indicator)
文字串計數識別符號用來儲存源內容字串的長度,在版本1-9的QR碼中,文字串長度識別符號自身的長度被定義為:
數字 : 10bit
混合字元 : 9bit
8bit 位元組碼 : 8bit
多位元組碼 : 8bit
在本例中,源文字串的長度為8個字元,混合字元的長度為9bit,因此將字元個數8編碼為9位二進位制表示:000001000
加上混合字元模式標識碼,總的編碼為0010 000001000
四、資料內容編碼
1、數字模式下的編碼
在數字模式下,資料被限制為3個數字一段,分成若干段。如:"123456" 將分成"123" 和 "456",分別被編碼成10bit的二進位制數。“123”的10bit二進位制表示法為:0001111011,實際上就是二進位制的123。
當資料的長度不足3個數字時,如果只有1個數字則用4bit,如果有2個數字就用7個bit來表示。
如:"9876"被分成"987"和"6"兩段,因此被表示為"1111011011 0110"。
2、混合字元模式下的編碼
混合字元模式編碼,其字元對照表如下:
0 |
0 |
A |
10 |
K |
20 |
U |
30 |
+ |
40 |
|
1 |
1 |
B |
11 |
L |
21 |
V |
31 |
- |
41 |
|
2 |
2 |
C |
12 |
M |
22 |
W |
32 |
. |
42 |
|
3 |
3 |
D |
13 |
N |
23 |
X |
33 |
/ |
43 |
|
4 |
4 |
E |
14 |
O |
24 |
Y |
34 |
: |
44 |
|
5 |
5 |
F |
15 |
P |
25 |
Z |
35 |
|||
6 |
6 |
G |
16 |
Q |
26 |
[sp] |
36 |
|||
7 |
7 |
H |
17 |
R |
27 |
$ |
37 |
|||
8 |
8 |
I |
18 |
S |
28 |
% |
38 |
|||
9 |
9 |
J |
19 |
T |
29 |
* |
3 |
編碼方式為:
原始碼被分成兩個字元一段,如下所示,每段的第一個字元乘上45,再用第二個數字相加。因此每段變成了11bit的2進位制碼,如果字元個數只有1個,則用6bit表示。
示例:
"AB" |
"CD" |
"E1" |
"23" |
||
45*10+11 |
45*12+13 |
45*14+1 |
45*2+3 |
||
461 |
553 |
631 |
93 |
||
0010 |
000001000 |
00111001101 |
01000101001 |
01001110111 |
00001011101 |
3、8bit位元組資料不經編碼轉換直接儲存。
五、編碼終止符(Terminator)
如果編碼後的字元長度不足當前版本和糾錯級別所儲存的容量,則在後續補"0000",如果容量已滿則無需新增終止符。此時得到的編碼串為:
0010 000001000 00111001101 01000101001 01001110111 00001011101 0000
六、編成8bit碼字(Code words)
將以上的編碼再按8bit一組,形成碼字(code words):
00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000
如果尾部資料不足8bit,則在尾部充0:
00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000
如果編碼後的資料不足版本及糾錯級別的最大容量,則在尾部補充 "11101100" 和"00010001",直到全部填滿。最後,版本1、Level H下的"ABCDE123" 的QR碼是:
00100000 01000001 11001101 01000101 00101001 11011100 00101110 10000000 11101100
十進位制表示法為:
32 65 205 69 41 220 46 128 236
QR碼編碼原理(日本漢字和中文編碼)
一、日本漢字(KANJI)是兩個位元組表示的字元碼,編碼的方式是將其轉換為13位元組的二進位制碼制。
轉換步驟為:
1、對於JIS值為8140(hex) 到9FFC(hex)之間字元:
a)將待轉換的JIS值減去8140(hex);
b)將高位位元組乘以C0(hex);
c)將b)步驟生成的資料加上低位位元組;
d)將結果轉換為13位二進位制串。
2、對於JIS值為E040(hex)到EBBF(hex)之間的字元:
a)將待轉換的JIS值減去C140(hex);
b)將高位位元組乘以C0(hex);
c)將b)步驟生成的資料加上低位位元組;
d)將結果轉換為13位二進位制串。
二、中文漢字的與日文漢字轉換步驟相似:
1、對於第一位元組為0xA1~0xAA之間,第二位元組在0xA1~0xFE之間字元:
a)第一位元組減去0xA1;
b)上一步結果乘以0x60;
c)第二位元組減去0xA1;
d)將b)步驟的結果加上c步驟的結果;
e)將結果轉換為13位二進位制串。
1、對於第一位元組為0xB0~0xFA之間,第二位元組在0xA1~0xFE之間字元:
a)第一位元組減去0xA6;
b)上一步結果乘以0x60;
c)第二位元組減去0xA1;
d)將b)步驟的結果加上c步驟的結果;
e)將結果轉換為13位二進位制串。