使用python PIL庫實現簡單驗證碼的去噪方法步驟

阿新 • • 發佈：2021-06-17

字元型圖片驗證碼識別完整過程及Python實現
的博主，我的大部分知識點都是從他那裡學來的。

想要識別驗證碼，收集足夠多的樣本後，首先要做的就是對驗證碼原始圖片進行處理，對驗證碼識別分類之前，一般包括：將彩色圖片轉換成灰度圖、將灰度圖二值化和去除噪點三個基本過程。這裡僅以比較簡單的驗證碼為例，介紹一下如何通過python的PIL庫對圖片去噪。

首先看一下未經處理的驗證碼圖片：

對圖片處理主要使用了PIL庫的Image類。

1.彩色圖片轉換成灰度圖

首先使用Image的open方法開啟上面的圖片，可以得到一個PIL.Image.Image物件，之後就可以呼叫convert、filter、point和putpixel等方法來處理圖片。

我們可以通過convert方法將上面的彩色圖片轉換成灰度圖：

    # encoding=utf8
     
    from PIL import Image
     
    def main():
    	image = Image.open('RandomPicture.png')
    	imgry = image.convert('L')
    	imgry.save('gray.png')
     
    if __name__ == '__main__':
    	main()

執行結果：

通過儲存的圖片可以看出來，已經由原來的彩圖變成了灰度圖，或者也可以認為是黑白圖。什麼叫灰度圖？我們知道彩色圖片是由不同的顏色的畫素組合到一起的，那灰度圖可以類似的認為是由不同灰度值的畫素組合在一起後呈現出來的。任何顏色都有紅、綠、藍三原色組成，假如原來某點的顏色為RGB(R，G，B)，那麼，我們可以通過下面幾種方法，將其轉換為灰度：

1.浮點演算法：Gray=R0.3+G0.59+B0.11
2.整數方法：Gray=(R30+G59+B11)/100
3.移位方法：Gray =(R76+G151+B*28)>>8;
4.平均值法：Gray=（R+G+B）/3;
5.僅取綠色：Gray=G；

通過上述任一種方法求得Gray後，將原來的RGB(R,G,B)中的R,G,B統一用Gray替換，形成新的顏色RGB(Gray,Gray,Gray)，用它替換原來的RGB(R,G,B)就是灰度圖了。

用程式碼實現看一下：

    # encoding=utf8
     
    from PIL import Image
     
    def main():
    	image = Image.open('RandomPicture.png')
    	print 'image mode: ', image.mode
    	print image.getpixel((0, 0))
    	print '-' * 40
    	imgry = image.convert('L')
    	print 'imgry mode: ', imgry.mode
    	print imgry.getpixel((0, 0))
     
    if __name__ == '__main__':
    	main()

執行結果：

    image mode: RGB
    (21, 10, 26)
    ----------------------------------------
    imgry mode: L
    15

程式碼說明：

通過image.mode方法可以獲得當前的PIL.Image.Image物件（也就是當前開啟的圖片）的mode值，而mode值表示圖片的單位顏色是由RGB三個值組成的還是由灰度值組成的；

而getpixel可以獲取某個畫素的RGB值或者灰度值。我們知道圖片是由許多畫素組成的，每個畫素在圖片上都有一個對應的座標x和y，而“(0,
0)”就表示該圖片左上角頂點的畫素。

由上面的結果我們可以知道，在將圖片轉換成灰度圖之前，“(0, 0)”代表的畫素的顏色是由RGB組成的：(21, 10,
26)；在通過concert將彩色圖片轉換成灰度後，“(0,
0)”代表的畫素的顏色值就變成了一個值：“15”，通過列印imgry.mode我們也可以知道，此時圖片已經變成了灰度圖，它的每一個畫素的顏色都變成了一個灰度值。

其實這時候我們也可以簡單的計算一下，使用前面說的浮點演算法將上面的(21, 10, 26)三個值帶入計算：

    >>> 21*0.3+10*0.59+26*0.11
    15.059999999999999

結果顯示確實由浮點演算法將RGB值變成了灰度值。

2.灰度圖二值化

我們已經得到了灰度圖，接下來就是將灰度圖二值化。所謂二值化就是將灰度影象轉換成由黑白二色組成的影象。思路就是確定一個閾值，大於閾值的畫素表示為白色，小於閾值的畫素表示為黑色，以此將圖片的畫素（灰度值）劃分為兩部分：0和1，例如0代表黑色，1代表白色，然後我們就可以用一串0和1組成的數字來表示一張圖片。

將灰度圖二值化會用到point方法，它可以接收一個灰度轉二值的對映table，具體原理暫時還沒弄明白，程式碼實現過程是這樣的：

    # encoding=utf8
     
    from PIL import Image
     
    def get_bin_table(threshold=115):
    	'''
    	獲取灰度轉二值的對映table
    	0表示黑色,1表示白色
    	'''
    	table = []
    	for i in range(256):
    		if i < threshold:
    			table.append(0)
    		else:
    			table.append(1)
    	return table
     
    def main():
    	image = Image.open('RandomPicture.png')
    	imgry = image.convert('L')
    	table = get_bin_table()
    	binary = imgry.point(table, '1')
    	binary.save('binary.png')
     
    if __name__ == '__main__':
    	main()

執行結果：

通過結果不難看出，我們已經將最開始的彩色圖由灰度圖轉變成了僅由黑白二色組成的圖片，實現了二值化。這裡需要說明的是，threshold引數值針對當前的驗證碼圖片合適，該值需要根據驗證碼型別不同進行除錯來確定。

然後我們再看看(0, 0)座標代表的畫素的顏色值是什麼：

    # encoding=utf8
     
    from PIL import Image
     
    def get_bin_table(threshold=115):
    	'''
    	獲取灰度轉二值的對映table
    	0表示黑色,1表示白色
    	'''
    	table = []
    	for i in range(256):
    		if i < threshold:
    			table.append(0)
    		else:
    			table.append(1)
    	return table
     
    def main():
    	image = Image.open('RandomPicture.png')
    	print 'image mode: ', image.mode
    	print image.getpixel((0, 0))
    	co = image.getcolors()
    	print co
    	print '-' * 40
    	imgry = image.convert('L')
    	print 'imgry mode: ', imgry.mode
    	print imgry.getpixel((0, 0))
    	co = imgry.getcolors()
    	print co
    	print '-' * 40
    	table = get_bin_table()
    	binary = imgry.point(table, '1')
    	print 'binary mode: ', binary.mode
    	print binary.getpixel((0, 0))
    	co = binary.getcolors()
    	print co
     
    if __name__ == '__main__':
    	main()

執行結果：

    image mode: RGB
    (21, 10, 26)
    None
    ----------------------------------------
    imgry mode: L
    15
    [(1, 2), (2, 3), (1, 4), (1, 5), (4, 6), (3, 8), (3, 9), (6, 10), (4, 11), (4, 12), (7, 13), (8, 14), (3, 15), (12, 16), (7, 17), (6, 18), (5, 19), (13, 20), (9, 21), (9, 22), (4, 23), (5, 24), (7, 25), (3, 26), (6, 27), (7, 28), (3, 29), (3, 30), (3, 31), (5, 32), (1, 33), (3, 35), (2, 36), (2, 37), (2, 38), (2, 39), (1, 41), (3, 42), (1, 43), (2, 44), (7, 45), (3, 46), (5, 47), (1, 48), (3, 49), (3, 50), (3, 51), (5, 52), (4, 53), (1, 54), (7, 55), (7, 56), (10, 57), (4, 58), (5, 59), (6, 60), (5, 61), (12, 62), (7, 63), (10, 64), (12, 65), (14, 66), (15, 67), (11, 68), (9, 69), (11, 70), (7, 71), (9, 72), (5, 73), (10, 74), (5, 75), (5, 76), (5, 77), (8, 78), (7, 79), (3, 80), (5, 81), (6, 82), (5, 83), (3, 84), (3, 85), (6, 86), (2, 87), (3, 88), (2, 90), (3, 91), (1, 93), (2, 94), (3, 95), (1, 96), (3, 97), (2, 99), (3, 100), (3, 101), (1, 102), (3, 104), (4, 105), (1, 106), (3, 108), (4, 110), (4, 111), (4, 112), (3, 113), (3, 114), (5, 115), (2, 116), (3, 117), (8, 118), (8, 119), (8, 120), (7, 121), (9, 122), (9, 123), (11, 124), (11, 125), (2, 126), (10, 127), (9, 128), (7, 129), (13, 130), (11, 131), (11, 132), (9, 133), (16, 134), (11, 135), (12, 136), (8, 137), (14, 138), (12, 139), (13, 140), (20, 141), (22, 142), (19, 143), (14, 144), (23, 145), (17, 146), (10, 147), (18, 148), (13, 149), (11, 150), (26, 151), (16, 152), (14, 153), (11, 154), (17, 155), (10, 156), (12, 157), (12, 158), (20, 159), (18, 160), (16, 161), (22, 162), (20, 163), (16, 164), (13, 165), (14, 166), (13, 167), (11, 168), (17, 169), (8, 170), (16, 171), (20, 172), (12, 173), (10, 174), (10, 175), (10, 176), (11, 177), (7, 178), (8, 179), (7, 180), (5, 181), (7, 182), (4, 183), (7, 184), (4, 185), (4, 186), (5, 187), (6, 188), (2, 189), (1, 190), (4, 191), (6, 192), (12, 193), (8, 194), (10, 195), (3, 196), (13, 197), (9, 198), (19, 199), (18, 200), (20, 201), (16, 202), (18, 203), (24, 204), (33, 205), (25, 206), (33, 207), (38, 208), (31, 209), (46, 210), (39, 211), (53, 212), (54, 213), (33, 214), (42, 215), (54, 216), (60, 217), (50, 218), (36, 219), (48, 220), (32, 221), (45, 222), (28, 223), (24, 224), (21, 225), (19, 226), (21, 227), (13, 228), (12, 229), (12, 230), (13, 231), (5, 232), (8, 233), (4, 234), (5, 235), (1, 236), (1, 237), (2, 238), (1, 239), (1, 240), (1, 242), (1, 243)]
    ----------------------------------------
    binary mode: 1
    0
    [(503, 0), (1993, 1)]

程式碼說明：

通過binary mode的值我們可以知道二值化後得到的圖片的畫素值由0或1表示，而且當前(0,
0)代表的畫素值的為0，它代表黑色，通過上面的圖片我們也可以知道，左上角頂點確實是黑色的。

上面的程式碼中我們還使用了getcolors方法，它用來返回畫素資訊，是一個含有元素的列表：[(該種畫素的數量，(該種畫素)),(...),...]，當該列表特別大的時候，它會返回None，這也是為什麼上面彩色圖片呼叫getcolors的時候會返回None。而[(503,
0), (1993, 1)]就表示我們得到的二值化黑白圖片，由503個黑色畫素點和1993個白色畫素點組成。

通過binary.size我們可以得到二值化後的黑白圖片的width和height值：(78,
32)，它就表示該圖片由78X32個畫素點組成，正好等於503+1993的和。(78,
32)也說明該圖片橫向上共有32行，每行有78個畫素點。將由0和1表示的圖片打印出來看一下：

    # encoding=utf8
     
    from PIL import Image
     
    def get_bin_table(threshold=115):
    	'''
    	獲取灰度轉二值的對映table
    	0表示黑色,1表示白色
    	'''
    	table = []
    	for i in range(256):
    		if i < threshold:
    			table.append(0)
    		else:
    			table.append(1)
    	return table
     
    def main():
    	image = Image.open('RandomPicture.png')
    	imgry = image.convert('L')
    	table = get_bin_table()
    	binary = imgry.point(table, '1')
    	width, height = binary.size
    	lis = binary.getdata()	# 返回圖片所有的畫素值，要使用list()才能顯示出具體數值
    	lis = list(lis)
    	start = 0
    	step = width
    	for i in range(height):
    		for p in lis[start: start+step]:
    			if p == 1:	# 將白色的點變成空格，方便人眼看
    				p = ' '
    			print p,
    		print
    		start += step
     
    if __name__ == '__main__':
    	main()

執行結果：

通過上面的結果已經大致可以看出該圖片表示的就是“959c”。

3.去除噪點

由上面的結果也不難看出，除了表示“959c”的“0”，圖片中還有其他的“0”代表的“噪點”，我們要儘可能的去除它們，方便後期的識別訓練。

對於去除噪點，我這裡也是借鑑了字元型圖片驗證碼識別完整過程及Python實現裡面的“九宮格”方法，程式碼實現：

    # encoding=utf8
     
    from PIL import Image
     
    def sum_9_region_new(img, x, y):
    	'''確定噪點 '''
    	cur_pixel = img.getpixel((x, y)) # 當前畫素點的值
    	width = img.width
    	height = img.height
     
    	if cur_pixel == 1: # 如果當前點為白色區域,則不統計鄰域值
    		return 0
     
    	# 因當前圖片的四周都有黑點，所以周圍的黑點可以去除
    	if y < 3: # 本例中，前兩行的黑點都可以去除
    		return 1
    	elif y > height - 3: # 最下面兩行
    		return 1
    	else: # y不在邊界
    		if x < 3: # 前兩列
    			return 1
    		elif x == width - 1: # 右邊非頂點
    			return 1
    		else: # 具備9領域條件的
    			sum = img.getpixel((x - 1, y - 1)) \
    				 + img.getpixel((x - 1, y)) \
    				 + img.getpixel((x - 1, y + 1)) \
    				 + img.getpixel((x, y - 1)) \
    				 + cur_pixel \
    				 + img.getpixel((x, y + 1)) \
    				 + img.getpixel((x + 1, y - 1)) \
    				 + img.getpixel((x + 1, y)) \
    				 + img.getpixel((x + 1, y + 1))
    			return 9 - sum
     
    def collect_noise_point(img):
    	'''收集所有的噪點'''
    	noise_point_list = []
    	for x in range(img.width):
    		for y in range(img.height):
    			res_9 = sum_9_region_new(img, x, y)
    			if (0 < res_9 < 3) and img.getpixel((x, y)) == 0: # 找到孤立點
    				pos = (x, y)
    				noise_point_list.append(pos)
    	return noise_point_list
     
    def remove_noise_pixel(img, noise_point_list):
    	'''根據噪點的位置資訊，消除二值圖片的黑點噪聲'''
    	for item in noise_point_list:
    		img.putpixel((item[0], item[1]), 1)
     
    def get_bin_table(threshold=115):
    	'''獲取灰度轉二值的對映table,0表示黑色,1表示白色'''
    	table = []
    	for i in range(256):
    		if i < threshold:
    			table.append(0)
    		else:
    			table.append(1)
    	return table
     
    def main():
    	image = Image.open('RandomPicture.png')
    	imgry = image.convert('L')
    	table = get_bin_table()
    	binary = imgry.point(table, '1')
    	noise_point_list = collect_noise_point(binary)
    	remove_noise_pixel(binary, noise_point_list)
    	binary.save('finaly.png')
     
    if __name__ == '__main__':
    	main()

執行結果：

通過截圖可以知道，我們已經去除了圖片四周的噪點以及一些孤立的噪點。

還要再說一句的就是，除了上面的步驟，我們還可以通過PIL的ImageEnhance,和ImageFilter對圖片做其他處理（例如增加對比度、亮度、銳化等），這裡就不舉例說明了，因為不同的圖片經過這些處理後，可能效果會不同。

最後，要感謝這些博主的分享，為我學習驗證碼識別相關知識提供了不少參考：

字元型圖片驗證碼識別完整過程及Python實現

Python3.5+sklearn 使用SVM自動識別字母驗證碼

python簡單驗證碼識別

基於Python的PIL庫學習（一）

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支援指令碼之家。

使用python PIL庫實現簡單驗證碼的去噪方法步驟

使用python PIL庫實現簡單驗證碼的去噪方法步驟

影象處理庫 pillow應用-驗證碼去噪

php結合GD庫實現中文驗證碼的簡單方法

java實現簡單驗證碼生成

python3 pillow模組實現簡單驗證碼

Python GUI自動化實現繞過驗證碼登入

python對接ihuyi實現簡訊驗證碼傳送

JavaScript實現簡單驗證碼

Python 模擬生成動態產生驗證碼圖片的方法

在Ant Design Pro登入功能中整合圖形驗證碼元件的方法步驟

Python利用Pillow(PIL)庫實現驗證碼圖片的全過程

Python基於內建庫pytesseract實現圖片驗證碼識別功能

python對驗證碼降噪的實現示例程式碼

python web框架Flask實現圖形驗證碼及驗證碼的動態重新整理例項

Python 點選指定位置驗證碼破解的實現程式碼

python實現圖片驗證碼

python 影象mode是什麼_Python PIL庫實現可設定閾值的二值影象轉換

重拾JAVA基礎13——簡單驗證碼實現

乾貨：用js實現的簡單驗證碼識別

SpringBoot 實現“圖片驗證碼”登入驗證功能【簡單例項】

使用python PIL庫實現簡單驗證碼的去噪方法步驟

相關推薦