1. 程式人生 > >驗證碼/OCR影象識別預處理(去噪)

驗證碼/OCR影象識別預處理(去噪)

去噪

獲取影象紅色通道(字型一般是黑色的,去除印章等其它因素)
二值化
鄰域畫素演算法:

對於畫素值>245的鄰域畫素,判別為屬於背景色,如果一個畫素上下左右4各畫素值有超過2個畫素屬於背景色,那麼該畫素就是噪聲。

def depoint(img):   #input: gray image
    pixdata = img.load()
    w,h = img.size
    for y in range(1,h-1):
        for x in range(1,w-1):
            count = 0
            if pixdata[x,y-1] > 245:
                count = count + 1
            if pixdata[x,y+1] > 245:
                count = count + 1
            if pixdata[x-1,y] > 245:
                count = count + 1
            if pixdata[x+1,y] > 245:
                count = count + 1
            if count > 2:
                pixdata[x,y] = 255
    return img