1. 程式人生 > 其它 >文字分割之垂直投影法基於OpenCV(python)的實現

文字分割之垂直投影法基於OpenCV(python)的實現

技術標籤:文字分割與識別文字分割垂直投影法OpenCV

在我的上一篇部落格中講述了水平投影法取出文字行影象的實現,在這裡將用垂直投影法對文字行的每個字元進行分割。下圖是用水平投影法切割的文字行:
在這裡插入圖片描述
文字分割的原理如下,先用水平投影取出單一文字行,接著使用垂直投影法達到對單個字元進行分割。
程式碼如下:

import numpy as np 
import cv2 

def get_vvList(list_data):
    #取出list中畫素存在的區間
    vv_list=list()
    v_list=list()
    for index,i in enumerate
(list_data): if i>0: v_list.append(index) else: if v_list: vv_list.append(v_list) #list的clear與[]有區別 v_list=[] return vv_list if __name__=='__main__': img_bgr=cv2.imread('./testImg/2.png',1) if img_bgr.
any(): img=img_bgr.copy() img_gray=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY) #二值化 t,binary=cv2.threshold(img_gray,0,255,cv2.THRESH_OTSU+cv2.THRESH_BINARY) ''' 垂直投影為從上往下投射,統計每一列的黑色畫素總數 ''' rows,cols=binary.shape ver_list=[0]*cols for
j in range(cols): for i in range(rows): if binary.item(i,j)==0: ver_list[j]=ver_list[j]+1 ''' 對ver_list中的元素進行篩選,可以去除一些噪點 ''' ver_arr=np.array(ver_list) ver_arr[np.where(ver_arr<1)]=0 ver_list=ver_arr.tolist() #繪製垂直投影 img_white=np.ones(shape=(rows,cols),dtype=np.uint8)*255 for j in range(cols): pt1=(j,rows-1) pt2=(j,rows-1-ver_list[j]) cv2.line(img_white,pt1,pt2,(0,),1) cv2.imshow('垂直投影',img_white) cv2.waitKey(0) #切割單一字元 vv_list=get_vvList(ver_list) for i in vv_list: img_ver=img_bgr[:,i[0]:i[-1]] cv2.imshow('單一字元',img_ver) cv2.waitKey(0)

執行程式,垂直投影影象如下圖所示:
在這裡插入圖片描述
分割的單一字元如下圖:
在這裡插入圖片描述
單個數字已經正確分割出來了。