Python影象識別+KNN求解數獨的實現

阿新 • • 發佈：2020-11-15

Python-opencv+KNN求解數獨

最近一直在玩數獨，突發奇想實現影象識別求解數獨，輸入到輸出平均需要0.5s。

整體思路大概就是識別出圖中數字生成list，然後求解。

輸入輸出demo

數獨採用的是微軟自帶的Microsoft sudoku軟體隨便擷取的影象，如下圖所示：

Microsoft sudoku中Grandmaster級別

經過程式求解後，得到的結果如下圖所示：

在這裡插入圖片描述

程式具體流程

程式整體流程如下圖所示：

數獨求解流程圖

讀入影象後，根據求解輪廓資訊找到數字所在位置，以及不包含數字的空白位置，提取數字資訊通過KNN識別，識別出數字；無數字資訊的在list中置0；生成未求解數獨list，之後求解數獨，將資訊在原圖中顯示出來。

# -*-coding:utf-8-*-
import os
import cv2 as cv
import numpy as np
import time

####################################################
#尋找數字生成list
def find_dig_(img,train_set):
  if img is None:
    print("無效的圖片！")
    os._exit(0)
    return
  _,thre = cv.threshold(img,230,250,cv.THRESH_BINARY_INV)
  _,contours,hierarchy = cv.findContours(thre,cv.RETR_TREE,cv.CHAIN_APPROX_SIMPLE)
  sudoku_list = []
  boxes = []
  for i in range(len(hierarchy[0])):
    if hierarchy[0][i][3] == 0: # 表示父輪廓為 0
      boxes.append(hierarchy[0][i])
  # 提取數字
  nm = []
  for j in range(len(boxes)):  # 此處len(boxes)=81
    if boxes[j][2] != -1:
      x,y,w,h = cv.boundingRect(contours[boxes[j][2]])
      nm.append([x,h])
      # 在原圖中框選各個數字
      cropped = img[y:y + h,x:x + w]
      im = img_pre(cropped)			#預處理
      AF = incise(im)				#切割數字影象
      result = identification(train_set,AF,7)		#knn識別
      sudoku_list.insert(0,int(result))				#生成list
    else:
      sudoku_list.insert(0,0)
      
  if len(sudoku_list) == 81:
    sudoku_list= np.array(sudoku_list)
    sudoku_list= sudoku_list.reshape((9,9))
    print("old_sudoku -> \n",sudoku_list)
    return sudoku_list,hierarchy
  else:
    print("無效的圖片！")
    os._exit(0)

######################################################
#KNN演算法識別數字
def img_pre(cropped):
  # 預處理數字影象
  im = np.array(cropped) # 轉化為二維陣列
  for i in range(im.shape[0]): # 轉化為二值矩陣
    for j in range(im.shape[1]):
      # print(im[i,j])
      if im[i,j] != 255:
        im[i,j] = 1
      else:
        im[i,j] = 0
  return im


# 提取圖片特徵
def feature(A):
  midx = int(A.shape[1] / 2) + 1
  midy = int(A.shape[0] / 2) + 1
  A1 = A[0:midy,0:midx].mean()
  A2 = A[midy:A.shape[0],0:midx].mean()
  A3 = A[0:midy,midx:A.shape[1]].mean()
  A4 = A[midy:A.shape[0],midx:A.shape[1]].mean()
  A5 = A.mean()
  AF = [A1,A2,A3,A4,A5]
  return AF


# 切割圖片並返回每個子圖片特徵
def incise(im):
  # 豎直切割並返回切割的座標
  a = [];
  b = []
  if any(im[:,0] == 1):
    a.append(0)
  for i in range(im.shape[1] - 1):
    if all(im[:,i] == 0) and any(im[:,i + 1] == 1):
      a.append(i + 1)
    elif any(im[:,i] == 1) and all(im[:,i + 1] == 0):
      b.append(i + 1)
  if any(im[:,im.shape[1] - 1] == 1):
    b.append(im.shape[1])
  # 水平切割並返回分割圖片特徵
  names = locals();
  AF = []
  for i in range(len(a)):
    names['na%s' % i] = im[:,range(a[i],b[i])]
    if any(names['na%s' % i][0,:] == 1):
      c = 0
    else:
      for j in range(names['na%s' % i].shape[0]):
        if j < names['na%s' % i].shape[0] - 1:
          if all(names['na%s' % i][j,:] == 0) and any(names['na%s' % i][j + 1,:] == 1):
            c = j
            break
        else:
          c = j
    if any(names['na%s' % i][names['na%s' % i].shape[0] - 1,:] == 1):
      d = names['na%s' % i].shape[0] - 1
    else:
      for j in range(names['na%s' % i].shape[0]):
        if j < names['na%s' % i].shape[0] - 1:
          if any(names['na%s' % i][j,:] == 1) and all(names['na%s' % i][j + 1,:] == 0):
            d = j + 1
            break
        else:
          d = j
    names['na%s' % i] = names['na%s' % i][range(c,d),:]
    AF.append(feature(names['na%s' % i])) # 提取特徵
    for j in names['na%s' % i]:
      pass
  return AF


# 訓練已知圖片的特徵
def training():
  train_set = {}
  for i in range(9):
    value = []
    for j in range(15):
      ima = cv.imread('E:/test_image/knn_test/{}/{}.png'.format(i + 1,j + 1),0)
      im = img_pre(ima)
      AF = incise(im)
      value.append(AF[0])
    train_set[i + 1] = value

  return train_set


# 計算兩向量的距離
def distance(v1,v2):
  vector1 = np.array(v1)
  vector2 = np.array(v2)
  Vector = (vector1 - vector2) ** 2
  distance = Vector.sum() ** 0.5
  return distance


# 用最近鄰演算法識別單個數字
def knn(train_set,V,k):
  key_sort = [11] * k
  value_sort = [11] * k
  for key in range(1,10):
    for value in train_set[key]:
      d = distance(V,value)
      for i in range(k):
        if d < value_sort[i]:
          for j in range(k - 2,i - 1,-1):
            key_sort[j + 1] = key_sort[j]
            value_sort[j + 1] = value_sort[j]
          key_sort[i] = key
          value_sort[i] = d
          break
  max_key_count = -1
  key_set = set(key_sort)
  for key in key_set:
    if max_key_count < key_sort.count(key):
      max_key_count = key_sort.count(key)
      max_key = key
  return max_key


# 生成數字
def identification(train_set,k):
  result = ''
  for i in AF:
    key = knn(train_set,i,k)
    result = result + str(key)
  return result



######################################################
######################################################
#求解數獨
def get_next(m,x,y):
  # 獲得下一個空白格在數獨中的座標。
  :param m 數獨矩陣
  :param x 空白格行數
  :param y 空白格列數
  """
  for next_y in range(y + 1,9): # 下一個空白格和當前格在一行的情況
    if m[x][next_y] == 0:
      return x,next_y
  for next_x in range(x + 1,9): # 下一個空白格和當前格不在一行的情況
    for next_y in range(0,9):
      if m[next_x][next_y] == 0:
        return next_x,next_y
  return -1,-1 # 若不存在下一個空白格，則返回 -1，-1


def value(m,y):
  # 返回符合"每個橫排和豎排以及九宮格內無相同數字"這個條件的有效值。
 
  i,j = x // 3,y // 3
  grid = [m[i * 3 + r][j * 3 + c] for r in range(3) for c in range(3)]
  v = set([x for x in range(1,10)]) - set(grid) - set(m[x]) - \
    set(list(zip(*m))[y])
  return list(v)


def start_pos(m):
  # 返回第一個空白格的位置座標
  for x in range(9):
    for y in range(9):
      if m[x][y] == 0:
        return x,y
  return False,False # 若數獨已完成，則返回 False,False


def try_sudoku(m,y):
  # 試著填寫數獨
  for v in value(m,y):
    m[x][y] = v
    next_x,next_y = get_next(m,y)
    if next_y == -1: # 如果無下一個空白格
      return True
    else:
      end = try_sudoku(m,next_x,next_y) # 遞迴
      if end:
        return True
      m[x][y] = 0 # 在遞迴的過程中，如果數獨沒有解開，
      # 則回溯到上一個空白格


def sudoku_so(m):
  x,y = start_pos(m)
  try_sudoku(m,y)
  print("new_sudoku -> \n",m)
  return m

###################################################
# 將結果繪製到原圖
def draw_answer(img,hierarchy,new_sudoku_list ):
  new_sudoku_list = new_sudoku_list .flatten().tolist()
  for i in range(len(contours)):
    cnt = contours[i]
    if hierarchy[0,-1] == 0:
      num = new_soduku_list.pop(-1)
      if hierarchy[0,2] == -1:
        x,h = cv.boundingRect(cnt)
        cv.putText(img,"%d" % num,(x + 19,y + 56),cv.FONT_HERSHEY_SIMPLEX,1.8,(0,255),2) # 填寫數字
  cv.imwrite("E:/answer.png",img)


if __name__ == '__main__':
  t1 = time.time()
  train_set = training()
  img = cv.imread('E:/test_image/python_test_img/Sudoku.png')
  img_gray = cv.cvtColor(img,cv.COLOR_BGR2GRAY)
  sudoku_list,hierarchy = find_dig_(img_gray,train_set)
  new_sudoku_list = sudoku_so(sudoku_list)
  draw_answer(img,new_sudoku_list )
  print("time :",time.time()-t1)

PS：

使用KNN演算法需要建立訓練集，數獨中共涉及9個數字，“1,2,3,4,5,6,7,8,9”各15幅圖放入資料夾中，如下圖所示。

KNN訓練集

到此這篇關於Python影象識別+KNN求解數獨的實現的文章就介紹到這了,更多相關Python KNN求解數獨內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

Python影象識別+KNN求解數獨的實現

Python-opencv+KNN求解數獨最近一直在玩數獨，突發奇想實現影象識別求解數獨，輸入到輸出平均需要0.5s。

python用TensorFlow做影象識別的實現

一、TensorFlow簡介 TensorFlow是由谷歌開發的一套機器學習的工具，使用方法很簡單，只需要輸入訓練資料位置，設定引數和優化方法等，TensorFlow就可以將優化結果顯示出來，節省了很大量的程式設計時間，TensorFlow的

Python實戰案例，影象識別技術OpenCV，Python實現貓臉檢測

前言：利用Python+OpenCV實現貓臉檢測。讓我們愉快地開始吧~~~ 開發工具 Python版本：3.6.4

用Python解數獨的方法示例

芬蘭數學家因卡拉花費3個月時間設計出的世界上迄今難度最大的數獨。數獨是 9 橫 9 豎共有 81 個格子，同時又分為 9 個九宮格。規則很簡單：每個空格填入 1~9 任意一個數字，需要保證每個橫排和豎排以及九宮格內無相同

python讀取dicom影象示例(SimpleITK和dicom包實現)

1. 用SimpleITK讀取dicom序列： import SimpleITK as sitk import numpy as np img_path=\'F:\\\\dataset\\\\pancreas\\\\Output\\\\thick\\\\original\\\\1\'

Python影象處理庫PIL中影象格式轉換的實現

　　在數字影象處理中，針對不同的影象格式有其特定的處理演算法。所以，在做影象處理之前，我們需要考慮清楚自己要基於哪種格式的影象進行演算法設計及其實現。本文基於這個需求，使用python中的影象處理庫PIL來實現

使用Python和百度語音識別生成視訊字幕的實現

從視訊中提取音訊安裝 moviepy pip install moviepy 相關程式碼： audio_file = work_path + \'\\\\out.wav\'

超全Python影象處理講解(多模組實現)

Pillow模組講解一、Image模組 1.1 、開啟圖片和顯示圖片對圖片的處理最基礎的操作就是開啟這張圖片，我們可以使用Image模組中的open(fp,mode)方法，來開啟圖片。open方法接收兩個引數，第一個是檔案路徑，第二個是

python+selenium2自動化---使用pytesseract和Pillow實現驗證碼識別

這種方式只能對簡單的驗證碼起作用，複雜的就獲取不到了。驗證碼識別思路：

產業AI實踐中，如何有效提升影象識別精度、實現極小目標檢測？ | 百度AI公開課報名...

位來發自凹非寺量子位報道 | 公眾號 QbitAI 目前，各個企業行業在AI落地應用中，常常會遇到極小目標檢測問題。

機器學習之 KNN近鄰演算法（三）影象識別

一、影象基礎知識 1）影象（如rpg格式）由畫素點組成　　400*300意思是行400畫素點，列300畫素點

[Python影象處理] 三十二.傅立葉變換（影象去噪）與霍夫變換（特徵識別）萬字詳細總結

此文轉載自：https://blog.csdn.net/Eastmount/article/details/110487868 該系列文章是講解Python OpenCV影象處理知識，前期主要講解影象入門、OpenCV基礎用法，中期講解影象處理的各種演算法，包括影象銳化運

【python】KNN(K近鄰演算法)實現及視覺化

技術標籤：Pythonpython機器學習文章目錄 KNN(K近鄰演算法)實現及視覺化1 演算法描述：2 KNN演算法的Python實現：2.1 實踐問題背景：2.2 目標：2.3 資料集：2.4 要求：2.5 實施步驟：

python 影象mode是什麼_Python PIL庫實現可設定閾值的二值影象轉換

技術標籤：python 影象mode是什麼前言最近一直在做深度學習影象分割方面的專案，本來是個很簡單的二分類問題，但是最後輸出後卻發現不僅僅是0和255兩種畫素型別，後來思考後才發現他輸出的是類似於置信度的東

python 自動識別並連線串列埠的實現

這個屬於我專案中一個函式，跟大家分享一下我的思路及最終實現在編寫串列埠通訊工具中，需要實現一個函式，自動找到對應com 口，並且連線該com口，保證後續通訊正常

python 影象的拉普拉斯變換中的數值問題_從頭開始在python中實現拉普拉斯斑點檢測器...

技術標籤：python 影象的拉普拉斯變換中的數值問題 Harris Corner Detector生成的特徵對於縮放不是不變的。對於特徵跟蹤，我們需要對仿射變換不變的特徵。拉普拉斯斑點檢測器是生成對縮放不變的特徵的基本方法之

【Python學習】影象識別-驗證二維碼

tesseract.exe 下載：https://digi.bib.uni-mannheim.de/tesseract/ 第一次用Pycharm使用tesseract的時候需要修改一下pytesseract.py中的tesseract_cmd指向的路徑c:\\py368\\Lib\\site-packages\\pytesseract\\py

python人臉識別專案之學習筆記（五）：TensorFlow實現卷積，激勵，池化 +全連線

需要學習的知識點如何使用卷積，激勵，池化如何使用全連線最近看了一位大佬寫的對卷積的理解寫得非常詳細，可以參考這篇部落格 https://blog.csdn.net/v_JULY_v/article/details/51812459如何用程式碼實現卷

光纖顯微影象中的斑點識別方法研究及系統實現

關鍵詞：顯微影象處理、顯微影象識別、均勻度一、選題背景及意義　　計算機影象處理技術快速發展，在各行各業中起著越來越重要的作用，顯微影象識別方法的研究成為當今影象處理的重要組成部分。

python opencv影象識別（相同大小圖片）

簡介由於專案需要對比兩張相同圖片的相似度，因此採用opencv將圖片轉為灰階陣列，然後對比相應的陣列來取相似度，此方法只適用於大小相同的圖片，較為侷限

Python影象識別+KNN求解數獨的實現

相關推薦