TensorFlow2.X結合OpenCV 實現手勢識別功能

阿新 • • 發佈：2020-04-09

使用Tensorflow 構建卷積神經網路，訓練手勢識別模型，使用opencv DNN 模組載入模型實時手勢識別
效果如下：

在這裡插入圖片描述

先顯示下部分資料集圖片（0到9的表示，感覺很怪）

在這裡插入圖片描述

構建模型進行訓練

資料集地址

import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import datasets,layers,optimizers,Sequential,metrics
from tensorflow.python.framework.convert_to_constants import convert_variables_to_constants_v2
import os 
import pathlib
import random
import matplotlib.pyplot as plt
os.environ['TF_CPP_MIN_LOG_LEVEL']='2'
def read_data(path):
  path_root = pathlib.Path(path)
  # print(path_root)
  # for item in path_root.iterdir():
  #   print(item)
  image_paths = list(path_root.glob('*/*'))
  image_paths = [str(path) for path in image_paths]
  random.shuffle(image_paths)
  image_count = len(image_paths)
  # print(image_count)
  # print(image_paths[:10])
  label_names = sorted(item.name for item in path_root.glob('*/') if item.is_dir())
  # print(label_names)
  label_name_index = dict((name,index) for index,name in enumerate(label_names))
  # print(label_name_index)
  image_labels = [label_name_index[pathlib.Path(path).parent.name] for path in image_paths]
  # print("First 10 labels indices: ",image_labels[:10])
  return image_paths,image_labels,image_count
def preprocess_image(image):
  image = tf.image.decode_jpeg(image,channels=3)
  image = tf.image.resize(image,[100,100])
  image /= 255.0 # normalize to [0,1] range
  # image = tf.reshape(image,[100*100*3])
  return image
def load_and_preprocess_image(path,label):
  image = tf.io.read_file(path)
  return preprocess_image(image),label
def creat_dataset(image_paths,bitch_size):
  db = tf.data.Dataset.from_tensor_slices((image_paths,image_labels))
  dataset = db.map(load_and_preprocess_image).batch(bitch_size)  
  return dataset
def train_model(train_data,test_data):
  #構建模型
  network = keras.Sequential([
      keras.layers.Conv2D(32,kernel_size=[5,5],padding="same",activation=tf.nn.relu),keras.layers.MaxPool2D(pool_size=[2,2],strides=2,padding='same'),keras.layers.Conv2D(64,kernel_size=[3,3],keras.layers.Flatten(),keras.layers.Dense(512,activation='relu'),keras.layers.Dropout(0.5),keras.layers.Dense(128,keras.layers.Dense(10)])
  network.build(input_shape=(None,100,3))
  network.summary()
  network.compile(optimizer=optimizers.SGD(lr=0.001),loss=tf.losses.SparseCategoricalCrossentropy(from_logits=True),metrics=['accuracy']
  )
  #模型訓練
  network.fit(train_data,epochs = 100,validation_data=test_data,validation_freq=2) 
  network.evaluate(test_data)
  tf.saved_model.save(network,'D:\\code\\PYTHON\\gesture_recognition\\model\\')
  print("儲存模型成功")
  # Convert Keras model to ConcreteFunction
  full_model = tf.function(lambda x: network(x))
  full_model = full_model.get_concrete_function(
  tf.TensorSpec(network.inputs[0].shape,network.inputs[0].dtype))
  # Get frozen ConcreteFunction
  frozen_func = convert_variables_to_constants_v2(full_model)
  frozen_func.graph.as_graph_def()

  layers = [op.name for op in frozen_func.graph.get_operations()]
  print("-" * 50)
  print("Frozen model layers: ")
  for layer in layers:
    print(layer)

  print("-" * 50)
  print("Frozen model inputs: ")
  print(frozen_func.inputs)
  print("Frozen model outputs: ")
  print(frozen_func.outputs)

  # Save frozen graph from frozen ConcreteFunction to hard drive
  tf.io.write_graph(graph_or_graph_def=frozen_func.graph,logdir="D:\\code\\PYTHON\\gesture_recognition\\model\\frozen_model\\",name="frozen_graph.pb",as_text=False)
  print("模型轉換完成，訓練結束")


if __name__ == "__main__":
  print(tf.__version__)
  train_path = 'D:\\code\\PYTHON\\gesture_recognition\\Dataset'
  test_path = 'D:\\code\\PYTHON\\gesture_recognition\\testdata' 
  image_paths,_ = read_data(train_path)
  train_data = creat_dataset(image_paths,16)
  image_paths,_ = read_data(test_path)
  test_data = creat_dataset(image_paths,16)
  train_model(train_data,test_data)

OpenCV載入模型，實時檢測

這裡為了簡化檢測使用了ROI。

import cv2
from cv2 import dnn
import numpy as np
print(cv2.__version__)
class_name = ['0','1','2','3','4','5','6','7','8','9']
net = dnn.readNetFromTensorflow('D:\\code\\PYTHON\\gesture_recognition\\model\\frozen_model\\frozen_graph.pb')
cap = cv2.VideoCapture(0)
i = 0
while True:
  _,frame= cap.read() 
  src_image = frame
  cv2.rectangle(src_image,(300,100),(600,400),(0,255,0),1,4)
  frame = cv2.cvtColor(frame,cv2.COLOR_BGR2RGB)
  pic = frame[100:400,300:600]
  cv2.imshow("pic1",pic)
  # print(pic.shape)
  pic = cv2.resize(pic,(100,100))
  blob = cv2.dnn.blobFromImage(pic,scalefactor=1.0/225.,size=(100,mean=(0,swapRB=False,crop=False)
  # blob = np.transpose(blob,2,3,1))             
  net.setInput(blob)
  out = net.forward()
  out = out.flatten()

  classId = np.argmax(out)
  # print("classId",classId)
  print("預測結果為：",class_name[classId])
  src_image = cv2.putText(src_image,str(classId),cv2.FONT_HERSHEY_SIMPLEX,255),4)
  # cv.putText(img,text,org,fontFace,fontScale,fontcolor,thickness,lineType)
  cv2.imshow("pic",src_image)
  if cv2.waitKey(10) == ord('0'):
    break

小結

這裡本質上還是一個影象分類任務。而且，樣本數量較少。優化的時候需要做資料增強，還需要防止過擬合。

到此這篇關於TensorFlow2.X結合OpenCV 實現手勢識別功能的文章就介紹到這了,更多相關TensorFlow OpenCV 手勢識別內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

TensorFlow2.X結合OpenCV 實現手勢識別功能

使用Tensorflow 構建卷積神經網路，訓練手勢識別模型，使用opencv DNN 模組載入模型實時手勢識別

tensorflow1.x及tensorflow2.x不同版本實現驗證碼識別

近一個假期，入坑深度學習，先從能看得著的驗證碼識別入門。從B站看了幾天的黑馬程式設計師的“3天帶你玩轉python深度學習後“，一是將教程中提到的程式碼一一碼出來；二是針對不同的tensorflow版本，結合

python+opencv實現車牌定位功能(例項程式碼)

寫在前面 HIT大三上學期視聽覺訊號處理課程中視覺部分的實驗三，經過和學長們實驗的對比發現每一級實驗要求都不一樣，因此這裡標明瞭是2019年秋季學期的視覺實驗三。

Python下應用opencv 實現人臉檢測功能

使用OpenCV\'s Haar cascades作為人臉檢測，因為他做好了庫，我們只管使用。程式碼簡單，除去註釋，總共有效程式碼只有10多行。

OpenCV實現人臉檢測功能

本文例項為大家分享了OpenCV實現人臉檢測功能的具體程式碼，供大家參考，具體內容如下

python實現手勢識別的示例（入門）

使用open-cv實現簡單的手勢識別。剛剛接觸python不久，看到了很多有意思的專案，尤其時關於計算機視覺的。網上搜到了一些關於手勢處理的實驗，我在這兒簡單的實現一下（PS：和那些大佬比起來真的是差遠了，畢竟剛接觸

基於opencv實現簡單畫板功能

OpenCV提供了很多簡單的語句，實現複雜的功能，根據顏色和滑鼠互動的基礎語句，我們可以建立一個簡單的畫板。儘管它簡單，但是製作的框架步驟不能少。

通過 ML.NET 使用預訓練殘差網路 ResNet 模型實現手勢識別

之前我寫過的一篇《基於 ONNX 在 ML.NET 中使用 Pytorch 訓練的垃圾分類模型》，介紹到了 ML.NET 是如何實現影象分類的，此後我收到好多留言提出了更多的場景，比如某個線上學習應用，希望學生按照視訊的要求做一個指

Python實現手勢識別

　　這是借鑑了github上的一個源程式，參考源：https://github.com/lzane/Fingers-Detection-using-OpenCV-and-Python

python基於opencv實現人臉識別

將opencv中haarcascade_frontalface_default.xml檔案下載到本地，我們呼叫它輔助進行人臉識別。

基於openCV的手勢識別

技術標籤：人臉識別python 文章目錄捕捉攝像頭(獲取視訊)膚色檢測輪廓處理全部程式碼

微信小程式使用同聲傳譯實現語音識別功能

　　我使用同聲傳譯語音識別功能是為了實現微信小程式首頁的語音搜尋功能，如果你也是那麼恭喜你，你可以ctrl+c、ctrl+v再改一改，如果你不是那麼你也不要著急的走可以看完我的文章會對你有所幫助！

jquery結合css實現返回頂部功能

操作 CSS $(\"\").css(name|pro|[,val|fn]) 位置 $(\"\").offset([coordinates]) $(\"\").position() $(\"\").scrollTop([val])

手語也能機器翻譯了！機器學習手勢識別功能瞭解一下

華為機器學習（ML Kit）提供手部關鍵點識別服務，可用於手語識別。手部關鍵點識別服務能識別手部21個關鍵點，通過每個手指的方向和手語規則作比較去找手語字母表。

微信小程式實現人臉識別功能

該功能分為兩步：第一步判斷使用裝置是否支援人臉識別功能： checkIsSupportFacialRecognition()

微信小程式結合laravel8實現點贊功能

wx.ml <view bindtap=\"haveSave\" data-id=\"{{headHouseDetails.id}}\"> <view> <image class=\"save \" src=\"{{isClick?\'/images/shou(1)(1).png\':\'/images/shou1.png\'}}\" style=\"width:

SpringBoot實現人臉識別功能

一、人臉註冊 step1：人像採集。在註冊頁面上用html中video元件和js呼叫筆記本攝像頭，並抓取人像圖片。沒有攝像頭的筆記本、桌上型電腦的童鞋告辭吧，走好不送。。。

結合OpenCV與TensorFlow進行人臉識別的實現

作為新手來說，這是一個最簡單的人臉識別模型，難度不大，程式碼量也不算多，下面就逐一來講解，資料集的準備就不多說了，因人而異。

Android實現自定義手勢和識別手勢的功能

1. 先完成自定義手勢的Activity 1.1 因為需要儲存手勢檔案所以需要宣告許可權：

OpenCV+Python3.5 簡易手勢識別的實現

檢測剪刀石頭布三種手勢，通過攝像頭輸入，方法如下：選用合適顏色空間及閾值提取面板部分

TensorFlow2.X結合OpenCV 實現手勢識別功能

相關推薦