貓狗識別訓練

阿新 • • 發佈：2020-12-01

下載資料集

下載地址：https://www.kaggle.com/c/dogs-vs-cats/data

下載的訓練集中有2.5W張貓貓狗狗的圖片，我這裡只用訓練集壓縮包就行了，驗證集和測試集都可以從中切分。

觀察圖片可得知命名方式，貓圖片為cat.數字.jpg，狗圖片為dog.數字.jpg，各有12500張。

規劃資料

資料需要分成三份：訓練集、驗證集和測試集。

我打算使用1.9W張圖片作為訓練集，4000張圖片作為驗證集，2000張圖片作為測試集。

import os,shutil
from tensorflow import keras
import matplotlib.pyplot as plt


#原始圖片存放目錄
origin_dir = './origin/train'

#訓練資料集儲存位置
base_dir = './data'

#訓練集 驗證集 測試集
train_dir = base_dir + '/train'
validation_dir = base_dir + '/validation'
test_dir = base_dir + '/test'

#如果目錄存在先刪掉
if True == os.path.exists(base_dir) :
    shutil.rmtree(base_dir)
os.makedirs(base_dir)

#建立子目錄
validation_dog_dir = validation_dir + '/dog'
validation_cat_dir = validation_dir + '/cat'
test_dog_dir = test_dir + '/dog'
test_cat_dir = test_dir + '/cat'
train_dog_dir = train_dir + '/dog'
train_cat_dir = train_dir + '/cat'

#建立目錄
os.makedirs(validation_dog_dir)
os.makedirs(validation_cat_dir)
os.makedirs(test_dog_dir)
os.makedirs(test_cat_dir)
os.makedirs(train_dog_dir)
os.makedirs(train_cat_dir)


#複製2000張狗圖片到驗證資料集狗目錄
files = ['dog.{}.jpg'.format(i) for i in range(2000)]
for file in files :
    src = os.path.join(origin_dir,file)
    dst = os.path.join(validation_dog_dir,file)
    shutil.copy(src,dst)

#複製2000張貓圖片到驗證資料集貓目錄
files = ['cat.{}.jpg'.format(i) for i in range(2000)]
for file in files :
    src = os.path.join(origin_dir,file)
    dst = os.path.join(validation_cat_dir,file)
    shutil.copy(src,dst)


#複製1000張狗圖片到測試資料集狗目錄
files = ['dog.{}.jpg'.format(i) for i in range(2000,3000)]
for file in files :
    src = os.path.join(origin_dir,file)
    dst = os.path.join(test_dog_dir,file)
    shutil.copy(src,dst)

#複製1000張貓圖片到測試資料集狗目錄
files = ['cat.{}.jpg'.format(i) for i in range(2000,3000)]
for file in files :
    src = os.path.join(origin_dir,file)
    dst = os.path.join(test_cat_dir,file)
    shutil.copy(src,dst)

#複製9500張狗圖片到訓練資料集狗目錄
files = ['dog.{}.jpg'.format(i) for i in range(3000,12500)]
for file in files :
    src = os.path.join(origin_dir,file)
    dst = os.path.join(train_dog_dir,file)
    shutil.copy(src,dst)

#複製9500張貓圖片到訓練資料集貓目錄
files = ['cat.{}.jpg'.format(i) for i in range(3000,12500)]
for file in files :
    src = os.path.join(origin_dir,file)
    dst = os.path.join(train_cat_dir,file)
    shutil.copy(src,dst)

搭建網路結構

img_width=350
img_height=350
img_channel = 3

model = keras.models.Sequential([
    keras.layers.Conv2D(32,(3,3),activation='relu',input_shape=(img_width,img_height,img_channel)),
    keras.layers.MaxPool2D((2,2)),
    keras.layers.Conv2D(64,(3,3),activation='relu'),
    keras.layers.MaxPool2D((2,2)),
    keras.layers.Conv2D(128,(3,3),activation='relu'),
    keras.layers.MaxPool2D((2,2)),
    keras.layers.Conv2D(128,(3,3),activation='relu'),
    keras.layers.MaxPool2D((2,2)),
    keras.layers.Flatten(),
    keras.layers.Dropout(0.3),
    keras.layers.Dense(512,activation='relu',kernel_regularizer=keras.regularizers.l2()),
    keras.layers.Dropout(0.3),
    keras.layers.Dense(1,activation='sigmoid')
])

四層卷積+兩層全連線，上了Dropout和正則化抑制過擬合。

模型編譯

優化器使用adam，損失函式使用二元交叉熵。

model.compile(optimizer='adam',loss='binary_crossentropy', metrics=['accuracy'])

資料生成器

由於資料量過大，先讀取後訓練會導致記憶體溢位，因此使用生成器的方式去訓練。

batch_size=32
epochs = 25

train_datagen = keras.preprocessing.image.ImageDataGenerator(rescale=1. / 255)
validation_datagen = keras.preprocessing.image.ImageDataGenerator(rescale=1. / 255)
test_datagen = keras.preprocessing.image.ImageDataGenerator(rescale=1. / 255)

train_generator = train_datagen.flow_from_directory(
    train_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='binary')

validation_generator = validation_datagen.flow_from_directory(
    validation_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='binary')

test_generator = test_datagen.flow_from_directory(
    test_dir,
    target_size=(img_width, img_height),
    batch_size=batch_size,
    class_mode='binary')

執行訓練

history = model.fit(
    train_generator,
    steps_per_epoch=train_generator.n // batch_size,
    epochs=epochs,
    validation_data=validation_generator,
    validation_steps=validation_generator.n // batch_size,
    verbose=1)

模型評估

score = model.evaluate(test_generator, steps=test_generator.n // batch_size)
print('測試準確率:{}, 測試loss值: {}'.format(score[1], score[0]))

視覺化acc和loss曲線

plt.rcParams['font.sans-serif']=['SimHei']
acc = history.history['accuracy']
val_acc = history.history['val_accuracy']
loss = history.history['loss']
val_loss = history.history['val_loss']

plt.subplot(1, 2, 1)
plt.plot(acc, label='訓練Acc')
plt.plot(val_acc, label='測試Acc')
plt.title('Acc曲線')
plt.legend()

plt.subplot(1, 2, 2)
plt.plot(loss, label='訓練Loss')
plt.plot(val_loss, label='測試Loss')
plt.title('Loss曲線')
plt.legend()
plt.show()

由於海量資料導致訓練的速度超慢，我跑一次程式大概要花費近兩小時，可想而知調參的過程會有多噁心，調了三天把準確率懟到90%左右，不想再懟了。

貓狗識別訓練

下載資料集下載地址：https://www.kaggle.com/c/dogs-vs-cats/data 下載的訓練集中有2.5W張貓貓狗狗的圖片，我這裡只用訓練集壓縮包就行了，驗證集和測試集都可以從中切分。觀察圖片可得知命名方式，貓圖片為cat.數字.jpg，狗圖片為dog.數字.jpg，各有1250

貓狗識別訓練-遷移學習

下載資料集下載地址：https://www.kaggle.com/c/dogs-vs-cats/data 下載的訓練集中有2.5W張貓貓狗狗的圖片，我這裡只用訓練測試集壓縮包就行了，驗證集和測試集都可以從中切分。觀察圖片可得知命名方式，貓圖片為cat.數字.jpg，狗圖片為dog.數字.jpg，各有12

TensorFlow 卷積神經網路之貓狗識別

本文邏輯：我從網上下載了十幾張貓和狗的圖片，用於檢驗我們訓練好的模型。處理我們下載的圖片載入模型將圖片輸入模型進行檢驗程式碼如下： #coding=utf-8 import tensorflow as tf from PIL import Image

TensorFlow詳解貓狗識別（一）--讀取自己的資料集

資料集下載連結: https://pan.baidu.com/s/1SlNAPf3NbgPyf93XluM7Fg 密碼: hpn4 資料集分別有12500張cat，12500張dog 讀取資料集資料集的讀取，查閱了那麼多文件，大致瞭解到，資料集的讀取方法大概會分為兩種

Keras 利用vgg16進行貓狗識別

前面我們介紹了基於Tensorflow使用vgg16 fine-tuning實現了貓狗大戰這裡採用keras實現vgg16 fine-tuning實現了貓狗大戰 1、資料的提取 import os import numpy as np import random

教程 | 貓狗識別 - AI圖片分類的樣例

貓狗識別 - AI圖片分類的樣例更多專案請檢視 https://www.flyai.com 專案官方網址該資料有貓和狗兩類圖片，一共有25000張圖片，貓狗各佔一半，可以用來做圖片分類的入門資料。樣例程式碼說明 app.yaml

tensorflow利用vgg19網路做貓狗識別的遷移學習

這是本人的第一次部落格，寫的不好請見諒哈。博主大二小菜鳥一個，歡迎指教和私信。樓主學習tensorflow也有一段時間了，最近嘗試了一下用vgg19網路做遷移學習。vgg結構如下:首先下載vgg19網路的mat檔案，然後對資料進行預處理，這裡博主借用了別人的處理方法，處理好的

貓狗識別（tensorflow）kaggle練習題

匯入貓狗圖片資料並標籤0和1.將圖片資料處理為 tf 能夠識別的資料格式，並將資料設計批次: 1）.get_files() 方法讀取圖片，然後根據圖片名，新增貓狗 label，然後再將 image和label 放到陣列中，打亂順序返回. 2）.將第一步處理

貓狗大戰-caffe模型訓練例項&NSDK識別執行

首先【caffe-Windows】安裝，請參考https://blog.csdn.net/zb1165048017/article/details/51355143（博主寫的非常詳細，避免了很多坑）注：如果出現libcaffe.lib無法開啟的錯誤且按照博主寫的策略無法解決，

卷積神經網絡入門（1）識別貓狗

關系圖像識別能力數字匿跡 ssi 圖像處理目標多個一下來自知乎按照我的理解，CNN的核心其實就是卷積核的作用，只要明白了這個問題，其余的就都是數學坑了（當然，相比較而言之後的數學坑更難）。如果學過數字圖像處理，對於卷積核的作用應該不陌生，比如你做一個最簡

tfrecord數據集訓練驗證-貓狗大戰

圖片大小 cat rac exc 兩個 bin span loss error: #!/usr/bin/env python # -*- coding:utf-8 -*- from mk_tfrecord import * #from model import * fr

Python使用tensorflow實現影象識別（貓狗大戰）-01

Python使用tensorflow實現影象識別（貓狗大戰）-01 import_data.py import tensorflow as tf import numpy as np import os #引入tensorflow、numpy、os 三個第三方模組 img_widt

Tensorflow學習筆記：資料集加工和轉化為TensorFlow專用格式——Finetuning，貓狗大戰，VGGNet的重新針對訓練

Kaggle 貓狗大戰貓狗大戰的資料集來源於Kaggle上的一個競賽：Dogs vs. Cats 貓狗大戰的資料集下載地址http://www.kaggle.com/c/dogs-vs-cats，其中資料集有12500只貓和12500只狗 ,官方資料集下載需要帳號，大

Tensorflow學習筆記：VGG16模型——Finetuning，貓狗大戰，VGGNet的重新針對訓練

這一篇介紹一下VGG16模型的修改 Step 1: 對模型的修改首先是對模型的修改（VGG16_model.py檔案），在這裡原先的輸出結果是對1000個不同的類別進行判定，而在此是對2個影象，也就是貓和狗的判斷，因此首先第一步就是修改輸出層的全連線資料。

Tensorflow學習筆記：VGG16訓練——Finetuning，貓狗大戰，VGGNet的重新針對訓練

這篇介紹如何用資料對vgg16進行訓練 Finetuning最重要的一個步驟就是模型的重新訓練與儲存。首先對於模型的值的輸出，在類中已經做了定義，因此只需要將定義的模型類初始化後輸出賦予一個特定的變數即可。 vgg = model.vgg16(x_imgs)

Python使用tensorflow實現影象識別（貓狗大戰）-02

import tensorflow as tf def inference(images, batch_size, n_classes): # cov1, shape = [kernel size, kernel size, channels, ke

使用pytorch完成kaggle貓狗影象識別

kaggle是一個為開發商和資料科學家提供舉辦機器學習競賽、託管資料庫、編寫和分享程式碼的平臺，在這上面有非常多的好專案、好資源可供機器學習、深度學習愛好者學習之用。碰巧最近入門了一門非常的深度學習框架：pytorch（如果你對pytorch不甚瞭解，請點選這裡），所以今天

如何用keras cnn 做kaggle貓狗大戰圖片識別

1、資料簡介這份資料集來源於Kaggle，原資料集有12500只貓和12500只狗，因單機cpu跑，這裡我只選取了2000張圖片，工具用的是基於tensorflow的keras。資料如下所示： 2、資料預處理這部分程式碼如下： impor

利用resnet 做kaggle貓狗大戰影象識別，秒上98準確率

1、資料介紹這份資料集來源於Kaggle，資料集有12500只貓和12500只狗。在這裡簡單介紹下整體思路 1、1從圖片中直接訓練一個小網路（作為基準方法），也就是普通的cnn方法 2、2後面我會用到最新的預訓練好的resnet等方法進行訓練 2

100天搞定機器學習|day40-42 Tensorflow Keras識別貓狗

100天搞定機器學習|1-38天 100天搞定機器學習|day39 Tensorflow Keras手寫數字識別前文我們用keras的Sequential 模型實現mnist手寫數字識別，準確率0.9713。今天我們完成day40-42的課程，實現貓、狗的識別。本文資料集下載地址 https://down

貓狗識別訓練

下載資料集

規劃資料

搭建網路結構

模型編譯

資料生成器

執行訓練

模型評估

視覺化acc和loss曲線

相關推薦