TensorFlow dataset.shuffle、batch、repeat的使用詳解

阿新 • • 發佈：2020-01-22

直接看程式碼例子，有詳細註釋！！

import tensorflow as tf
import numpy as np


d = np.arange(0,60).reshape([6,10])

# 將array轉化為tensor
data = tf.data.Dataset.from_tensor_slices(d)

# 從data資料集中按順序抽取buffer_size個樣本放在buffer中，然後打亂buffer中的樣本
# buffer中樣本個數不足buffer_size，繼續從data資料集中安順序填充至buffer_size，
# 此時會再次打亂
data = data.shuffle(buffer_size=3)

# 每次從buffer中抽取4個樣本
data = data.batch(4)

# 將data資料集重複，其實就是2個epoch資料集
data = data.repeat(2)

# 構造獲取資料的迭代器
iters = data.make_one_shot_iterator()

# 每次從迭代器中獲取一批資料
batch = iters.get_next()

sess = tf.Session()

sess.run(batch)
# 資料集完成遍歷完之後，繼續抽取的話會報錯：OutOfRangeError

In [21]: d
Out[21]: 
array([[ 0,1,2,3,4,5,6,7,8,9],[10,11,12,13,14,15,16,17,18,19],[20,21,22,23,24,25,26,27,28,29],[30,31,32,33,34,35,36,37,38,39],[40,41,42,43,44,45,46,47,48,49],[50,51,52,53,54,55,56,57,58,59]])
In [22]: sess.run(batch)
Out[22]: 
array([[ 0,19]])

In [23]: sess.run(batch)
Out[23]: 
array([[40,59]])

從輸出結果可以看出：

shuffle是按順序將資料放入buffer裡面的；

當repeat函式在shuffle之後的話，是將一個epoch的資料集抽取完畢，再進行下一個epoch的。

那麼，當repeat函式在shuffle之前會怎麼樣呢？如下：

data = data.repeat(2)

data = data.shuffle(buffer_size=3)

data = data.batch(4)

In [25]: sess.run(batch)
Out[25]: 
array([[10,[ 0,49]])

In [26]: sess.run(batch)
Out[26]: 
array([[50,59],39]])

In [27]: sess.run(batch)
Out[27]: 
array([[10,49]])

可以看出，其實它就是先將資料集複製一遍，然後把兩個epoch當成同一個新的資料集，一直shuffle和batch下去。

以上這篇TensorFlow dataset.shuffle、batch、repeat的使用詳解就是小編分享給大家的全部內容了，希望能給大家一個參考，也希望大家多多支援我們。

TensorFlow dataset.shuffle、batch、repeat的使用詳解

直接看程式碼例子，有詳細註釋！！ import tensorflow as tf import numpy as np d = np.arange(0,60).reshape([6,10])

tensorflow dataset.shuffle、dataset.batch、dataset.repeat順序區別詳解

1.作用 dataset.shuffle作用是將資料進行打亂操作，傳入引數為buffer_size，改引數為設定“打亂快取區大小”，也就是說程式會維持一個buffer_size大小的快取，每次都會隨機在這個快取區抽取一定數量的資料

C#中HttpWebRequest、WebClient、HttpClient的使用詳解

HttpWebRequest: 名稱空間： System.Net，這是.NET建立者最初開發用於使用HTTP請求的標準類。使用HttpWebRequest可以讓開發者控制請求/響應流程的各個方面，如 timeouts,cookies,headers,protocols。另一個好處是Ht

@Controller、@RestController註解區別詳解

@Controller、@RestController註解區別： @RestController 註解相當於 @Controller ＋ @ResponseBody 合在一起的作用。

Windows下mysql-5.7.28下載、安裝、配置教程圖文詳解

最近需要更換mysql資料庫的版本，寫一篇文章，記錄一下一、下載mysql資料庫 mysql的下載共有兩種，一種是zip壓縮檔案，另一種是msi安裝程式

MySQL觸發器概念、原理與用法詳解

本文例項講述了MySQL觸發器概念、原理與用法。分享給大家供大家參考，具體如下：

MySQL高階學習筆記（三）：Mysql邏輯架構介紹、mysql儲存引擎詳解

Mysql邏輯架構介紹總體概覽和其它資料庫相比，MySQL有點與眾不同，它的架構可以在多種不同場景中應用併發揮良好作用。主要體現在儲存引擎的架構上，外掛式的儲存引擎架構將查詢處理和其它的系統任務以及資料的儲存提

Redis事務涉及的watch、multi等命令詳解

Redis Watch 命令作用：用於監視一個(或多個) key ，如果在事務執行之前這個(或這些) key 被其他命令所改動，那麼事務將被打斷。

Redis原始碼解析:叢集手動故障轉移、從節點遷移詳解

一：手動故障轉移 Redis叢集支援手動故障轉移。也就是向從節點發送”CLUSTER FAILOVER”命令，使其在主節點未下線的情況下，發起故障轉移流程，升級為新的主節點，而原來的主節點降級為從節點。

Pandas時間序列重取樣(resample)方法中closed、label的作用詳解

Pandas提供了便捷的方式對時間序列進行重取樣，根據時間粒度的變大或者變小分為降取樣和升取樣：

Python 裝飾器原理、定義與用法詳解

本文例項講述了Python 裝飾器原理、定義與用法。分享給大家供大家參考，具體如下：

對python中assert、isinstance的用法詳解

1. assert 函式說明： Assert statements are a convenient way to insert debugging assertions into a program:

Numpy中對向量、矩陣的使用詳解

在下面的程式碼裡面，我們利用numpy和scipy做了很多工作，每一行都有註釋，講解了對應的向量/矩陣操作。

MongoDB資料庫安裝配置、基本操作例項詳解

本文例項講述了MongoDB資料庫安裝配置、基本操作。分享給大家供大家參考，具體如下：

mac下redis安裝、設定、啟動停止方法詳解

需要下載release版本，下載地址： http://download.redis.io/releases/ 我這裡下載的是：

python判斷變數是否為int、字串、列表、元組、字典的方法詳解

在實際寫程式中，經常要對變數型別進行判斷，除了用type(變數)這種方法外，還可以用isinstance方法判斷：

Macbook安裝Python最新版本、GUI開發環境、影象處理、視訊處理環境詳解

1、安裝有兩種安裝方法：方法一：從Mac自帶的python安裝，命令如下： $brewinstall python

git檢視、建立、刪除、本地、遠端分支方法詳解

1. 檢視遠端分支 git branch -r origin/master 2. 檢視本地分支 git branch *master 注：以*開頭指明現在所在的本地分支

JS陣列扁平化、去重、排序操作例項詳解

本文例項講述了JS陣列扁平化、去重、排序操作。分享給大家供大家參考，具體如下：

Visual Studio Code (vscode) 配置C、C++環境/編寫執行C、C++的教程詳解（主要Windows、簡要Linux）

2020年2月22日更新，又按照自己的帖子嘗試了以下，感覺大的思路是沒問題的啊，小改動用紫色的標記標註出來了，另外如評論區所說刪去了部分舊版本的內容和圖片，不知道為啥評論區的留言我都沒收到郵件。。。

TensorFlow dataset.shuffle、batch、repeat的使用詳解

相關推薦