1. 程式人生 > >理解tensorflow裡的資料生成器:dataset.shuffle dataset.batch dataset.repeat

理解tensorflow裡的資料生成器:dataset.shuffle dataset.batch dataset.repeat

筆者是從這篇部落格中學習的:
https://blog.csdn.net/qq_16234613/article/details/81703228#commentsedit

這裡進行言簡意賅的總結:
dataset.shuffle: 作用是將資料打亂
dataset.batch: 作用是讀取batch_size大小的資料
dataset.repeat: 作用是將資料集重複多少次,即epoch

這裡有兩種使用情況:
情況一:
dataset.shuffle(3)
dataset.batch(4)
dataset.repeat(2)
將資料取完一個epoch後,再取一個epoch。因此每一個epoch中,最後一個batch大小可能小於等於batch size。

情況二:
dataset.repeat(2)
dataset.shuffle(3)
dataset.batch(4)
先將資料重複2次,成為一個大的資料,最後一個batch大小可能小於等於batch size 。而且一個batch_size中的資料可能會有重複。