1. 程式人生 > 實用技巧 >模型訓練-----資料處理

模型訓練-----資料處理

參考連結:https://blog.csdn.net/lqz790192593/article/details/89762081

在DataLoader 中,iter(dataloader) 返回的是一個 DataLoaderIter 物件, 這個才是我們一直 next的 物件。
#
# 這個DataLoaderIter其實就是DataLoader類的__iter__()方法的返回值:

DataLoader()的各個引數含義如下:

1.dataset:載入的資料集,這個從DataSet()函式而來。
2.batch_size:batch size,設定每次訓練迭代時載入的資料量。
3.shuffle::是否將資料打亂
4.sampler: 樣本抽樣
5.num_workers:使用多程序載入的程序數,0代表不使用多程序,設定多程序可以使得載入資料時更加快速。
6.collate_fn: 如何將多個樣本資料拼接成一個batch,一般使用預設的拼接方式即可

7.pin_memory:是否將資料(tensor)儲存在pin memory區,pin memory中的資料轉到GPU中會快一些
8.drop_last:dataset中的資料個數可能不是batch_size的整數倍,drop_last為True會將多出來不足一個batch的資料丟棄,False表示不丟棄。