pytorch torchvision.transforms.Normalize()中的mean和std引數---解惑

阿新 • • 發佈：2019-01-07

torchvision.transforms.Normalize()中的mean和std引數做什麼用呢？
疑問1：
按照我的理解，歸一化就是要把圖片3個通道中的資料整理到[-1, 1]區間。
x = (x - mean(x))/stddev(x)
只要輸入資料集x確定了，mean(x)和stddev(x)也就是確定的數值了，為什麼Normalize()函式還需要輸入mean和std的數值呢？

疑問2：
RGB單個通道的值不是[0, 255]嗎？所以一個通道的均值應該在127附近才對。
如果Normalize()函式按照下面的版式去計算 x = (x - mean)/std 因為RGB是[0, 255]，算出來的x就不可能落在[-1, 1]區間了。

疑問3：
可我看很多程式碼裡面是這樣的：
torchvision.transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
這一組值是怎麼來的？為什麼這三個通道的均值都是小於1的值呢？

1、
mean 和 std 肯定要在normalize之前自己先算好再傳進去的，不然每次normalize程式就得把所有的圖片都讀取一遍算這兩個數…

2、有兩種情況：
a)如果是imagenet資料集，那麼ImageNet的資料在載入的時候就已經轉換成了[0, 1].
b)應用了torchvision.transforms.ToTensor，其作用是
（ Converts a PIL Image or numpy.ndarray (H x W x C) in the range [0, 255] to a torch.FloatTensor of shape (C x H x W) in the range [0.0, 1.0]

）

3、[0.485, 0.456, 0.406]這一組平均值是從imagenet訓練集中抽樣算出來的。

pytorch torchvision.transforms.Normalize()中的mean和std引數---解惑

pytorch torchvision.transforms.Normalize()中的mean和std引數---解惑

Pytorch的mean和std調查

pytorch.torchvision.transforms

LVS負載均衡中arp_ignore和arp_annonuce引數配置的含義

uiautomator中UiObject中getChildCount和getChild方法解惑

Sql Server中儲存過程中輸入和輸出引數（簡單例項，一看就懂）

如何正確設定nginx中remote_addr和x_forwarded_for引數

UnityShader中Tiling和Offset引數設定時貼圖異常問題

Minor GC 中 MaxTenuringThreshold 和 TargetSurvivorRatio 引數說明

《OpenCV3程式設計入門》——2.5 argc 和argv引數解惑

「Deep Learning」理解PyTorch中的「torchvision.transforms」

實戰c++中的vector系列--對vector<自己定義類>使用std::find 和 std::find_if 算法

PyTorch官方中文文檔：torchvision.transforms

muduo庫中的核心：std::bind和std::function

pytorch中required_grad和detach的澄清

C++：探索std::map和std::unordered_map中的新增操作

PyTorch原始碼解讀之torchvision.transforms（轉）

PyTorch源碼解讀之torchvision.transforms（轉）

C++中的std::lock_guard和std::unique_lock

PyTorch原始碼解讀之torchvision.transforms

pytorch torchvision.transforms.Normalize()中的mean和std引數---解惑

相關推薦