Pytorch中的張量複製

阿新 • • 發佈：2020-07-21

pytorch提供了clone、detach、copy_和new_tensor等多種張量的複製操作，尤其前兩者在深度學習的網路架構中經常被使用，本文旨在對比這些操作的差別。

1. clone

返回一個和源張量同shape、dtype和device的張量，與源張量不共享資料記憶體，但提供梯度的回溯。

clone後的返回值是個中間variable，因此支援梯度的回溯。因此，clone操作在一定程度上可以視為是一個identity-mapping函式。

clone作為一箇中間variable，會將梯度傳給源張量進行疊加。

但若源張量的require_grad=False，而clone後的張量require_grad=True

，顯然此時不存在張量回溯現象，clone後的張量可以求導。

綜上論述，clone操作在不共享資料記憶體的同時支援梯度回溯，所以常用在神經網路中某個單元需要重複使用的場景下。

2. detach

detach的機制則與clone完全不同，即返回一個和源張量同shape、dtype和device的張量，與源張量共享資料記憶體，但不提供梯度計算，即requires_grad=False，因此脫離計算圖。

detach後的張量，即使重新定義requires_grad=True，也與源張量的梯度沒有關係。

綜上論述，detach操作在共享資料記憶體的脫離計算圖，所以常用在神經網路中僅要利用張量數值，而不需要追蹤導數的場景下。

3. clone和detach聯合使用

clone提供了非資料共享的梯度追溯功能，而detach又“捨棄”了梯度功能，因此clone和detach聯合使用意味著著只做簡單的資料複製，既不資料共享，也不對梯度共享，從此兩個張量無關聯。

置於是先clone還是先detach，其返回值一樣，一般採用tensor.clone().detach()。

4. new_tensor

new_tensor可以將源張量中的資料複製到目標張量（資料不共享），同時提供了更細緻的device、dtype和requires_grad屬性控制：

其預設引數下的操作等同於.clone().detach()

，而requires_grad=True時的效果相當於.clone().detach()requires_grad_(True)。上面兩種情況都推薦使用後者。

5. copy_

copy_同樣將源張量中的資料複製到目標張量（資料不共享），其device、dtype和requires_grad一般都保留目標張量的設定，僅僅進行資料複製，同時其支援broadcast操作。

具體試驗參考：

【Pytorch】對比clone、detach以及copy_等張量複製操作

Pytorch張量（Tensor）複製

Pytorch中的張量複製

1. clone

2. detach

3. clone和detach聯合使用

4. new_tensor

5. copy_

Pytorch中的張量複製

pytorch 實現張量tensor,圖片,CPU,GPU,陣列等的轉換

淺談tensorflow中張量的提取值和賦值

PyTorch：張量、自動求導和平行計算

pytorch中tensor張量資料型別的轉化方式

pytorch 中關於建立簡單mask，張量的索引，變換，張量軸，[None,:]與unsqueeze()的思考

TensorFlow獲取載入模型中的全部張量名稱程式碼

Pytorch使用PIL和Numpy將單張圖片轉為Pytorch張量方式

在keras 中獲取張量 tensor 的維度大小例項

TensorFlow中如何確定張量的形狀例項

Pytorch 張量部分小總結

如何在tensorflow中判斷tensor(張量)的值

[PyTorch 學習筆記] 1.3 張量操作與線性迴歸

PyTorch 第一章第二節：張量簡介與建立

pytorch-張量-張量的生成

PyTorch布林型別的張量的+操作

【pytorch】一文讀懂tensor張量（官方教程翻譯）

PyTorch - 11 - 深度學習張量 - 使用PyTorch進行廣播和明智的操作

PyTorch | torch.full()使用方法 | torch.full()如何使用？ torch.full()例子說明 | 通過torch.full建立全相同的張量

pytorch張量操作基礎

Pytorch中的張量複製

1. clone

2. detach

3. clone和detach聯合使用

4. new_tensor

5. copy_

相關推薦