理解torch.scatter_()

阿新 • • 發佈：2020-12-23

技術標籤：pytorch pytorch 深度學習

理解torch.scatter_()

官方文件

scatter_(dim, index, src): 將src中所有的值分散到self 中，填法是按照index中所指示的索引來填入。

dim用來指定index進行對映的維度，其他維度則保持不變。

Note: src可以是一個scalar。在這種情況下，該函式的操作是根據index來散佈單個值。

當dim=0

dim=0，意味著在src按照index行索引的指示來進行散射，換言之，src的j列按照index

的j列中的值散射到self的j列中。（表述還是很繞，看例子吧）

以下是官方的例子：

>> 
> x = torch.rand(2, 5)
>>> x
tensor([[ 0.3992,  0.2908,  0.9044,  0.4850,  0.6004],
        [ 0.5735,  0.9006,  0.6797,  0.4152,  0.1732]])
>>> torch.zeros(3, 5).scatter_(0, torch.tensor([[0, 1, 2, 0, 0], [2, 0, 0, 1, 2]]), x)
tensor([[ 0.3992,  0.9006,  0.6797,  0.4850,  0.6004],
        [ 0.0000,  0.2908,  0.0000,  0.4152 
,  0.0000],
        [ 0.5735,  0.0000,  0.9044,  0.0000,  0.1732]])

因為dim=0，所以是列對映到列，散射操作可以按列依次進行。

第一列：
在這裡插入圖片描述
第二列：

直到最後一列：

當dim = 1

dim=1，意味著在src按照index列索引的指示來進行散射，換言之，src的i行按照index

的i行中的值散射到self的i列中。

>>> src = torch.from_numpy(np.arange(1, 11)).float().view(2, 5)
>>> input_tensor = torch.zeros(3, 5)
>> 
> index_tensor = torch.tensor([[3, 0, 2, 1, 4], [2, 0, 1, 3, 1]])
>>> dim = 1
>>> input_tensor.scatter_(dim, index_tensor, src)
tensor([[ 2.,  4.,  3.,  1.,  5.],
        [ 7., 10.,  6.,  9.,  0.],
        [ 0.,  0.,  0.,  0.,  0.]])

散射操作前：
在這裡插入圖片描述
更新第一行：

更新第二行，可以看到index中出現重複的對映索引值1，因此後一個會把前一個覆蓋:

8和10都是對映到col1，可以看到10把8給覆蓋了。

當src是scalar

>>> input_tensor = torch.from_numpy(np.arange(1, 16)).float().view(3, 5) # dim is 2
>>> # unsqueeze to have dim = 2
>>> index_tensor = torch.tensor([4, 0, 1]).unsqueeze(1) 
>>> src = 0
>>> dim = 1
>>> input_tensor.scatter_(dim, index_tensor, src)
tensor([[ 1.,  2.,  3.,  4.,  0.],
        [ 0.,  7.,  8.,  9., 10.],
        [11.,  0., 13., 14., 15.]])

Note:

index的維度要和輸入張量的維度保持一致。同時index要在相同維度上的尺度不能大於輸入張量。
當src是標量時，我們實際上使用的是廣播版本，其形狀與index張量相同。

程式碼實操

該函式最常用的場景是把標量的標籤轉換為one-hot編碼

batch_size = 4
class_num = 5
labels = torch.tensor([4, 0, 1, 2]).unsqueeze(1)
one_hot = torch.zeros(batch_size, class_num)
dim=1; index_tensor = labels; src=1
one_hot.scatter_(dim, index_tensor, src)
print(one_hot)
> tensor([[0., 0., 0., 0., 1.],
        [1., 0., 0., 0., 0.],
        [0., 1., 0., 0., 0.],
        [0., 0., 1., 0., 0.]])

References:

Understand torch.scatter_()
https://pytorch.org/docs/stable/tensors.html#torch.Tensor.scatter_

理解torch.scatter_()

技術標籤：pytorchpytorch深度學習理解torch.scatter_() 官方文件 scatter_(dim, index, src): 將src中所有的值分散到self 中，填法是按照index中所指示的索引來填入。

PyTorch之 torch.nn.Embedding 詞嵌入層的理解

1.word Embedding的概念理解首先，我們先理解一下什麼是Embedding。Word Embedding翻譯過來的意思就是詞嵌入，通俗來講就是將文字轉換為一串數字。因為數字是計算機更容易識別的一種表達形式。我們詞嵌入的過程，就

torch.gather的使用及理解

技術標籤：pytorch深度學習神經網路pytorchpython 結論：使用方法 # gather，沿dim指定的軸收集值。

`torch.gather`理解

official link 函式定義 torch.gather(input, dim, index, *, sparse_grad=False, out=None) → Tensor 沿著dim指定的軸聚集tensor的值。返回的是原資料的複製，修改返回值不會修改原tensor。

深入理解iOS開發中的鎖

摘要本文的目的不是介紹 iOS 中各種鎖如何使用，一方面筆者沒有大量的實戰經驗，另一方面這樣的文章相當多，比如 iOS中保證執行緒安全的幾種方式與效能對比、iOS 常見知識點（三）：Lock。本文也不會詳細介紹鎖的具

iOS進階之路——理解 Xcode 編譯系統

本文來自 iOSTips ，作者 Vadim Bulavin 任何 iOS 原始碼在裝置上執行之前都需要編譯器的一系列處理，這個過程通常由 Xcode Build System 完成。在這篇文章中，我將介紹 Xcode Build System 的每一個部分。

深入理解 AQS 之 Condition 原始碼

前言很久之前分享過ReetrantLock的實現深入剖析ReentrantLock公平鎖與非公平鎖原始碼實現，而今再回頭去看，對AQS也有了更深刻準確的理解，隨即更新了下之前的文章。今天分享利用AQS實現的另一個重要的JUC工具類Con

深入理解 Java 虛擬機器器：Java 記憶體區域透徹分析

前言 Java是目前使用者最多、使用範圍最廣的軟體開發技術，Java 的技術體系主要由支撐Java程式執行的虛擬機器器。為各開發領域提供介面支援的Java API， Java程式語言及許許多多的第三方Java框架( 如Spring和Struts等

清空認知，然後重新理解MySQL索引結構

前言 Hello我又來了，快年底了，作為一個有抱負的碼農，我想給自己攢一個年終總結。自上上篇寫了手動搭建Redis叢集和MySQL主從同步(非Docker)和上篇寫了動手實現MySQL讀寫分離and故障轉移之後，索性這次把資料庫中最

ThreadLocal前奏:我理解的java四種引用型別

前言為了理解ThreadLocal，掌握引用的概念是非常有必要的。引用與物件 java中我們通過一個引用指向記憶體中物件。

深入理解-CPU核心數與執行緒池併發執行緒數關係

那是一個風和日麗的下午！面試官微微一笑，對我說：“小夥子，合理配置執行緒池你是如何考慮的？”

[譯]理解Go的reflect

原文：medium.com/better-prog… Go是一個強型別的靜態程式語言。然而，一些Go的特性讓它看起來又像是一門動態語言。例如，如果你不確定你接收的引數的型別，你可以使用interface來接收所有型別的引數傳遞。

深入理解Java虛擬機器器鎖優化&逃逸分析技術

引言 HotSpot虛擬機器器團隊在1.5 -> 1.6版本演進中，進行了大量的鎖優化技術，相應的jdk6併發包也推出了很多併發容器&API，所以JDK6是高效併發大放異彩的一個關鍵版本。本文主要介紹一下java虛擬機器器中對於

快速理解Redis的持久化

Redis系列文章 Redis基礎你掌握多少了？來查漏補缺？ Redis沒聽過這些資料結構你就out了

分散式事務之深入理解什麼是2PC、3PC及TCC協議？

前言在上一篇文章《教你一手如何基於RocketMQ搭建生產級訊息叢集》中給大家介紹了基於RocketMQ如何搭建生產級訊息叢集。因為本系列文章最終的目的是介紹基於RocketMQ的事物訊息來解決分散式系統中的資料一致性問題，

面試高頻:深入理解Java虛擬機器器之—JVM類載入過程和類載入器

深入理解Java虛擬機器器之—JVM類載入過程和類載入器不僅是為了面試，還為了從根本上學習和理解Java程式碼的執行過程，提高自己對Java的理解

《深入理解Java虛擬機器器》（四）：垃圾收集演演算法以及記憶體分配策略

============== 讀書筆記系列 ============== 接下來我們就要聊到最常見的問題了，垃圾收集演演算法，以及記憶體分配策略。

圖文並茂理解hashMap

閱讀此文後你將掌握的知識點： 1,hashMap原理 2,為什麼長度必須是2的整數次冪 3,PUT的資料如何進行儲存

深入理解MDL元資料鎖

前言：當你在MySQL中執行一條SQL時，語句並沒有在你預期的時間內執行完成，這時候我們通常會登陸到MySQL資料庫上檢視是不是出了什麼問題，通常會使用的一個命令就是 show processlist，看看有哪些session，這些se

Streams：深入理解Redis5.0新特性

概述相較於Redis4.0，Redis5.0增加了很多新的特性，而streams是其中最重要的特性之一。streams是redis 的一種基本資料結構，它是一個新的強大的支援多播的可持久化的訊息佇列，在設計上借鑑了kafaka。streams的資料

理解torch.scatter_()