numpy 維度、軸和transpose的理解

阿新 • • 發佈：2019-01-14

前言

　　最近在看pandas的創始人寫的一本資料分析，在其中使用numpy建立多維陣列的時候提到了很多有關陣列的維度和軸的一些相關的知識，而剛開始閱讀的時候由於對這部分有些理解不到位，導致後面理解陣列轉換的時候出現了很多坑爹問題。所以特此寫幾個簡單的例項分析一下。小夥伴們也可以一起瞅瞅，看看能不能加深一下印象。
　　

維度

　　在數學上我們說維度是什麼呢？–在一定的前提下描述一個數學物件所需的引數個數。但是我們今天所談到的維度卻和這裡數學所說的維度有著一些區別。有標題可知，我們今天所要說的維度是基於numpy中的多維陣列。numpy最重要的一個特點就是其N維陣列物件，該物件是一個大的靈活的大資料集容器。以此利用陣列來對我們獲取到的整塊的資料執行一些數學上的運算。繞了一圈，維度又是啥，我們先來看一下以下的程式碼。
　　

> data = np.array([[1,2],[4,5]])
> data.shape()
(2L, 2L)
> data1 = np.array([[1,2,3],[4,5,6],[7,8,9]])
> data1.shape
(3L, 3L)

　　對人來說高維空間是很難想象的，但是我們可以從純數學的角度來看。對多維陣列來說，確定最底層的一個基本元素位置需要用到的索引個數即是維度。用上面的陣列data來舉一個簡單的例子。當我們要獲取 1 的值，我們需要使用 a[0][0], 一共用到了兩個座標索引，所以這個陣列的維度是2維。
　　直觀的說陣列的維度就是所有基本元素左邊 [ 個數的最大值。而每個座標索引可取的值是有範圍的，比如這裡兩個索引都只能取 0 和 1。維度與座標值範圍就組成了多維陣列的 shape 屬性，它是一個元組，長度代表了維度，而元組的每一個值代表了一個座標索引可取的值個數，所以將 shape 的所有值乘起來就可以算出多維陣列元素的個數。就如舉例中的兩個例子一個是2*2的陣列，而另一個是一個3*3的陣列。
　　

軸

　　軸這個概念可以說是我第一次看到這個概念，在學習線性代數的時候，貌似也沒有聽過（大霧）。理解numpy中的軸的概念對我們接下來理解numpy中的轉置transpose有著至關重要的作用。
　　如果我們直接說軸這個概念，童鞋們可能會比較迷茫，我們先來說一個和它非常相似的概念—座標軸。n 維空間裡有 n 個座標軸，並且座標軸互相垂直，每一個點相對於一條座標軸都有唯一的一個座標值。對同一條座標軸來說，座標值相同的點在同一個 n-1 維的“平面”上。任意取一個“平面”，我們就能定義“同一個座標軸上的點”，這些點在“平面”上的投影相同，同一個座標軸上的點組成的線是與座標軸平行的。而所謂的延軸計算實際上是降維的過程，同一個座標軸上的點合併成一個點，這樣n維空間就變成了 n-1 維空間。如果童鞋們還不理解，這裡引用一個別的博文中常提到的另外一個解釋。來看下例子

>> data2
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])
>> data2.shape
(2L, 3L, 4L)

　　這裡會常常提到這樣的一個例子，這個陣列我們該如何稱呼它呢?2行3列4個平面。這其實就和我們上面所描述的座標軸的概念十分的接近。如果你喜歡這樣的說法也是可以的。
　　看完了座標軸，下面我們來說說軸，如果還是有些問題的童鞋可以參考一下下面的理解。要理解它，我們可以先使用一下它，並且觀察一下它是如何進行操作的。我們用最簡單的累加來進行一下操作。程式碼如下
　　

data2.sum(axis=0)
Out[49]: 
array([[12, 14, 16, 18],
       [20, 22, 24, 26],
       [28, 30, 32, 34]])

data2
Out[50]: 
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

data2.sum(axis=1)
Out[51]: 
array([[12, 15, 18, 21],
       [48, 51, 54, 57]])

data2.sum(axis=2)
Out[52]: 
array([[ 6, 22, 38],
       [54, 70, 86]])

　　如果你還是懵逼的，那麼我們來參考一下下面的圖。
　　這裡寫圖片描述
　　紅線框代表的是以軸為0相加的情況，而黃線則是軸為1，藍線自不必多說就是軸為2的情況。
　　具體到 numpy 中的多維陣列來說，軸即是元素座標的索引。比如，第0軸即是第1個索引，延0軸計算就是去掉座標中的第一個索引。過程就是
1.遍歷其他索引的所有可能組合
2. 取出一個組合，保持值不變，遍歷第一個索引所有可能值
3.根據索引可以獲得了同一個軸上的所有元素
4.對他們進行計算得到最後的元素
5.所有組合的最後結果組到一起就是最後的 n-1 維陣列
所以如果一個多維陣列的 shape 是 (a1, a2, a3, a4), 那麼延軸0計算最後的陣列shape 是 (a2, a3, a4), 延軸1計算最後的陣列shape是 (a1, a3, a4)。

Transpose

　　最後我們來說一下numpy的transpose這個引數。這個引數是我們在基於理解了軸，維度等情況下對多維陣列進行的一個重要的操作，不過這個理解起來倒確實有些令人頭疼。
　　首先我們對矩陣的維度進行編號，上述矩陣有三個維度，則編號分別為0，1，2，而transpose函式的引數輸入就是基於這個編號的，如果我們呼叫transpose（0，1，2），那麼矩陣將不發生變化，如果我們不輸入引數，直接呼叫transpose（），其效果就是將矩陣進行轉置，起作用等價與transpose（2，1，0）。
　　

data2.transpose(0,1,2)#(2,3,4)
Out[60]: 
array([[[ 0,  1,  2,  3],
        [ 4,  5,  6,  7],
        [ 8,  9, 10, 11]],

       [[12, 13, 14, 15],
        [16, 17, 18, 19],
        [20, 21, 22, 23]]])

data2.transpose(1,0,2)#(3,2,4)
Out[61]: 
array([[[ 0,  1,  2,  3],
        [12, 13, 14, 15]],

       [[ 4,  5,  6,  7],
        [16, 17, 18, 19]],

       [[ 8,  9, 10, 11],
        [20, 21, 22, 23]]])

data2.transpose(0,2,1)#(2,4,3)
Out[62]: 
array([[[ 0,  4,  8],
        [ 1,  5,  9],
        [ 2,  6, 10],
        [ 3,  7, 11]],

       [[12, 16, 20],
        [13, 17, 21],
        [14, 18, 22],
        [15, 19, 23]]])

data2.transpose()#(4,3,2)
Out[63]: 
array([[[ 0, 12],
        [ 4, 16],
        [ 8, 20]],

       [[ 1, 13],
        [ 5, 17],
        [ 9, 21]],

       [[ 2, 14],
        [ 6, 18],
        [10, 22]],

       [[ 3, 15],
        [ 7, 19],
        [11, 23]]])

　　在沒次變換的後面我都註明了變換的維度，大家可以參照著看一下，如果實在不懂，我建議大家多畫圖，這樣就比較方便理解。

總結

　　維度和軸作為理解多維陣列的重要概念需要我們稍微深入地去了解，同時也算是為後面使用pandas做一個小的鋪墊。
　　各位大佬如果文中有什麼問題希望多多留言謝謝。

numpy 維度、軸和transpose的理解

前言

維度

軸

Transpose

總結

numpy 維度、軸和transpose的理解

numpy下的軸交換transpose和 swapaxes的解讀

numpy 維度與軸的問題

numpy之轉置（transpose）和軸對換

R數據可視化----ggplot2之標度、坐標軸和圖例詳解

Java、C++、Python、Ruby、PHP、C#和JavaScript的理解

關於組態王、梯形圖、Unity和梯形圖的知識理解

一張圖理解prototype、proto和constructor的三角關系

八、JVM視角淺理解並發和鎖

iptables中DNAT、SNAT和MASQUERADE的理解

前端模塊化的一些理解-commonJs、AMD和CMD

理解jquery的$.extend()、$.fn和$.fn.extend()

數據庫的DDL、DML和DCL的區別與理解

深入理解Lua的閉包一：概念、應用和實現原理

Numpy的Reshape和Transpose

kconfig、menuconfig和 .config 的理解

對Swoole、Workerman和php自帶的socket的理解

npm、package.json的理解和學習

MySQL基礎系列之 DDL、DML和DCL的區別與理解

TensorFlow 資料驗證：能夠大規模理解、驗證和監控資料

numpy 維度、軸和transpose的理解

前言

維度

軸

Transpose

總結

相關推薦