1. 程式人生 > 其它 >將矩陣轉為一行_矩陣與矩陣乘積簡介

將矩陣轉為一行_矩陣與矩陣乘積簡介

技術標籤:將矩陣轉為一行

作者|Hadrien Jean
編譯|VK
來源|Towards Data Science
原文連結: https:// towardsdatascience.com/ introduction-to-matrices-and-the-matrix-product-391bf679f669

向量是儲存和操作資料的一種有用的方法,可以用箭頭或數字陣列來表示它們。然而,建立更復雜的資料結構是有幫助的,這正是需要引入矩陣的地方。

介紹

矩陣是正方形或矩形陣列,包含兩個維度:行和列,我們可以把它看作是一個電子表格。通常會在數學上下文中看到術語矩陣,在Numpy上下文中看到二維陣列。

維度

在矩陣的上下文中,術語維度不同於向量表示的維數(空間維數)。當我們說矩陣是二維陣列時,意味著陣列中有兩個方向:行和列。

矩陣表示如下:

283ea5ff60e7cd9d7fa739af9fe3702e.png

矩陣A有兩行兩列,如果矩陣有m行和n列,並且包含實值,可以用以下符號來刻畫它:A∈ℝ(m×n)。

我們可以使用不帶粗體的矩陣名稱引用矩陣中的元素,但是後面需要跟著行索引和列索引。例如,$ A_{2, 1}$表示第一行和第二列中的元素。

按照慣例,第一個索引用於行,第二個索引用於列。例如,上面提到的例子位於矩陣A的第二行和第一列,因此它被表示為$A_{2, 1}$。

矩陣分量可以寫如下:

05243154574bec7eebcee48792d53782.png

圖1:矩陣是二維陣列,行數通常用m表示,列數用n表示。

陣列的形狀給出了每個維度中元素的數量,如圖1所示。由於此矩陣是二維的(行和列),因此需要兩個值來描述形狀(按此順序排列的行數和列數)。

我們先用這個方法np.array()建立一個2維numpy陣列。

A = np.array([[2.1, 7.9, 8.4],
              [3.0, 4.5, 2.3],
              [12.2, 6.6, 8.9],
              [1.8, 1., 8.2]])

注意,我們使用陣列中的陣列([[]])來建立二維陣列。這與建立一維陣列的不同之處在於所使用的方括號數。

與向量一樣,可以訪問Numpy陣列的shape屬性:

A.shape

可以看到該形狀包含兩個數字:它們分別對應於行數和列數。

要獲得矩陣元素,需要兩個索引:一個引用行索引,一個引用列索引。

使用Numpy,索引過程與向量的索引過程相同,只需要指定兩個索引。我們再來看下面的矩陣A:

A = np.array([[2.1, 7.9, 8.4],
              [3.0, 4.5, 2.3],
              [12.2, 6.6, 8.9],
              [1.8, 1.3, 8.2]])

可以使用以下語法獲取特定元素:

A[1, 2]

[1,2]返回行索引為1、列索引為2(以零為基礎的索引)的元素。

要獲得完整的列,可以使用冒號:

A[:, 0]
array([ 2.1, 3. , 12.2, 1.8])

這將返回第一列(索引0),因為冒號表示我們需要從第一行到最後一行的元素。同樣,要獲取特定行,可以執行以下操作:

A[1, :]
array([3. , 4.5, 2.3])

能夠操縱包含資料的矩陣是資料科學家的一項基本技能。檢查資料的形狀對於確保資料的組織方式非常重要。瞭解使用Sklearn或Tensorflow等庫所需的資料形狀也很重要。

對於Numpy,如果陣列是向量(1D Numpy陣列),則shape是單個數字:

v = np.array([1, 2, 3])
v.shape

如果是矩陣,則形狀有兩個數字(行和列中的值的數目)。例如:

A = np.array([[2.1, 7.9, 8.4]])
A.shape

形狀的第一個數字是1。使用兩個方括號[[和]],可以建立一個二維陣列(矩陣)。

矩陣乘積

接下來我們將在資料科學基礎數學中學習乘積。矩陣的等價運算稱為矩陣乘積或矩陣乘法,它接受兩個矩陣並返回另一個矩陣。這是線性代數中的一個核心運算。

矩陣乘積的更簡單的情況是介於矩陣和向量之間(可以將其視為矩陣乘積,其中一個向量只有一列)。

4cb1f0fae32ec07e07a3eb2cbc3f6cb3.png

上圖說明了矩陣和向量之間乘積的步驟。讓我們來看矩陣的第一行,在向量(值3和4)和行(值1和2)之間進行點積。第一行的第一個值的與第一列的第一個值(1⋅3)和第一行第二個值與第一列的第二個值(2⋅4),它計算的矩陣的第一個元素是(1⋅3 + 2⋅4 = 11)。

你可以看到矩陣乘積與點積相關,就像把矩陣A分成三行並應用點積(如資料科學的基本數學)。

看看它是如何與numpy一起工作的。

A = np.array([
    [1, 2],
    [5, 6],
    [7, 8]
])
v = np.array([3, 4]).reshape(-1, 1)
A @ v
array([[11], [39], [53]])

請注意,我們使用了reshape函式將向量重塑為一個2乘1的矩陣(-11告訴Numpy猜測剩餘的數字)。如果沒有它,將以一維陣列結束,而不是這裡的二維陣列(只有一列的矩陣)。

還有另一種方法來考慮矩陣乘積,可以考慮向量包含了對矩陣的每一列加權的值。它清楚地表明,向量的長度需要等於應用向量的矩陣的列數。

下圖可能有助於將這個概念形象化。可以將向量值(3和4)視為應用於矩陣列的權重。前面看到的標量乘法規則會產生與以前相同的結果。

使用最後一個示例,可以編寫A和v之間的乘積,如下所示:

4cb1f0fae32ec07e07a3eb2cbc3f6cb3.png

這一點很重要,因為正如你在資料科學基礎數學中看到的更多細節,它表明Av是A的列的線性組合,係數是v的值。

另外,你可以看到矩陣的形狀和向量的形狀必須匹配才能得到乘積。

矩陣乘積類似於矩陣向量積,但應用於第二個矩陣的每一列。

使用Numpy,可以精確地計算矩陣乘積:

A = np.array([
    [1, 2],
    [5, 6],
    [7, 8],
])
B = np.array([
    [3, 9],
    [4, 0]
])

A @ B
array([[11, 9], [39, 45], [53, 63]])

與矩陣向量積一樣,第一個矩陣的列數必須與第二個矩陣的行數相匹配。

結果矩陣的行數與第一個矩陣的行數相同,列數與第二個矩陣的列數相同。

我們試試吧。

A = np.array([
    [1, 4],
    [2, 5],
    [3, 6],
])
B = np.array([
    [1, 4, 7],
    [2, 5, 2],
])

矩陣A和B有不同的形狀。讓我們計算他們的乘積:

A @ B
array([[ 9, 24, 15], [12, 33, 24], [15, 42, 33]])

你可以看到A⋅B的結果是一個3乘3的矩陣。這個形狀來自A(3)的行數和B(3)的列數。

可以使用矩陣與其轉置矩陣之間的乘積計算資料集的協方差矩陣,然後除以觀測值(或貝塞爾修正值減去1),但是需要事先確保變數的中心在零左右(這可以通過減去平均值來實現)。

讓我們模擬以下變數x、y和z:

x = np.random.normal(10, 2, 100)
y = x * 1.5 + np.random.normal(25, 5, 100)
z = x * 2 + np.random.normal(0, 1, 100)

使用Numpy,協方差矩陣為:

np.cov([x, y, z])
array([[ 4.0387007 , 4.7760502 , 8.03240398], [ 4.7760502 , 32.90550824, 9.14610037], [ 8.03240398, 9.14610037, 16.99386265]])

現在,使用矩陣乘積,首先進行堆疊:

X = np.vstack([x, y, z]).T
X.shape

你可以看到變數X是一個100×3的矩陣:100行對應於觀察值,3列對應於特徵。然後,把這個矩陣減去均值:

X = X - X.mean(axis=0)

最後,計算協方差矩陣:

(X.T @ X) / (X.shape[0] - 1)
array([[ 4.0387007 , 4.7760502 , 8.03240398], [ 4.7760502 , 32.90550824, 9.14610037], [ 8.03240398, 9.14610037, 16.99386265]])

你會得到一個協方差矩陣,與函式np.cov中得到的協方差矩陣相似,這一點很重要,要記住一個矩陣的轉置乘積對應於協方差矩陣。

兩個矩陣之間乘積的轉置定義如下:

943ce4fad475730d36321cc862129b32.png

例如,取以下矩陣A和B:

A = np.array([
    [1, 4],
    [2, 5],
    [3, 6],
])
B = np.array([
    [1, 4, 7],
    [2, 5, 2],
])

你可以檢查(AB)^T和B^T A^T的結果:

(A @ B).T
array([[ 9, 12, 15], [24, 33, 42], [15, 24, 33]])
B.T @ A.T
array([[ 9, 12, 15], [24, 33, 42], [15, 24, 33]])

兩個向量或矩陣在括號中的順序必須改變,以滿足等價性。如果改變向量和矩陣的順序,矩陣乘積的轉置等於轉置的乘積。

可以將此屬性應用於兩個以上的矩陣或向量,例如這樣。

b064c506efa239e3782564b7bccbecff.png