numpy中的廣播機制
廣播的引出
numpy兩個數組的相加、相減以及相乘都是對應元素之間的操作。
import numpy as np
x = np.array([[2,2,3],[1,2,3]]) y = np.array([[1,1,3],[2,2,4]]) print(x*y) #numpy當中的數組相乘是對應元素的乘積,與線性代數當中的矩陣相乘不一樣 輸入結果如下: ‘‘‘ [[ 2 2 9] [ 2 4 12]] ‘‘‘
當兩個數組的形狀並不相同的時候,我們可以通過擴展數組的方法來實現相加、相減、相乘等操作,這種機制叫做廣播(broadcasting)。
比如,一個二維數組減去列平均值,來對數組的每一列進行距平化處理:
import numpy as np
arr = np.random.randn(4,3) #shape(4,3) arr_mean = arr.mean(0) #shape(3,) demeaned = arr -arr_mean
很明顯上式arr和arr_mean維度並不形同,但是它們可以進行相減操作,這就是通過廣播機制來實現的。
廣播的原則
廣播的原則:如果兩個數組的後緣維度(trailing dimension,即從末尾開始算起的維度)的軸長度相符,或其中的一方的長度為1,則認為它們是廣播兼容的。廣播會在缺失和(或)長度為1的維度上進行。
這句話乃是理解廣播的核心。廣播主要發生在兩種情況,一種是兩個數組的維數不相等,但是它們的後緣維度的軸長相符,另外一種是有一方的長度為1。
數組維度不同,後緣維度的軸長相符
我們來看一個例子:
import numpy as np arr1 = np.array([[0, 0, 0],[1, 1, 1],[2, 2, 2], [3, 3, 3]]) #arr1.shape = (4,3) arr2 = np.array([1, 2, 3]) #arr2.shape = (3,) arr_sum = arr1 + arr2 print(arr_sum) 輸入結果如下:‘‘‘ [[1 2 3] [2 3 4] [3 4 5] [4 5 6]] ‘‘‘
上例中arr1的shape為(4,3),arr2的shape為(3,)。可以說前者是二維的,而後者是一維的。但是它們的後緣維度相等,arr1的第二維長度為3,和arr2的維度相同。arr1和arr2的shape並不一樣,但是它們可以執行相加操作,這就是通過廣播完成的,在這個例子當中是將arr2沿著0軸進行擴展。
上面程序當中的廣播如下圖所示:
同樣的例子還有:
從上面的圖可以看到,(3,4,2)和(4,2)的維度是不相同的,前者為3維,後者為2維。但是它們後緣維度的軸長相同,都為(4,2),所以可以沿著0軸進行廣播。
同樣,還有一些例子:(4,2,3)和(2,3)是兼容的,(4,2,3)還和(3)是兼容的,後者需要在兩個軸上面進行擴展。
數組維度相同,其中有個軸為1
我們來看下面的例子:
import numpy as np arr1 = np.array([[0, 0, 0],[1, 1, 1],[2, 2, 2], [3, 3, 3]]) #arr1.shape = (4,3) arr2 = np.array([[1],[2],[3],[4]]) #arr2.shape = (4, 1) arr_sum = arr1 + arr2 print(arr_sum) 輸出結果如下: [[1 1 1] [3 3 3] [5 5 5] [7 7 7]]
arr1的shape為(4,3),arr2的shape為(4,1),它們都是二維的,但是第二個數組在1軸上的長度為1,所以,可以在1軸上面進行廣播,如下圖所示:
在這種情況下,兩個數組的維度要保證相等,其中有一個軸的長度為1,這樣就會沿著長度為1的軸進行擴展。這樣的例子還有:(4,6)和(1,6) 。(3,5,6)和(1,5,6)、(3,1,6)、(3,5,1),後面三個分別會沿著0軸,1軸,2軸進行廣播。
後話:還有上面兩種結合的情況,如(3,5,6)和(1,6)是可以相加的。在TensorFlow當中計算張量的時候也是用廣播機制,並且和numpy的廣播機制是一樣的。
參考:
《利用python進行數據分析》 第十一章 廣播 本書的圖片和廣播的原則的描述都來自本書
numpy中的廣播機制