關於numpy中的廣播與argmax問題
阿新 • • 發佈:2019-02-11
問題背景
最近正在看faster-rcnn的anchor-target-layer.py原始碼,其中關於numpy的argmax()問題搞得很混亂。此問題理清楚還需要高清楚numpy的索引的運作原理。
a = np.array([[1,3,5],[2,2,9]])
>>> a.argmax(axis=0)
array([1, 0, 1])
使用argmax(axis=0)的原因是想提取出在行方向上的最大值序號。進而得到行方向上的最大值(每一列的最大值)。可以看出的結構是一個1行3列的array,其中array中的每個值都小於行數,並且值得個數是列數。可以通過以下語句得到行方向上的最大值。
>>> a[a.argmax(axis=0),np.arange(3)]
array([2, 3, 9])
同理,可以得到列方向上的最大值,(每一行的最大值)
>>> a[np.arange(2),a.argmax(axis=1)]
array([5, 9])
argmax函式返回的是序號,在二維情況下,axis=0對應行,axis=1對應列。argmax(axis=0),返回的是行號,行號的個數是列數。同理可知。
在以上操作中
>>>[a.argmax(axis=0),np.arange(3)]
[array([1, 0, 1]), array([0, 1, 2])]
可見,兩個array做為序號,其實內部使用的是資料組合機制來獲取真實的資料。以上可以等效為
[a[1,0],a[0,1],a[1,2]]
如此便可以理解了。