Python替換NumPy陣列中大於某個值的所有元素例項
我有一個2D(二維) NumPy陣列,並希望用255.0替換大於或等於閾值T的所有值。據我所知,最基礎的方法是:
shape = arr.shape result = np.zeros(shape) for x in range(0,shape[0]): for y in range(0,shape[1]): if arr[x,y] >= T: result[x,y] = 255
有更簡潔和pythonic的方式來做到這一點嗎?
有沒有更快(可能不那麼簡潔和/或不那麼pythonic)的方式來做到這一點?
這將成為人體頭部MRI掃描視窗/等級調整子程式的一部分,2D numpy陣列是影象畫素資料。
最佳解決思路
我認為最快和最簡潔的方法是使用Numpy的內建索引。如果您有名為arr的ndarray,則可以按如下所示將所有元素>255替換為值x:
arr[arr > 255] = x
我用500 x 500的隨機矩陣在我的機器上運行了這個函式,用5替換了所有> 0.5的值,平均耗時7.59ms。
In [1]: import numpy as np In [2]: A = np.random.rand(500,500) In [3]: timeit A[A > 0.5] = 5 100 loops,best of 3: 7.59 ms per loop
次佳解決思路
因為實際上需要一個不同的陣列,arr,其中arr < 255,可以簡單地完成:
result = np.minimum(arr,255)
更一般地,對於下限和/或上限:
result = np.clip(arr,255)
如果只是想訪問超過255的值,np.clip和np.minimum(或者np.maximum)對你的情況更好更快。
In [292]: timeit np.minimum(a,255) 100000 loops,best of 3: 19.6 µs per loop In [293]: %%timeit .....: c = np.copy(a) .....: c[a>255] = 255 .....: 10000 loops,best of 3: 86.6 µs per loop
如果要執行in-place(即修改arr而不是建立result),則可以使用np.minimum的out引數:
np.minimum(arr,255,out=arr)
或者
np.clip(arr,arr)
(out=名稱是可選的,因為引數的順序與函式的定義相同。)
對於in-place修改,布林索引加速了很多(不必分別修改和拷貝),但仍然不如minimum:
In [328]: %%timeit .....: a = np.random.randint(0,300,(100,100)) .....: np.minimum(a,a) .....: 100000 loops,best of 3: 303 µs per loop In [329]: %%timeit .....: a = np.random.randint(0,100)) .....: a[a>255] = 255 .....: 100000 loops,best of 3: 356 µs per loop
比較來看,如果你想限制你的最大值和最小值,沒有clip將不得不像下面這樣做兩次
np.minimum(a,a)
np.maximum(a,a)
要麼,
a[a>255] = 255
a[a<0] = 0
第三種解決思路
可以通過使用where功能來達到最快的速度:
例如,在numpy陣列中查詢大於0.2的專案,並用0代替它們:
import numpy as np nums = np.random.rand(4,3) print np.where(nums > 0.2,nums)
第四種思路
可以考慮使用numpy.putmask:
np.putmask(arr,arr>=T,255.0)
下面是與Numpy內建索引的效能比較:
In [1]: import numpy as np In [2]: A = np.random.rand(500,500) In [3]: timeit np.putmask(A,A>0.5,5) 1000 loops,best of 3: 1.34 ms per loop In [4]: timeit A[A > 0.5] = 5 1000 loops,best of 3: 1.82 ms per loop
以上這篇Python替換NumPy陣列中大於某個值的所有元素例項就是小編分享給大家的全部內容了,希望能給大家一個參考,也希望大家多多支援我們。