1. 程式人生 > >numpy陣列拼接方法介紹

numpy陣列拼接方法介紹

陣列拼接方法一

思路:首先將陣列轉成列表,然後利用列表的拼接函式append()、extend()等進行拼接處理,最後將列表轉成陣列。

示例1:

>>> import numpy as np >>> a=np.array([1,2,5]) >>> b=np.array([10,12,15]) >>> a_list=list(a) >>> b_list=list(b)

>>> a_list.extend(b_list)

>>> a_list [1, 2, 5, 10, 12, 15] >>> a=np.array(a_list) >>> a array([ 1,  2,  5, 10, 12, 15])

該方法只適用於簡單的一維陣列拼接,由於轉換過程很耗時間,對於大量資料的拼接一般不建議使用。

陣列拼接方法二

思路:numpy提供了numpy.append(arr, values, axis=None)函式。對於引數規定,要麼一個數組和一個數值;要麼兩個陣列,不能三個及以上陣列直接append拼接。append函式返回的始終是一個一維陣列。

示例2:

>>> a=np.arange(5) >>> a array([0, 1, 2, 3, 4]) >>> np.append(a,10) array([ 0,  1,  2,  3,  4, 10]) >>> a array([0, 1, 2, 3, 4])

>>> b=np.array([11,22,33]) >>> b array([11, 22, 33]) >>> np.append(a,b) array([ 0,  1,  2,  3,  4, 11, 22, 33])

>>> a array([[1, 2, 3],        [4, 5, 6]]) >>> b=np.array([[7,8,9],[10,11,12]]) >>> b array([[ 7,  8,  9],        [10, 11, 12]]) >>> np.append(a,b) array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12])

numpy的陣列沒有動態改變大小的功能,numpy.append()函式每次都會重新分配整個陣列,並把原來的陣列複製到新陣列中。

陣列拼接方法三

思路:numpy提供了numpy.concatenate((a1,a2,...), axis=0)函式。能夠一次完成多個數組的拼接。其中a1,a2,...是陣列型別的引數

示例3:

>>> a=np.array([1,2,3]) >>> b=np.array([11,22,33]) >>> c=np.array([44,55,66]) >>> np.concatenate((a,b,c),axis=0)  # 預設情況下,axis=0可以不寫 array([ 1,  2,  3, 11, 22, 33, 44, 55, 66]) #對於一維陣列拼接,axis的值不影響最後的結果

>>> a=np.array([[1,2,3],[4,5,6]]) >>> b=np.array([[11,21,31],[7,8,9]]) >>> np.concatenate((a,b),axis=0) array([[ 1,  2,  3],        [ 4,  5,  6],        [11, 21, 31],        [ 7,  8,  9]])

>>> np.concatenate((a,b),axis=1)  #axis=1表示對應行的陣列進行拼接 array([[ 1,  2,  3, 11, 21, 31],        [ 4,  5,  6,  7,  8,  9]])

對numpy.append()和numpy.concatenate()兩個函式的執行時間進行比較

示例4:

>>> from time import clock as now >>> a=np.arange(9999) >>> b=np.arange(9999) >>> time1=now() >>> c=np.append(a,b) >>> time2=now() >>> print time2-time1 28.2316728446 >>> a=np.arange(9999) >>> b=np.arange(9999) >>> time1=now() >>> c=np.concatenate((a,b),axis=0) >>> time2=now() >>> print time2-time1 20.3934997107

可知,concatenate()效率更高,適合大規模的資料拼接