1. 程式人生 > >numpy擴充陣列函式之repeat和tile用法

numpy擴充陣列函式之repeat和tile用法

tile函式是模板numpy.lib.shape_base中的函式。 函式的形式是tile(A,reps) 函式引數說明中提到A和reps都是array_like的,什麼是array_like的parameter呢?在網上查了一下,始終搞不明白,便把熟悉的python資料型別都試了一下,得出以下結論。 A的型別眾多,幾乎所有型別都可以:array, list, tuple, dict, matrix以及基本資料型別int, string, float以及bool型別。 reps的型別也很多,可以是tuple,list, dict, array, int,bool.但不可以是float, string, matrix型別。 假定A的維度為d,reps的長度為len 當d>=len時,將reps長度補足為d,即在reps前面加上d-len個1。 這裡的意思是,假設A為k維陣列,每一維都有一定長度,構成的向量為D。
Numpy的tile函式

而長度為len的reps有len個數,進行tile函式運算時補足d位,前面加d-len個1,如下圖所示: Numpy的tile函式
經過tile運算,生成新的A,A的各維維度為:Numpy的tile函式 其中相乘的意思為,將原來A中每一維度的元素進行copy,生成的A中此元素出現次數為新的reps對應維度的數目。操作從低維度向高維進行。 當d 2.函式操作示例 首先給幾個示例: >>> tile(1.3,2) array([ 1.3,  1.3]) array([1, 2, 1, 2, 1, 2]) >>> tile((1,2,3),2) array([1, 2, 3, 1, 2, 3]) >>> a=[[1,2,3],[4,5,5]] >>> tile(a,2) array([[1, 2, 3, 1, 2, 3],        [4, 5, 5, 4, 5, 5]]) >>> tile([1,2,3],[2,2,2,2]) array([[[[1, 2, 3, 1, 2, 3],          [1, 2, 3, 1, 2, 3]],         [[1, 2, 3, 1, 2, 3],          [1, 2, 3, 1, 2, 3]]],        [[[1, 2, 3, 1, 2, 3],          [1, 2, 3, 1, 2, 3]],         [[1, 2, 3, 1, 2, 3],          [1, 2, 3, 1, 2, 3]]]]) 拿其中一個例子進行說明: >>> a=[[1,2],[2,3]] >>> tile(a,2) array([[1, 2, 1, 2],        [2, 3, 2, 3]]) 這裡a的維度為2,reps長度為1(僅僅是1個int型別資料) 則將reps長度補足為2,結果為reps = [1,2](這裡也可以寫成reps=(1,2),都無妨的) 進行copy操作,從低維進行.陣列a為a[2][2] 一維copy操作:copy兩次。a[0]變為[1,2,1,2],a[1]變為[2,3,2,3] 二維copy操作,copy1次。a變為[[1,2,1,2],[2,3,2,3]] a陣列為a[2][4] 如此則不難理解下面的結果: >>> tile(a,[1,2]) array([[1, 2, 1, 2],        [2, 3, 2, 3]]) >>> tile(a,[2,2]) array([[1, 2, 1, 2],        [2, 3, 2, 3],        [1, 2, 1, 2],        [2, 3, 2, 3]]) tile(a,[2,2])中是將上述第二步的對a的第二維的copy次數變成了兩次,a[0]copy兩次,a[1]copy兩次:[a[0],a[0],a[1],a[1]]結果如上所示。 3.函式其他注意事項
①當reps為bool型別或者是bool list型別的時候,與int型別相對應,即True對應為1,False對應為0.如: >>> tile([1,2],[True,False]) array([], shape=(1, 0), dtype=int32) >>> tile([1,2],[True,True]) array([[1, 2]]) >>> tile([1,2],[True,True,True]) array([[[1, 2]]]) >>> tile([1,2],True) array([1, 2]) ②當reps為dict型別時,實則取的是key值列表,且key值列表為升序排列如下所示: >>> tile([1,2,3],{1:2,3:4}) array([[1, 2, 3, 1, 2, 3, 1, 2, 3]]) >>> tile([1,2,3],{3:4,1:2}) array([[1, 2, 3, 1, 2, 3, 1, 2, 3]]) >>> a={1:2,3:4} >>> tile([1,2,3],a.keys()) array([[1, 2, 3, 1, 2, 3, 1, 2, 3]]) ③當A為int,string,float,bool,dict等型別的時候,操作大體相似,都是講A視為一個整體,生成一個與reps的長度相同維度的陣列。如下所示: >>> tile({1:2,3:4,5:6},3) array([{1: 2, 3: 4, 5: 6}, {1: 2, 3: 4, 5: 6}, {1: 2, 3: 4, 5: 6}], dtype=object) >>> tile({1:2,3:4,5:6},[2,2]) array([[{1: 2, 3: 4, 5: 6}, {1: 2, 3: 4, 5: 6}],        [{1: 2, 3: 4, 5: 6}, {1: 2, 3: 4, 5: 6}]], dtype=object) >>> tile('abc',3) array(['abc', 'abc', 'abc'],        dtype='|S3') >>> tile('abc',[3,3]) array([['abc', 'abc', 'abc'],        ['abc', 'abc', 'abc'],        ['abc', 'abc', 'abc']],        dtype='|S3') >>> tile(2,3) array([2, 2, 2]) >>> tile(2,[3,3]) array([[2, 2, 2],        [2, 2, 2],        [2, 2, 2]]) 不過有所不同的是,當A為string型別以及dict型別的時候,array陣列最後多了一個資訊,即dtype,原因為何,即便看了一些原始碼,也不曉得是怎麼回事,好像由array到ndarray,一大堆C的東西,搞不明白,索性作罷。另外,當對list型別進行mat操作然後作為引數A傳入tile時也可以,不過結果型別不是array型別,而是matrix型別了,原因幾何,我也無法解答。 看了tile的原始碼以後以上內容差不多都可以理解。例如之所以reps的型別有限制,在於程式碼一開始對reps進行了以下操作: tuple(reps),無法進行該操作的reps引數就會報錯。而且dict型別的reps進行tuple化以後,key值以升序出現,這也是注意事項中2的原因,而list和tuple型別的數值順序不變。