numpy擴充陣列函式之repeat和tile用法
阿新 • • 發佈:2019-01-30
tile函式是模板numpy.lib.shape_base中的函式。
函式的形式是tile(A,reps)
函式引數說明中提到A和reps都是array_like的,什麼是array_like的parameter呢?在網上查了一下,始終搞不明白,便把熟悉的python資料型別都試了一下,得出以下結論。
A的型別眾多,幾乎所有型別都可以:array, list, tuple, dict, matrix以及基本資料型別int, string, float以及bool型別。
reps的型別也很多,可以是tuple,list, dict, array, int,bool.但不可以是float, string, matrix型別。
假定A的維度為d,reps的長度為len
當d>=len時,將reps長度補足為d,即在reps前面加上d-len個1。
這裡的意思是,假設A為k維陣列,每一維都有一定長度,構成的向量為D。
而長度為len的reps有len個數,進行tile函式運算時補足d位,前面加d-len個1,如下圖所示:
經過tile運算,生成新的A,A的各維維度為: 其中相乘的意思為,將原來A中每一維度的元素進行copy,生成的A中此元素出現次數為新的reps對應維度的數目。操作從低維度向高維進行。 當d 2.函式操作示例 首先給幾個示例: >>> tile(1.3,2) array([ 1.3, 1.3]) array([1, 2, 1, 2, 1, 2]) >>> tile((1,2,3),2) array([1, 2, 3, 1, 2, 3]) >>> a=[[1,2,3],[4,5,5]] >>> tile(a,2) array([[1, 2, 3, 1, 2, 3], [4, 5, 5, 4, 5, 5]]) >>> tile([1,2,3],[2,2,2,2]) array([[[[1, 2, 3, 1, 2, 3], [1, 2, 3, 1, 2, 3]], [[1, 2, 3, 1, 2, 3], [1, 2, 3, 1, 2, 3]]], [[[1, 2, 3, 1, 2, 3], [1, 2, 3, 1, 2, 3]], [[1, 2, 3, 1, 2, 3], [1, 2, 3, 1, 2, 3]]]]) 拿其中一個例子進行說明: >>> a=[[1,2],[2,3]] >>> tile(a,2) array([[1, 2, 1, 2], [2, 3, 2, 3]]) 這裡a的維度為2,reps長度為1(僅僅是1個int型別資料) 則將reps長度補足為2,結果為reps = [1,2](這裡也可以寫成reps=(1,2),都無妨的) 進行copy操作,從低維進行.陣列a為a[2][2] 一維copy操作:copy兩次。a[0]變為[1,2,1,2],a[1]變為[2,3,2,3] 二維copy操作,copy1次。a變為[[1,2,1,2],[2,3,2,3]] a陣列為a[2][4] 如此則不難理解下面的結果: >>> tile(a,[1,2]) array([[1, 2, 1, 2], [2, 3, 2, 3]]) >>> tile(a,[2,2]) array([[1, 2, 1, 2], [2, 3, 2, 3], [1, 2, 1, 2], [2, 3, 2, 3]]) tile(a,[2,2])中是將上述第二步的對a的第二維的copy次數變成了兩次,a[0]copy兩次,a[1]copy兩次:[a[0],a[0],a[1],a[1]]結果如上所示。 3.函式其他注意事項
①當reps為bool型別或者是bool list型別的時候,與int型別相對應,即True對應為1,False對應為0.如:
>>> tile([1,2],[True,False])
array([], shape=(1, 0), dtype=int32)
>>> tile([1,2],[True,True])
array([[1, 2]])
>>> tile([1,2],[True,True,True])
array([[[1, 2]]])
>>> tile([1,2],True)
array([1, 2])
②當reps為dict型別時,實則取的是key值列表,且key值列表為升序排列如下所示:
>>> tile([1,2,3],{1:2,3:4})
array([[1, 2, 3, 1, 2, 3, 1, 2, 3]])
>>> tile([1,2,3],{3:4,1:2})
array([[1, 2, 3, 1, 2, 3, 1, 2, 3]])
>>> a={1:2,3:4}
>>> tile([1,2,3],a.keys())
array([[1, 2, 3, 1, 2, 3, 1, 2, 3]])
③當A為int,string,float,bool,dict等型別的時候,操作大體相似,都是講A視為一個整體,生成一個與reps的長度相同維度的陣列。如下所示:
>>> tile({1:2,3:4,5:6},3)
array([{1: 2, 3: 4, 5: 6}, {1: 2, 3: 4, 5: 6}, {1: 2, 3: 4, 5: 6}], dtype=object)
>>> tile({1:2,3:4,5:6},[2,2])
array([[{1: 2, 3: 4, 5: 6}, {1: 2, 3: 4, 5: 6}],
[{1: 2, 3: 4, 5: 6}, {1: 2, 3: 4, 5: 6}]], dtype=object)
>>> tile('abc',3)
array(['abc', 'abc', 'abc'],
dtype='|S3')
>>> tile('abc',[3,3])
array([['abc', 'abc', 'abc'],
['abc', 'abc', 'abc'],
['abc', 'abc', 'abc']],
dtype='|S3')
>>> tile(2,3)
array([2, 2, 2])
>>> tile(2,[3,3])
array([[2, 2, 2],
[2, 2, 2],
[2, 2, 2]])
不過有所不同的是,當A為string型別以及dict型別的時候,array陣列最後多了一個資訊,即dtype,原因為何,即便看了一些原始碼,也不曉得是怎麼回事,好像由array到ndarray,一大堆C的東西,搞不明白,索性作罷。另外,當對list型別進行mat操作然後作為引數A傳入tile時也可以,不過結果型別不是array型別,而是matrix型別了,原因幾何,我也無法解答。
看了tile的原始碼以後以上內容差不多都可以理解。例如之所以reps的型別有限制,在於程式碼一開始對reps進行了以下操作:
tuple(reps),無法進行該操作的reps引數就會報錯。而且dict型別的reps進行tuple化以後,key值以升序出現,這也是注意事項中2的原因,而list和tuple型別的數值順序不變。
而長度為len的reps有len個數,進行tile函式運算時補足d位,前面加d-len個1,如下圖所示:
經過tile運算,生成新的A,A的各維維度為: 其中相乘的意思為,將原來A中每一維度的元素進行copy,生成的A中此元素出現次數為新的reps對應維度的數目。操作從低維度向高維進行。 當d 2.函式操作示例 首先給幾個示例: >>> tile(1.3,2) array([ 1.3, 1.3]) array([1, 2, 1, 2, 1, 2]) >>> tile((1,2,3),2) array([1, 2, 3, 1, 2, 3]) >>> a=[[1,2,3],[4,5,5]] >>> tile(a,2) array([[1, 2, 3, 1, 2, 3], [4, 5, 5, 4, 5, 5]]) >>> tile([1,2,3],[2,2,2,2]) array([[[[1, 2, 3, 1, 2, 3], [1, 2, 3, 1, 2, 3]], [[1, 2, 3, 1, 2, 3], [1, 2, 3, 1, 2, 3]]], [[[1, 2, 3, 1, 2, 3], [1, 2, 3, 1, 2, 3]], [[1, 2, 3, 1, 2, 3], [1, 2, 3, 1, 2, 3]]]]) 拿其中一個例子進行說明: >>> a=[[1,2],[2,3]] >>> tile(a,2) array([[1, 2, 1, 2], [2, 3, 2, 3]]) 這裡a的維度為2,reps長度為1(僅僅是1個int型別資料) 則將reps長度補足為2,結果為reps = [1,2](這裡也可以寫成reps=(1,2),都無妨的) 進行copy操作,從低維進行.陣列a為a[2][2] 一維copy操作:copy兩次。a[0]變為[1,2,1,2],a[1]變為[2,3,2,3] 二維copy操作,copy1次。a變為[[1,2,1,2],[2,3,2,3]] a陣列為a[2][4] 如此則不難理解下面的結果: >>> tile(a,[1,2]) array([[1, 2, 1, 2], [2, 3, 2, 3]]) >>> tile(a,[2,2]) array([[1, 2, 1, 2], [2, 3, 2, 3], [1, 2, 1, 2], [2, 3, 2, 3]]) tile(a,[2,2])中是將上述第二步的對a的第二維的copy次數變成了兩次,a[0]copy兩次,a[1]copy兩次:[a[0],a[0],a[1],a[1]]結果如上所示。 3.函式其他注意事項