1. 程式人生 > >numpy的dtype,astype,b=np.array(a,dtype='int16')型別轉換,不改變長度

numpy的dtype,astype,b=np.array(a,dtype='int16')型別轉換,不改變長度

綜述:

np型別的a如果直接修改如:a.dtype='int16',那麼直接會修改a,會導致長度的不一致,如果要直接修改則要採用astype方法如:b=a.astype('int16'),a保持不變,b的長度等於a,並且type由a變成了into6,或者呼叫b=np.array(a,dtype='int16'),效果和astype一樣。另外b=np.array(a,dtype=np.int16)中的np.int16是一樣的

float型別預設float64=float,int型別預設int64=int,uint型別預設uint64=uint。產生陣列的時候如果指定,預設就是float64.

匯入numpy

>>> import numpy as np

生成一個浮點陣列

>>> a = np.random.random(4)

看看資訊

>>> a
array([ 0.0945377 ,  0.52199916,  0.62490646,  0.21260126])
>>> a.dtype
dtype('float64')
>>> a.shape
(4,)

改變dtype,發現數組長度翻倍!

>>> a.dtype = 'float32'
>>> a
array([  3.65532693e+20,   1.43907535e+00,  -3.31994873e-25,
         1.75549972e+00,  -2.75686653e+14,   1.78122652e+00,
        -1.03207532e-19,   1.58760118e+00], dtype=float32)
>>> a.shape
(8,)


改變dtype,陣列長度再次翻倍!

>>> a.dtype = 'float16'
>>> a
array([ -9.58442688e-05,   7.19000000e+02,   2.38159180e-01,
         1.92968750e+00,              nan,  -1.66034698e-03,
        -2.63427734e-01,   1.96875000e+00,  -1.07519531e+00,
        -1.19625000e+02,              nan,   1.97167969e+00,
        -1.60156250e-01,  -7.76290894e-03,   4.07226562e-01,
         1.94824219e+00], dtype=float16)
>>> a.shape
(16,)

改變dtype='float',發現預設就是float64,長度也變回最初的4

>>> a.dtype = 'float'
>>> a
array([ 0.0945377 ,  0.52199916,  0.62490646,  0.21260126])
>>> a.shape
(4,)
>>> a.dtype
dtype('float64')

把a變為整數,觀察其資訊

>>> a.dtype = 'int64'
>>> a
array([4591476579734816328, 4602876970018897584, 4603803876586077261,
       4596827787908854048], dtype=int64)
>>> a.shape
(4,)

改變dtype,發現數組長度翻倍!

>>> a.dtype = 'int32'
>>> a
array([ 1637779016,  1069036447, -1764917584,  1071690807,  -679822259,
        1071906619, -1611419360,  1070282372])
>>> a.shape
(8,)

改變dtype,發現數組長度再次翻倍!

>>> a.dtype = 'int16'
>>> a
array([-31160,  24990,  13215,  16312,  32432, -26931, -19401,  16352,
       -17331, -10374,   -197,  16355, -20192, -24589,  13956,  16331], dtype=int16)
>>> a.shape
(16,)

改變dtype,發現數組長度再次翻倍!

>>> a.dtype = 'int8'
>>> a
array([  72, -122,  -98,   97,  -97,   51,  -72,   63,  -80,  126,  -51,
       -106,   55,  -76,  -32,   63,   77,  -68,  122,  -41,   59,   -1,
        -29,   63,   32,  -79,  -13,  -97, -124,   54,  -53,   63], dtype=int8)
>>> a.shape
(32,)

改變dtype,發現整數預設int64!

>>> a.dtype = 'int'
>>> a.dtype
dtype('int64')
>>> a array([4591476579734816328, 4602876970018897584, 4603803876586077261,
             4596827787908854048], dtype=int64)
>>> a.shape
(4,)

二、換一種玩法

很多時候我們用numpy從文字檔案讀取資料作為numpy的陣列,預設的dtype是float64。
但是有些場合我們希望有些資料列作為整數。如果直接改dtype='int'的話,就會出錯!原因如上,陣列長度翻倍了!!!


下面的場景假設我們得到了匯入的資料。我們的本意是希望它們是整數,但實際上是卻是浮點數(float64)

>>> b = np.array([1., 2., 3., 4.])
>>> b.dtype
dtype('float64')

用 astype(int) 得到整數,並且不改變陣列長度

>>> c = b.astype(int)
>>> c
array([1, 2, 3, 4])
>>> c.shape
(4,)
>>> c.dtype
dtype('int64')

如果直接改變b的dtype的話,b的長度翻倍了,這不是我們想要的(當然如果你想的話)如果是float64轉到int64那麼長度不變,如果轉到int32那麼長度就會改變

>>> b
array([ 1.,  2.,  3.,  4.])

>>> b.dtype = 'int32'
>>> b.dtype
dtype('int32')
>>> b
array([         0, 1072693248,          0, 1073741824,          0,
       1074266112,          0, 1074790400], dtype=int32)
>>> b.shape
(8,)

三、結論

numpy中的資料型別轉換,不能直接改原資料的dtype!  只能用函式astype()。