Python data science thd numpy basic
Numpy最重要的一個特
(ndarray)點是其N維陣列物件,該物件是一個快速而靈活地大資料集容器
建立ndarray建立陣列最簡單的方法就是使用array函式,它接收一切陣列性的物件,然後產生一個新的含有傳入陣列的NumPy物件
data=[2,3,4]
arr1=np.array(data)
np.zeros(10),np.ones(10) ,np.empty(10) 可以建立一個沒有任何具體值得陣列
np.zeros((3,6)) ,np.empty((2,3,2)) empty返回的都是未初始化的垃圾值
arange是Python內建函式range的陣列版
np.arrange(15)
輸出是array([15個數值])
NumPy的資料型別都是float64浮點數(幾乎)
ndarray的資料型別的指定:
np.array([1,2,3],dtype=np.int32)dtype的命名方式相同:一個型別名,後面跟一個表示各元素長的數字
arr1.astype(np.float64)可以改變其方式
跟列表最重要的區別是,陣列切片是原始資料的檢視,這意味著資料不會被複制,檢視上的任意修改都會直接反應到原陣列上
arr1=np.arange(10)
arr1[5:8]=12
如果你需要將陣列複製,你需要顯式的將陣列copy出來,進行復制操作
arr1[5:8].copy()
可以利用以逗號隔開的索引列表來選取每個元素arr1[2,3]
只有冒號表示選取整個軸,arr[:,:1] arr[:2,1:]=0,對切片的賦值操作也會擴散到整個選區
mask=(name=='Bob') | (name=='Will') 布林型索引選取陣列,
花式索引:(就是可以根據索引將陣列選區出來)
花式索引總是將新陣列複製到一個新的儲存單元;arr.T轉置