第五節 Python資料分析
阿新 • • 發佈:2018-11-10
資料分析
## Numpy ##
- import numpy as np匯入Numpy
- np.array(list,dtype=int)構造陣列(任意維度)([[1,2,3],[2,3,4]].這是一個二維陣列),dtype強行轉換型別。最通用的是object
- 陣列屬性 .shap屬性返回陣列的行和列。np.shap(a)也可以拿到屬性。.dtype拿到資料型別
.itemsize屬性表示每個元素佔多少位元組 - 陣列方法 .fill(值)把陣列變成傳入的值。np.zeros((2,3))生成2行3列全0的陣列.np.ones((2,3))全1的陣列。np.arange(開始,結束。間隔) 生成這樣一個數組. np.linspace(開始,結束。個數)
- np.inf 無窮大,np.nan 不合法的數
- 二維陣列索引:a[index][index] 或者 a[index,index]
for index,i in np.ndenumerate(a):
查詢二維陣列所有元素
print(index,i)- a.sum()求所有元素的和,a.sum(axis=0)求類似於把a.shape得到的元組去掉axis值所在的元素求和
- a.shape= 2,5,10把陣列分成1個三維陣列,每個三維包含2個二維,每個二維保護5個一維,每個一維包含5個元素
- num.prod()求積。a[None,:,:]在原有維度增加一個維度。a.T 行轉列,列轉行
- np.concatenate(a,b,axis=index) 拼接陣列,除了指定的index,其他維度長度需要一樣
矩陣乘法:a.dot(a)
scipy
scipy.interpolate:插值 scipy.stats:統計 scipy.optimize:優化 scipy.integrate:積分 scipy.linalg:線代
Matplotlib
- 畫圖:視覺化圖形工具
- Matplotlib官網進行學習