Python資料分析Numpy庫方法簡介(二)
資料分析圖片儲存:vg
1.儲存圖片:plt.savefig(path)
2.圖片格式:jpg,png,svg(建議使用,不失真)
3.資料儲存格式: excle,csv
csv介紹
csv就是用逗號隔開的純文字資訊!!會以表格的資訊開啟
矩陣生成的相關屬性
impor numpy as np #匯入模組
a = np.array([1,2,3,4,5]) #一維矩陣
a = np.array([[1,2,3],[4,5,6]]) #二維矩陣
np.eye(3) #單位矩陣
np.diag(np.array([1,2,3,4])) #對角矩陣
a.size #矩陣的總數量
a.shape #矩陣的行列
a.ndim #矩陣的維度
a.dtype #矩陣的資料型別
矩陣的基本操作
#基本操作
import numpy as np
a = np.arange(1,10).reshape(3,3)
b = np.arange(11,20).reshape(3,3)
a+b/np.add(a,b)
a[a>5] #判斷提出大於5的資料
a**2
#自帶的數學函式
a.max() #最大值
a.min() #最小值
a.mean() #平均數
a.sum() #和
a.sum(axis=0\1)#每列\行的和
a.std() #標準差反應是資料和平均值的離散情況
a.sqrt() #平方根
np.where(a<80,0,90) #三目 如果小於80替換為0,否則替換成90
#切片靈活操作資料
import numpy as np
a = np.arange(1,10).reshape(3,3)
"""
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
"""
a[:,1] #所有行的第二列資料 array([2, 5, 8])
a[:2,:2] #前兩行的前兩列資料array([[1, 2][4,5]])
a[0].max() #第一行的最大資料 3
a[0][1] #第一行的第二個資料 2
Numpy讀文件
格式(一般不使用)
Ndarray和list的區別
-
Ndarray建立時有固定的大小(list可動態增加)
-
Ndarray元素都具有相同的資料型別
-
Ndarray內建大量的數學函式可進行高等數學相關操作(高效)
-
Ndarray支援向量化(向量化)--簡潔,高效,更接近標準數學
-
比如:二維list每個元素相乘,需要雙層迴圈
-
a+b ===>矩陣自動實現每個對應元素相加
-
列表 a +b ===> 列表連線
-
演算法彙總
-
np.std()標準差 --------->反應與平均值的離散情況
-
正態分佈:
-
也叫鐘行圖,高斯分佈
-
反應是集中的分佈趨勢,峰值周圍是分佈資料量最多的
-
np.random.randn(3,3)測試的符合正太分佈的資料
-
反應的現實情況,種群智力水平,身高,體重,醫學領域.
-
-
點陣積:dot()
-
待講................
-