1. 程式人生 > >Python資料分析Numpy庫方法簡介(二)

Python資料分析Numpy庫方法簡介(二)

資料分析圖片儲存:vg

  1.儲存圖片:plt.savefig(path)

  2.圖片格式:jpg,png,svg(建議使用,不失真)

  3.資料儲存格式: excle,csv

csv介紹

  csv就是用逗號隔開的純文字資訊!!會以表格的資訊開啟

矩陣生成的相關屬性

    

  impor numpy as np #匯入模組

  a = np.array([1,2,3,4,5]) #一維矩陣
  a = np.array([[1,2,3],[4,5,6]]) #二維矩陣
  np.eye(3) #單位矩陣
  np.diag(np.array([1,2,3,4])) #對角矩陣
  a.size #矩陣的總數量
  a.shape #矩陣的行列
  a.ndim #矩陣的維度
  a.dtype #矩陣的資料型別

矩陣的基本操作

      

  #基本操作
  import numpy as np
  a = np.arange(1,10).reshape(3,3)
  b = np.arange(11,20).reshape(3,3)
  a+b/np.add(a,b)
  a[a>5] #判斷提出大於5的資料
  a**2
  #自帶的數學函式
  a.max() #最大值
  a.min() #最小值
  a.mean() #平均數
  a.sum() #和
  a.sum(axis=0\1)#每列\行的和
  a.std() #標準差反應是資料和平均值的離散情況
  a.sqrt() #平方根
  np.where(a<80,0,90) #三目 如果小於80替換為0,否則替換成90

切片靈活操作資料 (重點) 

  #切片靈活操作資料
  import numpy as np
  a = np.arange(1,10).reshape(3,3)
  """
  array([[1, 2, 3],
  [4, 5, 6],
    [7, 8, 9]])
  """
  a[:,1] #所有行的第二列資料 array([2, 5, 8])
  a[:2,:2] #前兩行的前兩列資料array([[1, 2][4,5]])
  a[0].max() #第一行的最大資料 3
  a[0][1] #第一行的第二個資料 2

Numpy讀文件

格式(一般不使用)
  • a = np.genfromtxt(path,delimiter=',',dtype=str,skip_header=1)

Ndarray和list的區別

  • Ndarray建立時有固定的大小(list可動態增加)

  • Ndarray元素都具有相同的資料型別

  • Ndarray內建大量的數學函式可進行高等數學相關操作(高效)

  • Ndarray支援向量化(向量化)--簡潔,高效,更接近標準數學

    • 比如:二維list每個元素相乘,需要雙層迴圈

    • a+b ===>矩陣自動實現每個對應元素相加

    • 列表 a +b ===> 列表連線

演算法彙總

  1. np.std()標準差 --------->反應與平均值的離散情況

  2. 正態分佈:

    • 也叫鐘行圖,高斯分佈

    • 反應是集中的分佈趨勢,峰值周圍是分佈資料量最多的

    • np.random.randn(3,3)測試的符合正太分佈的資料

    • 反應的現實情況,種群智力水平,身高,體重,醫學領域.

  3. 點陣積:dot()

    • 待講................