python 常用包總結
1、 Import 函式 from 庫,往後可以直接使用 函式 import庫,要使用函式則需 庫.函式。
2、 %matplotlib inline是jupyter notebook裡的命令, 意思是將那些用matplotlib繪製的圖顯示在頁面裡而不是彈出一個視窗
3、 用圖形表示迴歸效果可以採用橫座標為實際值,縱座標為預測值(採用橫座標的標定作為標定)則預測點越集中在y=x座標線上則迴歸預測效果越好。
4、 安裝,http://www.lfd.uci.edu/~gohlke/pythonlibs/#opencv提供各種包whl檔案。安裝whl檔案需要設定環境變數為D:\SOFT\Python27\Scripts, pip install whl提示安裝成功。回到包所在檔案開啟cmd視窗輸入pip install 包名,安裝包。使用 import 包名測試是否安裝成功。
5、 Numpy包: numpy陣列切片的修改直接反映到原陣列,但是列表對切片的修改不反應到原陣列。建立多維陣列 np.arange(1,10).reshape(3,3)
Numpy.array建立一個矩陣a,並對矩陣進行計算最大a.max(),最小,平均數a.mean()。也可以按行處理a.max(axis=1),計算某行資料的最大,最小以及平均數。遍歷前兩行的第二列。三維可以理解為一個數字組成的立方塊。
Numpy支援對多維陣列的翻轉等操作,求和,計算三角函式,多次方求和以及SVD分解等多種操作。以及隨機函式模組。Numpy.random
6、 Matplotlib:處理資料視覺化的包,利用numpy強大的運算能力結合matplotlib使用;使用matplotlib畫散點圖步驟,第一種使用scatter(x,y),系統自動建立座標系,第二種使用plot(x,y)系統也是自動建立座標系,plot函式預設畫連線圖。比較,scatter比plot適合畫散點圖。
7、 Pandas是一個為解決python資料分析而用的包,可以快速構建資料結構。
8、 scikit-learn簡稱sklearn,在匯入資料包時只能使用import sklearn。
線性迴歸函式採用最小二乘函式擬合。給定n個引數及其對應的x值以及應該輸出的y。訓練相關引數的值,再用這個引數給出線性方程預測未知y的值。函式呼叫方法,先建立一個引用,給定訓練值。利用訓練模型去預測測試集。
Kmeans:plot 是做折線圖,也可以做散點圖;scatter專門做散點圖。在資料處理的時候要明確轉變成數值型,不然會出現莫名現象Kmeans使用方法,首先建立KMeans模型,然後載入資料返回資料分類結果。
9、 request:網路爬蟲相關包,可以偽裝成瀏覽器,躲過伺服器審查。