Python常用第三方模組
阿新 • • 發佈:2019-01-31
作者:iGuo
連結:https://zhuanlan.zhihu.com/p/21365319
來源:知乎
著作權歸作者所有。商業轉載請聯絡作者獲得授權,非商業轉載請註明出處。
連結:https://zhuanlan.zhihu.com/p/21365319
來源:知乎
著作權歸作者所有。商業轉載請聯絡作者獲得授權,非商業轉載請註明出處。
一、Python爬蟲
爬蟲的主要模組是三個:請求、解析、儲存。這裡介紹一下我們專案常用的模組。
1. 請求
對HTTP協議進行高度封裝的庫,比系統自帶的urllib系列的庫好用很多。2、3相容的庫。
2. 解析:
解析HTML的神器。比正則好用很多。2、3相容的庫。
3. 儲存:
把資料寫成csv格式。
把資料寫入MySQL裡面。
4. 併發(主要是為了提高效率)
主要是三個:協程、執行緒、程序
二、Python資料分析&科學計算
Copy了MATLAB的資料結構。很多資料分析和科學計算庫的底層模組。提供了良好的陣列資料結構和C拓展介面。
Copy了R的data frame的資料結構。(pandas的作者是上次專欄提到的《利用Python進行資料分析》 的作者)
高階科學計算庫。包括概率統計、訊號、傅立葉等等。(表示只用過scipy.stats,即概率統計的庫)
符號計算庫。(微分積分等等)
統計&計量庫。
三、Python資料探勘
自然語言處理的庫。(《Python自然語言處理》就是這個庫的官方教程。)
(待完善)