1. 程式人生 > >Python常用第三方模組

Python常用第三方模組

作者:iGuo
連結:https://zhuanlan.zhihu.com/p/21365319
來源:知乎
著作權歸作者所有。商業轉載請聯絡作者獲得授權,非商業轉載請註明出處。

一、Python爬蟲

爬蟲的主要模組是三個:請求、解析、儲存。這裡介紹一下我們專案常用的模組。


1. 請求

對HTTP協議進行高度封裝的庫,比系統自帶的urllib系列的庫好用很多。2、3相容的庫。


2. 解析:

解析HTML的神器。比正則好用很多。2、3相容的庫。


3. 儲存:

把資料寫成csv格式。




把資料寫入MySQL裡面。


4. 併發(主要是為了提高效率)

主要是三個:協程、執行緒、程序





二、Python資料分析&科學計算


Copy了MATLAB的資料結構。很多資料分析和科學計算庫的底層模組。提供了良好的陣列資料結構和C拓展介面。


Copy了R的data frame的資料結構。(pandas的作者是上次專欄提到的《利用Python進行資料分析》 的作者)


高階科學計算庫。包括概率統計、訊號、傅立葉等等。(表示只用過scipy.stats,即概率統計的庫)


符號計算庫。(微分積分等等)


統計&計量庫。


三、Python資料探勘

自然語言處理的庫。(《Python自然語言處理》就是這個庫的官方教程。)

(待完善)