1. 程式人生 > >Numpy和Pandas

Numpy和Pandas

     NumPy有著種種出色的特性(優化了Python計算過程),其本身則難以獨支資料分析這座大廈,這是一方面是由於NumPy幾乎僅專注於陣列處理,另一方面則是資料分析牽涉到的資料特性眾多,需要處理各種表格和混雜資料,遠非純粹的陣列(NumPy)方便解決的,而這就是pandas發力的地方。

     Pandas名稱來源於panel data(面板資料),從而可見其要處理的資料是多維度的而非單維度.pandas 含有使資料清洗和分析工作變得更快更簡單的資料結構與操作工具。經常是和其他工具一起使用,如數值計算工具NumPy和SciPy,分析庫statsmodels與scikit-learn,以及資料視覺化庫matplotlib。

     其中NumPy則是構建pandas的基礎,後者大量借鑑了NumPy編碼風格。

 

     如果用做一餐飯來比喻,pandas於處理資料方面的功用則相當於將米洗好,將菜摘好洗好以及切好的過程,至於入鍋添油加醋,鍋鏟搗騰,做成一道菜則是依靠statsmodels、scikit-learn和matplotlib的功能。