1. 程式人生 > 其它 >爬蟲與Python:(四)爬蟲進階擴充套件之Pandas——1.什麼是Pandas

爬蟲與Python:(四)爬蟲進階擴充套件之Pandas——1.什麼是Pandas

什麼是Pandas

  • Pandas 是 Python 語言的一個擴充套件程式庫,用於資料分析。
  • Pandas 是一個開放原始碼、BSD 許可的庫,提供高效能、易於使用的資料結構和資料分析工具。
  • Pandas 名字衍生自術語 "panel data"(面板資料)和 "Python data analysis"(Python 資料分析)。
  • Pandas 一個強大的分析結構化資料的工具集,基礎是 Numpy(提供高效能的矩陣運算)。
  • Pandas 可以從各種檔案格式比如 CSV、JSON、SQL、Microsoft Excel 匯入資料。
  • Pandas 可以對各種資料進行運算操作,比如歸併、再成形、選擇,還有資料清洗和資料加工特徵。
  • Pandas 廣泛應用在學術、金融、統計學等各個資料分析領域。

Pandas應用

Pandas 的主要資料結構是 Series (一維資料)與 DataFrame(二維資料),這兩種資料結構足以處理金融、統計、社會科學、工程等領域裡的大多數典型用例。

資料結構

Series 是一種類似於一維陣列的物件,它由一組資料(各種Numpy資料型別)以及一組與之相關的資料標籤(即索引)組成。

DataFrame 是一個表格型的資料結構,它含有一組有序的列,每列可以是不同的值型別(數值、字串、布林型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 組成的字典(共同用一個索引)。

相關連結

參考網址

有志者,事竟成,破釜沉舟,百二秦關終屬楚; 苦心人,天不負,臥薪嚐膽,三千越甲可吞吳。