1. 程式人生 > >pandas學習筆記(一)

pandas學習筆記(一)

大數據 技術分享 貢獻 如何 name 自定義 內存 ren nbsp

Pandas是一款開放源碼的BSD許可的Python庫,為Python編程語言提供了高性能,易於使用的數據結構和數據分析工具。Pandas用於廣泛的領域,包括金融,經濟,統計,分析等學術和商業領域。在本教程中,我們將學習Python Pandas的各種功能以及如何在實踐中使用它們。

Python Pandas的官方網站是: http://pandas.pydata.org/ ,打開後如下所示 -

技術分享圖片

Pandas庫的介紹

Pandas是一個開放源碼的Python庫,它使用強大的數據結構提供高性能的數據操作和分析工具。它的名字:Pandas是從Panel Data - 多維數據的計量經濟學(an Econometrics from Multidimensional data

)。

2008年,為滿足需要高性能,靈活的數據分析工具,開發商Wes McKinney開始開發Pandas

Pandas之前,Python主要用於數據遷移和準備。它對數據分析的貢獻更小。 Pandas解決了這個問題。 使用Pandas可以完成數據處理和分析的五個典型步驟,而不管數據的來源 - 加載,準備,操作,模型和分析。

Python Pandas用於廣泛的領域,包括金融,經濟,統計,分析等學術和商業領域。

Pandas的主要特點

  • 快速高效的DataFrame對象,具有默認和自定義的索引。
  • 將數據從不同文件格式加載到內存中的數據對象的工具。
  • 丟失數據的數據對齊和綜合處理。
  • 重組和擺動日期集。
  • 基於標簽的切片,索引和大數據集的子集。
  • 可以刪除或插入來自數據結構的列。
  • 按數據分組進行聚合和轉換。
  • 高性能合並和數據加入。
  • 時間序列功能。

pandas學習筆記(一)