pandas學習筆記(一)
阿新 • • 發佈:2018-10-13
大數據 技術分享 貢獻 如何 name 自定義 內存 ren nbsp )。
Pandas是一款開放源碼的BSD許可的Python庫,為Python編程語言提供了高性能,易於使用的數據結構和數據分析工具。Pandas用於廣泛的領域,包括金融,經濟,統計,分析等學術和商業領域。在本教程中,我們將學習Python Pandas的各種功能以及如何在實踐中使用它們。
Python Pandas的官方網站是: http://pandas.pydata.org/ ,打開後如下所示 -
Pandas庫的介紹
Pandas是一個開放源碼的Python庫,它使用強大的數據結構提供高性能的數據操作和分析工具。它的名字:Pandas是從Panel Data - 多維數據的計量經濟學(an Econometrics from Multidimensional data
2008年,為滿足需要高性能,靈活的數據分析工具,開發商Wes McKinney開始開發Pandas。
在Pandas之前,Python主要用於數據遷移和準備。它對數據分析的貢獻更小。 Pandas解決了這個問題。 使用Pandas可以完成數據處理和分析的五個典型步驟,而不管數據的來源 - 加載,準備,操作,模型和分析。
Python Pandas用於廣泛的領域,包括金融,經濟,統計,分析等學術和商業領域。
Pandas的主要特點
- 快速高效的DataFrame對象,具有默認和自定義的索引。
- 將數據從不同文件格式加載到內存中的數據對象的工具。
- 丟失數據的數據對齊和綜合處理。
- 重組和擺動日期集。
- 基於標簽的切片,索引和大數據集的子集。
- 可以刪除或插入來自數據結構的列。
- 按數據分組進行聚合和轉換。
- 高性能合並和數據加入。
- 時間序列功能。
pandas學習筆記(一)