1. 程式人生 > >python下pandas庫的學習

python下pandas庫的學習

Python中的pandas模組進行資料分析。

接下來pandas介紹中將學習到如下8塊內容:
1、資料結構簡介:DataFrame和Series
2、資料索引index
3、利用pandas查詢資料
4、利用pandas的DataFrames進行統計分析
5、利用pandas實現SQL操作
6、利用pandas進行缺失值的處理
7、利用pandas實現Excel的資料透視表功能
8、多層索引的使用

一、資料結構介紹
在pandas中有兩類非常重要的資料結構,即序列Series和資料框DataFrame。Series類似於numpy中的一維陣列,除了通吃一維陣列可用的函式或方法,而且其可通過索引標籤的方式獲取資料,還具有索引的自動對齊功能;DataFrame類似於numpy中的二維陣列,同樣可以通用numpy陣列的函式和方法,而且還具有其他靈活應用,後續會介紹到。
1、Series的建立

序列的建立主要有三種方式:
1)通過一維陣列建立序列

import numpy as np, pandas as pd
arr1 = np.arange(10)
arr1
type(arr1)
s1 = pd.Series(arr1)
s1
type(s1)

2)通過字典的方式建立序列

import numpy as np, pandas as pd
arr1 = np.arange(10)
arr1
type(arr1)
s1 = pd.Series(arr1)
s1
type(s1)

3)通過DataFrame中的某一行或某一列建立序列

這部分內容我們放在後面講,因為下面就開始將DataFrame的建立。