python中的pandas的兩種基本使用
python中的pandas的兩種基本使用
2018年05月19日 16:03:36 木子柒努力成長 閱讀數:480
一、pandas簡介
pandas:panel data analysis(面板資料分析),是基於numpy 構建的含有更高階資料結構和工具的資料分析包,類似於numpy ,pandas也是圍繞著Series 和 DataFrame兩個核心資料結構展開的。Series 和 DataFrame 分別對應於一維的數列和二維的表結構。pandas的匯入方式如下:
import pandas as pd
from pandas import Series,DataFrame
1.建立物件
1.1,可以通過傳遞一個list物件來建立一個Series,pandas預設建立整型索引:
import numpy as np
import pandas as pd
from pandas import Series,DataFrame
s=Series([1,2,3,4,np.nan,6])
print(s)
0 1.0
1 2.0
2 3.0
3 4.0
4 NaN
5 6.0
dtype: float64
1.2,通過傳遞一個能夠被轉換成類似序列結構的的字典物件來建立一個DataFrame:
from pandas import Series,DataFrame
data={'state':['yes','yes','yes','no','no'],
'year':[2000,2001,2002,2003,2004],
'pop':[1.5,1.7,3.6,2.4,2.9]}
s=DataFrame(data)
print(s)
pop state year
0 1.5 yes 2000
1 1.7 yes 2001
2 3.6 yes 2002
3 2.4 no 2003
4 2.9 no 2004
1.3,檢視資料型別和檢視資料
print(s.dtypes)
print(s.head(1))
print(s.tail(2))
pop float64
state object
year int64
dtype: object
pop state year
0 1.5 yes 2000
pop state year
3 2.4 no 2003
4 2.9 no 2004