pandas資料結構及資料讀寫
阿新 • • 發佈:2019-02-01
1.資料結構
Series
類似python的字典。
建立:
pandas.Series([1,2,3,4,5], index=['a','b','c','f','e']) #Index相當於字典的key
pandas.Series ( {'a':5} ) #用字典建立物件
查詢物件中的元素
s[['a','b','c']] #直接查詢一組key,返回用這組key和對應value組成的新Series物件
s['a'] #直接查詢某個key,返回valu
head(n), tail(n) #取出頭n行或尾n行的方法,預設n=5
index values #兩個物件屬性,可以取得key列表和values
元素統計方法
len(s) #Series長度,包括NaN
s.count() #Series長度,不包括NaN
s.unique() #返回不重複values值
s.value_counts() #value出現次數統計
DataFrame
建立 pandas.DataFrame([s,s,s]) #使用Series建立,每一行為一個series
df=pandas.DataFrame([s1,s2]) #使用列表的列表建立,每一行為一個列表anaaffsfsdfa
df=pandas.DataFrame({"a":s1,"b":s2}) #使用字典結合列表建立,每一列為一個列表,字典key作為新物件的列的標題
檢視物件中的元素
df.columns #返回列名稱列表
for index, row in df.iterrows(): #以行遍歷整個資料,返回值為每行資料的陣列
print row.values
head(n), tail(n) #取出頭n行或尾n行的方法,預設n=5
元素統計方法
df.shape #返回資料行數和列陣列成的元素