複習小結3-資料結構
阿新 • • 發佈:2018-12-12
Series資料結構 實際上是介紹一些Series的基本屬性,和結構之間的關聯並不大 #製造Series #可以直接用list傳入資料,或者傳入字典或標量 import pandas as P import numpy as N s1 = P.Series([1,2,3,4]) s2 = P.Series({'A':1,'B':2,'C':3}) s3 = P.Series(N.random.randn(10)) #索引 s[tag or location] #加入新資料,類似dataframe加入新列的操作(本質接近,都是加入一個低緯度的單位資料) #s3[10]=100 #標籤對齊 我覺得這個翻譯也不太好,這個更接近與一些標籤的匹配特性 實際意義就是如果兩個Series相結合,index相同的會放在一起處理,不同的會分開並且與nan一起處理
#DataFrame資料結構 #傳入DataFrame,可以傳入行列表,字典或者多維元祖 #d1 = [1,2,3,4] d = [[1,2,3,4],[5,6,7]] d_1 = P.DataFrame(d,index = ['one','two'],columns = ['a','b','c','d']) d_2= {'A':[1,2,3],'B':[1,2,4],'C':[6,1,7]}#key為列標籤元素的維度必須相同,否則報錯 d2 = P.DataFrame(d_2,index) d_3 = {('a','b'):{('A','B'):3,('A','C'):4}, ('a','c'):{('A','B'):3,('A','D'):5} } d3 = P.DataFrame(d_3)#用多維元祖有點抽象,大概意思是字典內的key是分類,value的字典也是分類,傳入後,pandas會自動對有分類的填充對應值,沒有對應值的則填入nan