Pandas之DataFrame的使用
阿新 • • 發佈:2020-08-08
(二)熟悉pandas的兩個工具資料結構:Series和DataFrame
DataFrame
DateFrame
表示的是矩陣的資料表,它包含已排序的列集合,每一列可以是不同的值型別(數值,字串,布林值等)。它既有行索引也有列索引。
建立一個DateFrame
物件
data = {'state':['Ohio','Ohio','Ohio','Nevada','Nevada','Nevada'], 'year': [2000,2001,2002,2001,2002,2003], 'pop': [1.5,1.7,3.6,2.4,2.9,3.2]} frame = pd.DataFrame(data) frame frame state year pop 0 Ohio 2000 1.5 1 Ohio 2001 1.7 2 Ohio 2002 3.6 3 Nevada 2001 2.4 4 Nevada 2002 2.9 5 Nevada 2003 3.2
- 如果你指定了列的順序,
DataFrame
的列會按照指定順序排列 - 如果你傳的列不包含在字典中,將會在結果中出現預設值
DataFrame
的使用
-
可以按字典型標記或屬性那樣檢索為
Series
物件frame.year 0 2000 1 2001 2 2002 3 2001 4 2002 5 2003 Name: year, dtype: int64 frame['year'] 0 2000 1 2001 2 2002 3 2001 4 2002 5 2003 Name: year, dtype: int64
-
行也可以通過位置或特殊屬性
loc
進行選取frame2 = pd.DataFrame(data,index = ['one','two','three','four','five','six']) frame2 state year pop one Ohio 2000 1.5 two Ohio 2001 1.7 three Ohio 2002 3.6 four Nevada 2001 2.4 five Nevada 2002 2.9 six Nevada 2003 3.2 frame2.loc['one'] state Ohio year 2000 pop 1.5 Name: one, dtype: object
-
del
可以刪除列