1. 程式人生 > 實用技巧 >Pandas之DataFrame的使用

Pandas之DataFrame的使用

(二)熟悉pandas的兩個工具資料結構:SeriesDataFrame

DataFrame

DateFrame表示的是矩陣的資料表,它包含已排序的列集合,每一列可以是不同的值型別(數值,字串,布林值等)。它既有行索引也有列索引。

建立一個DateFrame物件

data = {'state':['Ohio','Ohio','Ohio','Nevada','Nevada','Nevada'],
       'year': [2000,2001,2002,2001,2002,2003],
       'pop': [1.5,1.7,3.6,2.4,2.9,3.2]}
frame = pd.DataFrame(data)
frame
frame
state	year	pop
0	Ohio	2000	1.5
1	Ohio	2001	1.7
2	Ohio	2002	3.6
3	Nevada	2001	2.4
4	Nevada	2002	2.9
5	Nevada	2003	3.2
  • 如果你指定了列的順序,DataFrame的列會按照指定順序排列
  • 如果你傳的列不包含在字典中,將會在結果中出現預設值

DataFrame的使用

  1. 可以按字典型標記或屬性那樣檢索為Series物件

    frame.year
    0    2000
    1    2001
    2    2002
    3    2001
    4    2002
    5    2003
    Name: year, dtype: int64
            
    frame['year']
    0    2000
    1    2001
    2    2002
    3    2001
    4    2002
    5    2003
    Name: year, dtype: int64
    
  2. 行也可以通過位置或特殊屬性loc進行選取

    frame2 = pd.DataFrame(data,index = ['one','two','three','four','five','six'])
    frame2
    state	year	pop
    one	Ohio	2000	1.5
    two	Ohio	2001	1.7
    three	Ohio	2002	3.6
    four	Nevada	2001	2.4
    five	Nevada	2002	2.9
    six	Nevada	2003	3.2
    frame2.loc['one']
    state    Ohio
    year     2000
    pop       1.5
    Name: one, dtype: object
    
  3. del可以刪除列