pandas dataframe 資料框 基本概念
阿新 • • 發佈:2019-01-07
資料框是一個二維資料結構,類似於SQL中的表格。藉助字典,陣列,列表和序列等可以構造資料框;
1.字典建立資料框,則列的名稱為key的名稱;
import pandas as pd
d = {'one':pd.Series([1,2,3],index= ['a','b','c']),
'two':pd.Series([1,2,3,4],index=['a','b','c','d'])
}
print(pd.DataFrame(d))
one two a 1.0 1 b 2.0 2 c 3.0 3 d NaN 42.列表建立資料框:
import pandas as pd print(pd.DataFrame([[1,2,3,4],[5,6,7,8],[10,20,30,40],[50,60,70,80]],columns=['V1','V2','V3','V4']))
V1 V2 V3 V4 0 1 2 3 4 1 5 6 7 8 2 10 20 30 40 3 50 60 70 80
3.列的選取,刪除和增加:
import pandas as pd df = pd.DataFrame([[1,2,3,4],[5,6,7,8],[10,20,30,40],[50,60,70,80]],columns=['V1','V2','V3','V4']) print(df,'\n') df['V5'] = df['V1']*df['V2'] #第一列與第二列相乘; print(df['V5'],'\n') df['Flag'] = df['V2'] > 20 #增加一列; print(df,'\n') del df['Flag'] #刪除列 V5 = df.pop('V5') #刪除列 print(df,'\n',V5,'\n') df.insert(2,'V6',df['V1']) # 2為插入的位置,V6為列的名稱,df['V1']為插入的數值 print(df,'\n')
V1 V2 V3 V4 0 1 2 3 4 1 5 6 7 8 2 10 20 30 40 3 50 60 70 80 0 2 1 30 2 200 3 3000 Name: V5, dtype: int64 V1 V2 V3 V4 V5 Flag 0 1 2 3 4 2 False 1 5 6 7 8 30 False 2 10 20 30 40 200 False 3 50 60 70 80 3000 True V1 V2 V3 V4 0 1 2 3 4 1 5 6 7 8 2 10 20 30 40 3 50 60 70 80 0 2 1 30 2 200 3 3000 Name: V5, dtype: int64 V1 V2 V6 V3 V4 0 1 2 1 3 4 1 5 6 5 7 8 2 10 20 10 30 40 3 50 60 50 70 80
4.一般的選取方式:
操作方式 | 方法 | 結果 |
選擇某一列 | def[col] | 序列 |
通過列標籤選擇某一行 | df.loc[col] | 序列 |
通過具體的位置選擇某一行 | df.icol[2] | 序列 |
切行 | df[5:10] | 資料框 |