1. 程式人生 > >pandas dataframe 資料框 基本概念

pandas dataframe 資料框 基本概念

資料框是一個二維資料結構,類似於SQL中的表格。藉助字典,陣列,列表和序列等可以構造資料框;

1.字典建立資料框,則列的名稱為key的名稱;

import pandas as pd

d = {'one':pd.Series([1,2,3],index= ['a','b','c']),
     'two':pd.Series([1,2,3,4],index=['a','b','c','d'])
}
print(pd.DataFrame(d))
   one  two
a  1.0    1
b  2.0    2
c  3.0    3
d  NaN    4
2.列表建立資料框:

import pandas as pd
print(pd.DataFrame([[1,2,3,4],[5,6,7,8],[10,20,30,40],[50,60,70,80]],columns=['V1','V2','V3','V4']))
    V1   V2   V3   V4
0   1   2   3   4
1   5   6   7   8
2   10   20   30   40
3   50   60   70   80

3.列的選取,刪除和增加:

import pandas as pd
df = pd.DataFrame([[1,2,3,4],[5,6,7,8],[10,20,30,40],[50,60,70,80]],columns=['V1','V2','V3','V4'])
print(df,'\n')
df['V5'] = df['V1']*df['V2'] #第一列與第二列相乘;
print(df['V5'],'\n')
df['Flag'] = df['V2'] > 20 #增加一列;
print(df,'\n')
del df['Flag'] #刪除列
V5 = df.pop('V5'
) #刪除列 print(df,'\n',V5,'\n') df.insert(2,'V6',df['V1']) # 2為插入的位置,V6為列的名稱,df['V1']為插入的數值 print(df,'\n')
   V1  V2  V3  V4
0   1   2   3   4
1   5   6   7   8
2  10  20  30  40
3  50  60  70  80 


0       2
1      30
2     200
3    3000
Name: V5, dtype: int64 


   V1  V2  V3  V4    V5   Flag
0   1   2   3   4     2  False
1   5   6   7   8    30  False
2  10  20  30  40   200  False
3  50  60  70  80  3000   True 


   V1  V2  V3  V4
0   1   2   3   4
1   5   6   7   8
2  10  20  30  40
3  50  60  70  80 
 0       2
1      30
2     200
3    3000
Name: V5, dtype: int64 


   V1  V2  V6  V3  V4
0   1   2   1   3   4
1   5   6   5   7   8
2  10  20  10  30  40
3  50  60  50  70  80 

4.一般的選取方式:

操作方式 方法 結果
選擇某一列 def[col] 序列
通過列標籤選擇某一行 df.loc[col] 序列
通過具體的位置選擇某一行 df.icol[2] 序列
切行 df[5:10] 資料框