pandas常用操作
阿新 • • 發佈:2018-11-10
Series:
一維資料結構,,類似字典或者numpy中元素帶標籤的陣列。其中每一個元素都有一個標籤(可以為數字或字串),具有索引,具有鍵值對對應關係,能夠排序,切片等操作。
s=pd.Series([0,1,2,3,4,np.NAN,'a']) #也可以直接傳入一個數組
DataFrame:
dates = pd.date_range('20130101',periods=6) df = pd.DataFrame(np.random.randn(6,4),index=dates,columns=['A','B','C','D']) In [76]:df Out[76]: A B C D 2013-01-01 -2.359309 -0.065001 1.099911 -0.886392 2013-01-02 0.318336 0.715261 0.060752 1.326758 2013-01-03 0.515914 1.482326 -0.973154 1.766126 2013-01-04 1.875221 -0.316619 -0.543997 0.864037 2013-01-05 -0.697887 0.065137 -0.899040 0.826392 2013-01-06 -0.205943 -1.532289 1.849114 1.267895
df2 = pd.DataFrame({'A':1, 'B':pd.Timestamp('20130102'), 'C':pd.Series(1,index=range(4)), 'D':np.array([3]*4,dtype='int'), 'E':'foo'}) In [78]:df2 Out[78]: A B C D E 0 1 2013-01-02 1 3 foo 1 1 2013-01-02 1 3 foo2 1 2013-01-02 1 3 foo 3 1 2013-01-02 1 3 foo
dataframe常用操作:
檢視前N行 檢視後M行 |
df.head(n) df.tail(m) |
檢視索引 | df.index |
檢視值 | df.values |
檢視列名 | df.columns |
檢視資料有多少行 | len(df) |
檢視資料資訊 均值,方差,最小,最大 |
df.describe() |
複製一個完全一樣的物件 | df2=df.copy() |
對資料進行行列轉置 | df.T |
- 方法一、df['A'] - 方法二、df.A - 方法三、df.loc[:,['A']] In [20]:df['A'] Out[20]: 2013-01-01 0.134964 2013-01-02 1.490029 2013-01-03 0.329824 2013-01-04 0.135711 2013-01-05 0.104873 2013-01-06 -0.218562 Freq: D, Name: A, dtype: float64 #選擇一列 - 方法一、df[['A','B']] - 方法二、df.loc[:,['A','B']] - 方法三、df.ix[:,['A','B']] #選擇兩列 In [30]:df[(df.A>0) & (df.B<0)] Out[30]: A B C D 2013-01-01 0.134964 -1.454443 -0.310064 1.195568 2013-01-02 1.490029 -0.561749 0.524751 0.522473 2013-01-04 0.135711 -0.148830 -0.380225 -0.753513 #根據某一列或者幾列進行條件篩選