Pandas DataFrame常用操作
阿新 • • 發佈:2019-02-15
- DataFrame.median() 取中位數
- DataFrame.loc[行標籤,列標籤] 選取資料,第一個值為行標籤,第二值為列標籤
- DataFrame.iloc[行位置,列位置]
- pandas.read_csv()
- DataFrame.to_csv()
- DataFrame.head()
- DataFrame.tail()
- DataFrame.info()
- DataFrame.describe() 對各列的進行描述,如總數,平均值,標準差,最大最小值等。
- pandas.cut()
- pandas.qcut() 基於分位數的離散化函式。基於秩或基於樣本分位數將變數離散化為等大小桶。
- pandas.Index.delete() 返回一個新的,刪除掉指定位置的index
- DataFrame.groupby()
- mean()
- sort_values() 排序操作
- drop()
- DataFrame.mode() 眾數,返回頻數最高的那(幾)個
- DataFrame.dropna() 丟棄nan相應的行(看引數)
- DataFrame.fillna() 用指定值填充nan值
- DataFrame.std() 返回樣本的標準差
- pandas.isnull() 檢測缺失值
- DataFrame.isnull() 返回同樣長度的object,值為boolean,類似還有notnull()
- DataFrame.sum() 返回所請求axis對應值的總和
- pandas.date_range() 返回一個時間索引
- DataFrame.apply() 沿相應軸應用函式
- Series.value_counts() 返回不同資料的計數值
- DataFrame.aggregate()
- DataFrame.max() 返回最大值
-
DataFrame.reset_index() 重新設定index,引數drop = True時會丟棄原來的索引,設定新的從0開始的索引。常與groupby()一起用
-
numpy.zeros()
- numpy.unique() 返回數組裡唯一的值組成的陣列
seaborn
- color_palette() 建立調色盤
axis
使用0值表示沿著每一列或行標籤\索引值向下執行方法
使用1值表示沿著每一行或者列標籤模向執行對應的方法
Python round() 函式 返回浮點數x的四捨五入值
round( x [, n] )
x – 浮點數。
n – 精確度。
type();
confidence score