1. 程式人生 > >數據科學:待學習的內容

數據科學:待學習的內容

www. 查看 frame val ats tar 新的 圖形 plot

  1. plt.subplots():將 plt.figure 創建的畫板,分割成多個子圖(clos——列、rows——行);
  2. plt.figure(figsize=(15,5)):創建一個圖形實例,俗稱話本,在這個畫板上繪制幾行幾列的圖;figsize 表示圖形的(寬,高);
  3. figure、subplot 的使用,參考:https://blog.csdn.net/claroja/article/details/70841382
  4. pd.concat(df1, df2):連接兩個DataFrame 數據集;
  5. df1.loc[[0, 2, 3], :]:刪除數據 df1的第0、2、3 行;
  6. df1.loc[:, [0, 2, 3]]:刪除數據 df1的第0、2、3 列;
  7. df2 = df1.reset_index():將 df1 的每行的引索(Id)保留,以列名做為新的 index,生成新的數據 df2;(一般默認以行做引索)
  8. df3 = df1.reset_index(drop=True):drp = True,刪除 df1 的行引索,一列名作為新的 index,生成新的數據 df3;
  9. df1.dtypes(include=None, exclude=None):按類型查看數據 df1 中的其它數據;
  10. df1.dtypes[df1.dtypes == ‘object‘]:查看 df1 數據中,類型為 ‘object‘ 類型的數據;
  11. df1.index:返回數據 df1 的引索對象;
  12. df1.index.values:以 array 的形式返回 df1 的引索的值;(多用於獲取所有的特征,也就是 df1 的所有列名)
  13. stats.probplot():
  14. DataFrame 中 sort_values():
  15. Seaborn 中的箱型圖:
  16. 方差齊次驗證:如何理解線性回歸中的方差齊性
  17. 方差分析:統計學知識;參考百科自學
  18. scipy.stats 模塊:
  19. f, p = scipy.stats.f_oneway(sample1, sample2, ...):單向方差分析,入參是分好組的多個 array;
  20. 單向方差分析:計算各組數據間的差異性,統計學知識,參考百科;
  21. df1.isnull():判斷 df1 的數據是否為 np.NaN 類型;返回 bool 類型,是則為 True,不是返回 False;

數據科學:待學習的內容