數據科學:待學習的內容
阿新 • • 發佈:2018-08-25
www. 查看 frame val ats tar 新的 圖形 plot
- plt.subplots():將 plt.figure 創建的畫板,分割成多個子圖(clos——列、rows——行);
- plt.figure(figsize=(15,5)):創建一個圖形實例,俗稱話本,在這個畫板上繪制幾行幾列的圖;figsize 表示圖形的(寬,高);
- figure、subplot 的使用,參考:https://blog.csdn.net/claroja/article/details/70841382
- pd.concat(df1, df2):連接兩個DataFrame 數據集;
- df1.loc[[0, 2, 3], :]:刪除數據 df1的第0、2、3 行;
- df1.loc[:, [0, 2, 3]]:刪除數據 df1的第0、2、3 列;
- df2 = df1.reset_index():將 df1 的每行的引索(Id)保留,以列名做為新的 index,生成新的數據 df2;(一般默認以行做引索)
- df3 = df1.reset_index(drop=True):drp = True,刪除 df1 的行引索,一列名作為新的 index,生成新的數據 df3;
- df1.dtypes(include=None, exclude=None):按類型查看數據 df1 中的其它數據;
- df1.dtypes[df1.dtypes == ‘object‘]:查看 df1 數據中,類型為 ‘object‘ 類型的數據;
- df1.index:返回數據 df1 的引索對象;
- df1.index.values:以 array 的形式返回 df1 的引索的值;(多用於獲取所有的特征,也就是 df1 的所有列名)
- stats.probplot():
- DataFrame 中 sort_values():
- Seaborn 中的箱型圖:
- 方差齊次驗證:如何理解線性回歸中的方差齊性;
- 方差分析:統計學知識;參考百科自學
- scipy.stats 模塊:
- f, p = scipy.stats.f_oneway(sample1, sample2, ...):單向方差分析,入參是分好組的多個 array;
- 單向方差分析:計算各組數據間的差異性,統計學知識,參考百科;
- df1.isnull():判斷 df1 的數據是否為 np.NaN 類型;返回 bool 類型,是則為 True,不是返回 False;
數據科學:待學習的內容