1. 程式人生 > >?易混淆的統計概念

?易混淆的統計概念

phi call 分析 方程 true edm 檢驗 plot als

技術分享圖片

做回歸之我的一般操作step:

scatterplot()或者直接plot()觀測數據,選擇合適的回歸模型

檢驗異常點

檢驗高杠桿點

檢驗方差齊性

檢驗多重共線性(尋找共線性強的解釋變量組合)

逐步回歸(向前,向後,雙向)

全子集回歸

假設檢驗之後得出最優回歸方程。再用方程做預測以及數據分類,降維聚類等等操作。對方程以及數據加以更進一步的解釋

#####################

一些檢驗的基本指標參數:

F1-score 就是一個綜合考慮precision和recall的metric=2*precision*recall / (precision + recall)

準確率accuracy

查準率precision

查全率recall(recall = sensitivity = true positive rate)

特異性specificity = 1- false positive rate

技術分享圖片技術分享圖片

技術分享圖片

技術分享圖片

:unpaired data compared with wilcoxon test which is paired data,與參數分析中的合並 t 檢驗相對應,只不過後者是從相同方差的正態分布總體中抽樣,即方差齊性整體數據正態性分布。

技術分享圖片

:它與配對樣本t檢驗相對應。計算配對樣本之間的差值,然後對差值執行單樣本 Wilcoxon 檢驗

技術分享圖片

:類似於方差分析,用於檢驗各個樣本(N大於3)的總體是否相同,當normality假設和方差齊性不能滿足時(nonparameters test),可用該檢驗。Kruskal-Wallis方法類似於方差分析中多重比較的S-N-K法,將樣本分為幾個子集,同一子集內的樣本無統計學差異,不同子集內的樣本有統計學差異。

多個配對樣本的非參數檢驗(friedman test)
:秩方法實現了對多個總體分布是否存在顯著差異的非參數檢驗方法。也是方差之間的差異大小。

技術分享圖片

隨機區組對應參數檢驗中的配對數據,wilcoxontest

而完全隨機設計就是參數檢驗中的兩獨立樣本的Mann Whitney U test

T test 是對兩個樣本均值的差異是否可以推導出兩個樣本整體的均值差異。

而做T testpremises就是其是否有方差齊性,用F testjudge。簡單來說就是實用T檢驗是有條件的,其中之一就是要符合方差齊次性,這點需要F檢驗來驗證。

技術分享圖片

調包俠:

library(lme4)

library(nlme)

library(glmer)

都是針對多元多項式混合回歸模型開發出來的包

技術分享圖片

?易混淆的統計概念