R-正太分佈，檢驗

阿新 • • 發佈：2022-05-04

什麼是正太分佈檢驗？判斷一樣本所代表的背景總體與理論正態分佈是否沒有顯著差異的檢驗。方法一概率密度曲線比較法看樣本與正太分佈概率密度曲線的擬合程度，R程式碼如下：

#畫樣本概率密度圖 s <- rnorm(100) #產生樣本 d <- density(s) plot(d, col="green", ylim=c(0, 0.5)) #新增正太分佈概率密度圖 s2 <- seq(from=-4, to=4, length.out=100) lines(s2, norm_expression(s2), col="red")

畫圖結果如下：

方法二正太Q-Q圖法

使用Q-Q圖來判斷資料是否服從正太分佈，R程式碼如下：

s <- rnorm(100) #產生樣本
qqnorm(s)
qqline(s)

畫圖結果如下，可見資料分佈集中在對角線上，可以認為總體服從正太分佈：

方法三經驗法則

約68.3%數值分佈在距離平均值有1個標準差之內的範圍，約95.4%數值分佈在距離平均值有2個標準差之內的範圍，以及約99.7%數值分佈在距離平均值有3個標準差之內的範圍。稱為“68-95-99.7法則”或“經驗法則”。

使用R的驗證程式碼如下：

s <- rnorm(10000) #產生樣本
sum(abs(s - mean(s)) < sd(s)) / length(s)
sum(abs(s - mean(s)) < 2*sd(s)) / length(s)

程式結果：

> s <- rnorm(10000) #產生樣本 > sum(abs(s - mean(s)) < sd(s)) / length(s) [1] 0.6871 > sum(abs(s - mean(s)) < 2*sd(s)) / length(s) [1] 0.9538

方法四統計檢驗方法

使用樣本偏度和樣本峰度來估計總體偏度和峰度，在正太分佈的假定下，樣本偏度和峰度均服從均值為零、方差分別為6/T和24/T的正太分佈，可以分別檢驗偏度和峰度，也可以將兩個統計量結合起來生成一個服從自由度為2的卡方分佈的統計量，再進行檢驗【參見《金融時間序列分析》第三版P8~P9】。理論方面的東西略...

可以使用夏皮羅-威爾克（Shapiro-Wilk）檢驗，程式碼如下：

s <- rnorm(1000) #產生樣本
shapiro.test(s)

檢驗結果:

> shapiro.test(s) Shapiro-Wilk normality test data: s W = 0.9987, p-value = 0.6716

shapiro.test函式輸出一個p值，照慣例，p<0.05說明總體不太可能是正太分佈，否則不能提供這麼個證據，也就是說這個檢驗比較保守，傾向於錯誤的過分證明正態性。

R的nortest包能提供其他正太檢驗方法【參見《R語言經典例項》P221】。

R-正太分佈，檢驗

R-正太分佈，檢驗

Python實現非正太分佈的異常值檢測方式

丟擲這8個問題，檢驗一下你到底會不會ThreadLocal，來摸個底~

一個R包(IntAssoPlot)，LocusZoom圖、連鎖不平衡圖和基因結構圖一步到位

JS生成正太分佈資訊以及正太分佈圖

全球首款 5G 智慧電動汽車上汽 MARVEL R 今日上市，揮手就能開天窗

文字個數不一平均分佈，使標籤文字上下對齊

學習極差、移動極差、方差、標準差、正太分佈

SpringBoot 對接美團閃購，檢驗簽名，獲取推送訂單引數，text轉json

R資料分析，codewar的年終總結，和一週年總結，寒假快樂呀

關於elementui 切換中英文的時候，檢驗不實時更新的問題解決

R-正態性檢驗例項

元分析中的漏斗圖，出版偏誤的檢驗，資料框的行列數（R）

林窗間隙頻率分佈(Gap Size Frequency Distribution， GSFD) 計算: R language

python 實現檢驗33品種資料是否是正態分佈

R語言通過伽瑪與對數正態分佈假設下的廣義線性模型對大額索賠進行評估預測

R語言基本繪圖-plot引數：標題，座標軸和顏色

設圓半徑r=1.5,圓柱高h=3,求圓周長、圓面積、圓球表面積、圓球體積、圓柱體積。用scanf輸人資料，輸出計算結果，輸出時要求有文字說明,取小數點後2位數字。請程式設計序

R語言使用蒙特卡洛模擬進行正態性檢驗及視覺化

R 快取畫圖程式碼，之後再總結

R-正太分佈，檢驗

相關推薦