1. 程式人生 > >檢驗樣本是否服從正態分佈,處理偏態分佈

檢驗樣本是否服從正態分佈,處理偏態分佈

在資料分析中如果某個資料服從正態分佈的話,我們可以利用正態分佈的性質做出很多有意義的分析,例如t-檢驗。。

如何檢驗樣本是否服從正態分佈?
可以使用Q-Q圖來進行檢驗,Q-Q圖是一個散點圖,點(x, y)表示資料x的某個分位數,y表示和x的分位數相同的分位數(即FX(x)=FY(y)),如果說兩個分佈的QQ圖在一條直線上,則說明每個[xi,xi+1][yi,yi+1]區間所包含的資料在整個資料集中的比例相同,也就是說明如果對x或y進行放縮的話可以讓它們。

所以,如果把未知資料和標準正態分佈做Q-Q圖的話,如果所有點在一條直線上則說明未知資料的分佈服從正態分佈。

如果不是正態分佈怎麼辦?


資料右偏的話可以對所有資料取對數、取平方根等,它的原理是因為這樣的變換的導數是逐漸減小的,也就是說它的增速逐漸減緩,所以就可以把大的資料向左移,使資料接近正態分佈。
如果左偏的話可以取相反數轉化為右偏的情況。