Udacity課程脈絡-統計學基礎(四)-F分佈
阿新 • • 發佈:2018-12-10
前言
優達學城從這期開始,忽然沒有中文字幕了。。只好自己儘量翻譯了。
目錄如下:
- 提出背景
- Between-Group and Within-Group Variability
- F分佈
- F分佈示例
- ANOVA假設條件
- Tukey’s HSD
- ANOVA with different sample sizes
- ANOVA 總結
提出背景
之前學習的t分佈都是基於兩個樣本進行顯著性檢驗。如果我們有很多樣本呢,想要知道它們之間是否存在顯著性差異。但是我們不可能兩兩的去對比,這時就需要新的統計方法: One Way ANOVA.
基本思路如下:
當我們比較兩個樣本是否有顯著性差異時,t統計量的計算方式是這樣的:
提示:這裡的H0: x1拔-x2拔 = 0
進一步發散一下,面臨多個樣本時,我們可以有如下思路:
Between-Group Variability and Within-Group Variability
ANOVA
F分佈
SS: sum of squares 平方和
df: degree of freedom 自由度
MS: mean square 均方
SSbetween : sum of squares for between group
SSwithin : sum of squares for within group.
F分佈示例
比較三個品牌的衣服價格是否有顯著差異
SSbetween:
SSwithin:
ANOVA假設條件 (assumptions)
- Normality: 樣本所在的總體應服從正態分佈
- homogeneity of variance(方差齊性或齊同): all groups have the same or similar variance (方差).
- Independence of observations: 樣本相互獨立
Tukey’s HSD
對於不同種類的食物,奶牛是否表現出偏好性(將奶牛分為三組,橫軸為奶牛的名字,縱軸為奶牛吃掉的食物數量)
運用之前學過的方法,我們可以得出一個結論:奶牛對不同種類的食物表現出了偏好(存在顯著性差異)
但是,到目前為止我們並不知道具體哪兩組樣本之間存在顯著性差異。因此,我們需要另外的統計方法,這也正是Tukey’s HSD的用武之地。
ANOVA with different sample sizes
ANOVA Summary