1. 程式人生 > >Udacity課程脈絡-統計學基礎(四)-F分佈

Udacity課程脈絡-統計學基礎(四)-F分佈

前言

優達學城從這期開始,忽然沒有中文字幕了。。只好自己儘量翻譯了。
目錄如下:

  • 提出背景
  • Between-Group and Within-Group Variability
  • F分佈
  • F分佈示例
  • ANOVA假設條件
  • Tukey’s HSD
  • η2\eta^2
  • ANOVA with different sample sizes
  • ANOVA 總結

提出背景

之前學習的t分佈都是基於兩個樣本進行顯著性檢驗。如果我們有很多樣本呢,想要知道它們之間是否存在顯著性差異。但是我們不可能兩兩的去對比,這時就需要新的統計方法: One Way ANOVA.

many

基本思路如下:

當我們比較兩個樣本是否有顯著性差異時,t統計量的計算方式是這樣的:
提示:這裡的H0: x1拔-x2拔 = 0

即假設兩者不存在顯著性差異
t-value

進一步發散一下,面臨多個樣本時,我們可以有如下思路:
many-samples

grand-mean

Between-Group Variability and Within-Group Variability

between-group

ANOVA

anova

F分佈

F分佈

SS: sum of squares 平方和
df: degree of freedom 自由度
MS: mean square 均方
SSbetween : sum of squares for between group
SSwithin : sum of squares for within group.

F分佈示例

比較三個品牌的衣服價格是否有顯著差異

衣服price

SSbetween:
SSbetween

SSwithin:
SSwithin

ANOVA假設條件 (assumptions)

  1. Normality: 樣本所在的總體應服從正態分佈
  2. homogeneity of variance(方差齊性或齊同): all groups have the same or similar variance (方差).
  3. Independence of observations: 樣本相互獨立

Tukey’s HSD

對於不同種類的食物,奶牛是否表現出偏好性(將奶牛分為三組,橫軸為奶牛的名字,縱軸為奶牛吃掉的食物數量)

cow

運用之前學過的方法,我們可以得出一個結論:奶牛對不同種類的食物表現出了偏好(存在顯著性差異)

Turkey's HSD
但是,到目前為止我們並不知道具體哪兩組樣本之間存在顯著性差異。因此,我們需要另外的統計方法,這也正是Tukey’s HSD的用武之地。
HSD

HSD-value

η2\eta^2

eta

ANOVA with different sample sizes

different sample sizes

ANOVA Summary

Summary