Khan公開課 - 統計學學習筆記 (二)總本 樣本 集中趨勢 離中趨勢
分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow
也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!
三、統計學 & 集中趨勢
統計學statistics是對資料的descriptive,而不是將所有資料呈現,根據統計,可以進行inferential(推理),對未來的判斷。
集中趨勢Central Tendency,求中間值就是average,通常指的是mean(算術平均),但是廣義上也包括median、和mode。計算的方式不同,不能說哪種方法好,看具體情況,哪種更能反應。一般會用mean,但有些情況,例如房子均價,如果有一個很高的偏離值,可以是一個錯誤值,是用median更合乎人們感受。
四、總本和樣本
總本population,樣本sample。選取樣本應該是隨機的。
總本均值,即population mean公式如下。N表示總量的數目。
樣本均值,即sample mean公式如下。有時求總體均值是不可能的,例如某個國家男子的升高,很難在同一時間內測量,有些人來到這世上,有些人離去,因此採用樣本方式。n表示樣本的數目。
五、離中趨勢:總本方差、無偏樣本方差、標準差
離散:dispersion,方差:variance,用於測量資料的離中趨勢。
對於總本方差,公式為:
同樣我們照著畫瓢可以給出樣本方差的公式,但由於取樣樣本很難100%地均勻分佈,樣本中值不一定和總體均值一致,而樣本均值由樣本計算出來,故根據類似的公式得到的採用樣本通常比總本方差要小,因此進行修正,採用unbiased sample variance,即無偏樣本方差,公式如下:
注意,沒有除以樣本的總數n,而是n-1,可能是基於經驗值。
標準差(standard deviation),上面是使用平方的方式表示,在單位上不一樣,標準差則是方差的開根。
我們對總本方差的公式作一些有趣的運算
在後面兩個紅框中,更為適合計算,不過現在都是電腦,就無所謂了。
相關連結:我的四方書庫