統計學中的頻率學派與貝葉斯學派
對於技術應用人員來說,我們更看重方法的應用,但有時候對知識的背景做一些了解,我覺得還是挺有必要的,能幫助我們理解一些東西。這篇博文裏,不會呈現任何計算公式,只是討論一下貝葉斯學派與頻率學派之間的問題。
貝葉斯學派與頻率學派是當今數理統計學的兩大學派,基於各自的理論,在諸多領域中都起到了重要作用。自20世紀初數理統計學大發展開始,一直到20世紀中葉,頻率學派一直占據主導地位,當時諸多大咖如Fisher、K.Pearson等都屬於頻率學派,而從20世紀中葉以後,貝葉斯學派迅速發展壯大起來,可與頻率學派分庭抗禮(我想這也是社會發展的需求,一些問題用原來的方法解決不了,需要一種的新的思維出現來解決問題),由於其發展較新,因此人們也將頻率學派稱為古典學派。
頻率學派與貝葉斯學派的估計思想
對於樣本分布,此時我們要對其中的未知進行估計,讓我們來看看頻率學派與貝葉斯學派分別是如何做的。
頻率學派:
頻率學派認為,對於一批樣本,其分布是確定的,也即是是確定的,只不過未知。為什麽會有這樣的想法?這就要從頻率學派的基本宗旨來看了,頻率學派認為概率即是頻率,某次得到的樣本X只是無數次可能的試驗結果的一個具體實現,樣本中未出現的結果不是不可能出現,只是這次抽樣沒有出現而已,因此綜合考慮已抽取到的樣本X以及未被抽取、實現的結果,可以認為總體分布是確定的,不過未知,而樣本來自於總體,故其樣本分布也同樣的特點。 基於此,就可以使用估計方法去推斷
貝葉斯學派:
貝葉斯學派否定了概率及頻率的觀點,並且反對把樣本X放到“無限多可能值之一”背景下去考慮,既然只得到了樣本X,那麽就只能依靠它去做推斷,而不能考慮那些有可能出現而未出現的結果。與此同時,貝葉斯學派引入了主觀概率的概念,認為一個事件在發生之前,人們應該對它是有所認知的,即中的不是固定的,而是一個隨機變量,並且服從分布,該分布稱為“先驗分布”(指抽樣之前得到的分布),當得到樣本X後,我們對的分布則有了新的認識,此時有了更新,這樣就得到了“後驗分布”(指抽樣之後得到的分布),此時可以再對做點估計、區間估計,此時的估計不再依賴樣本,完全只依賴的後驗分布了。
頻率學派對貝葉斯學派的批評
頻率學派對貝葉斯學派的批評主要集中在主觀概率及與之相關的先驗分布的確定問題上。按頻率學派的觀點,一個事件的概率可以用大量重復試驗之下事件出現的頻率來解釋,這種解釋不取決於主體的認識。頻率學派認為主觀概率不僅難以捉摸,而且與認識主體有關,沒有客觀性,因而也就沒有科學性,這是不可接受的。
針對頻率學派的批評,貝葉斯學派做出了以下回應:
1.主觀概率事實上是人們常用的概念。例如人們常說:”這個事兒十有八九能成”,這就是人們的一個主觀概率,能做出這樣的推測人們肯定是考慮了一些因素的(比如考慮了做事兒的人,做事的方法等),這是有一定道理的。
2.在涉及采取行動並承擔後果的問題上,每個人了解的情況不同,對問題所具有的只是也不同,他們采取的最佳行動方案也會不同,在這種情況下,不同的人有不同的先驗分布是很正常的,要求所謂的“客觀性”反倒沒有意義了。
頻率學派對貝葉斯學派還有一個批評,樣本分布一般都是在頻率的意義上來解釋的,他們認為,既然貝葉斯學派否定頻率觀點,為何也會用到樣本分布?對於這個批評,貝葉斯學派確實是難以做出讓人信服的回答,如果做一個徹底的主觀概率論者,就必須把樣本分布看成刻畫樣本取各種值在主觀上的信服程度,由於樣本是已知的,而貝葉斯學派反對把樣本放到無窮多可能樣本的背景下去考慮這種做法,故而將主觀概率的思想推到極端,貝葉斯學派甚至不能去談論什麽樣本分布問題。
貝葉斯學派對頻率學派的批評
1.關於概率的頻率解釋觀點。許多問題是沒法做重復性試驗、是一次性的,嚴格相同甚至大致相同的條件下的重復事實上是不可能的,比如地震觀測,因此在這種條件下統計概念和方法的頻率解釋完全沒有現實意義。
2.頻率學派基於概率的頻率解釋,其所導出的方法(點估計、區間估計、假設檢驗等)的精度和可靠度也只是大量重復下的平均值,這是在抽樣之前就已經確定的(也就是前文所說的是確定的),這種不顧實際的樣本值而在事前就規定的精度和可靠度是不合理的,而且往往是實際情況大相庭徑。直觀上人們更傾向於接受的是:統計推斷的精度和可靠性如何,與試驗結果(樣本)有關。
小結
盡管貝葉斯學派和頻率學派的部分觀點受到質疑,但是兩大學派如今仍然發揮著比較重要的作用,對實際應用中的一些問題,兩種學派的方法都能給出比較準確的解決方案,因此對於我們應用者來說,針對不同的應用場景,使用的合適的方法才是主要的。
統計學中的頻率學派與貝葉斯學派