數學基礎-概率論03(統計推斷)
目錄:
統計推斷是通過樣本推斷總體的分佈或者分佈的數字特徵。
1.引數假設檢驗:引數估計
已知一個總體的分佈型別,但是對分佈裡面的引數不清楚,如泊松分佈P(),正態分佈的N(),這時候需要對這些未知引數進行估計。
1.1 點估計
點估計:以某個適當的統計量的估測值作為未知引數的估計值
1.1.1 矩估計
矩估計法是用樣本n階矩去估計總體n階矩,n的大小由未知引數決定,在估計的過程中,解得未知引數。
例子:
1.泊松分佈矩估計:已知總體X~P()[泊松分佈],現有樣本,求的矩估計量。
首先只有一個未知引數,一階矩(期望)可以解決,泊松分佈的一階矩為:
其次樣本的一階矩是
令總體的一階矩等於樣本的一階矩,即,解得估計量(記為)為:
2.正態分佈矩估計:已知總體X~N()[正態分佈],現有樣本,求和的矩估計量。
兩個未知引數,用一階原點矩和二階原點矩解決。並使總體的相應矩等於樣本矩,建立其方程組後,解出兩個引數。
解得:和
特點:
1.矩估計的方法依賴於抽取的樣本,不同的樣本對應不同的引數估計值,所以具有一定隨意性
2.使用矩估計要求總體存在原點矩,有些隨機變數(如柯西分佈)的原點矩不存在,因此無法使用矩估計
1.1.2 極大似然估計
極大似然估計始於高斯誤差理論,直觀的想法是目前為止所觀測到的事件是最有可能出現的事件。比如你和職業車手比賽,有一人贏了,我們總是傾向於是職業車手贏得比賽。
設總體含有待估計引數,他可以取很多值,在這很多值值中取出 使得樣本出現 的概率最大的那些值,稱這些值為的極大似然估計。
例子:
1.泊松分佈極大似然估計:已知總體X~P()[泊松分佈],現有樣本,求的極大似然估計值。
已知泊松分佈的分佈律為:
首先得到似然方程,該批次觀測值出現的概率為所以事件的概率乘積,即
取對數得:
由於L和lnL在同一個有極值,因此為了求L的極值,可以對lnL使用極限的思想進行分析。
解得的極大是然估計值(記為):
特點:
1.不要求總體原點矩存在
2.需要求解似然方程
1.1.3 估計量的評選標準
1.無偏性
假設每次抽樣,對引數均有一個估計值,記為,若取所有估計值的期望是對引數的正確無偏估計,即,則為的無偏估計量。
2.有效性
多次抽樣,使用不同的方法計算得到多組的估計量,這兩組中較穩定的(即方差小)較其他組更為有效的估計。方差反映估計值在真實值附近更為“集中”。
3.一致性(相合性)
毫無疑問,抽取樣本的容量越大,對未知引數的估計越接近真實值,估計量的這種性質稱為一致性(相合性)
相合估計量:
設為未知引數的估計量,若依概率收斂於,則對任意,有
此時,稱為(弱)相合估計量。
注:
1.一般而言,三個估計量評選標準只要滿足前面兩個標準就不錯了,因為使用一致性要求樣本容量足夠大
以下很快補上...........
1.2 區間估計
區間估計:用兩個統計量的觀測值鎖確定的區間來估計未知引數的大致範圍