1. 程式人生 > >引數估計與非引數估計

引數估計與非引數估計

背景知識:概率密度,直觀的理解就是在某一個區間內,事件發生的次數的多少的問題,比如N(0,1)高斯分佈,就是取值在0的很小的區間的概率很高,至少比其他等寬的小區間要高。

引數估計要求明確引數服從什麼分佈,明確模型的具體形式,然後給出引數的估計值。根據從總體中抽取的樣本估計總體分佈中包含的未知引數。

非引數估計對解釋變數的分佈狀況與模型的具體形式不做具體規定 ,運用核密度函式與窗寬去逐步逼近,找出相應的模型。統計學中常見的一些典型分佈形式不總是能夠擬合實際中的分佈。此外,在許多實際問題中經常遇到多峰分佈的情況,這就迫使必須用樣本來推斷總體分佈,常見的總體類條件概率密度估計方法有Parzen窗法和Kn近鄰法兩種。
非引數估計也有人將其稱之為無參密度估計,它是一種對先驗知識要求最少,完全依靠訓練資料進行估計,而且可以用於任意形狀密度估計的方法。

最簡單的直方圖估計,把所有可能取值的範圍分成間隔相等的區間,然後看每個區間內有多少個數據?這樣就定義出了直方圖,因此直方圖就是概率密度估計的最原始的模型。
直方圖用的是矩形來表示縱軸,當樣本在某個小區間被觀測到,縱軸就加上一個小矩形。

非引數估計更適合對原函式關係進行模擬,但不能預測;而引數估計則可以預測。