1. 程式人生 > >有監督學習、無監督學習、引數估計、非引數估計

有監督學習、無監督學習、引數估計、非引數估計

有監督學習和無監督學習

         兩者應用在模式識別的領域,目的是對給定的樣本進行劃分。

        有監督學習將樣本分為訓練集和測試集,訓練集中的資料帶有標籤,標誌著這些樣本來自哪些類別,訓練集中的資料沒有標籤。有監督學習的目的就是學習訓練集中不同類別資料的特徵,得到一個能把不同類別資料劃分開來的模式,然後在測試集中應用這個模式來預測未知類別的樣本。

        無監督學習中,樣本都沒有類別標籤。它的劃分方式是根據樣本與樣本之間的相似度來決定的。

        二者的區別:有監督學習的目的是為了識別樣本,他的衡量標準是給待識別樣本賦予的標籤的準確與否;而無監督學習的目的只是為了發現數據集的某種聚集規律。

引數估計和非引數估計

引數估計是假設某個研究的問題服從某個分佈,這個分佈中有一些確定的引數,然後用樣本的統計量來估計總體的引數。

而非引數估計是知道一個問題是有引數的,但是引數可能是無限個,只能得到密度可能連續、期望值存在之類的一般性假設。

那麼,兩種學習方式的演算法和引數估計、非引數估計的連續是什麼呢?