1. 程式人生 > >淺談正則化

淺談正則化

一、機器學習正則化

     無論是機器學習還是深度學習,正則化都是一項關鍵的技術。其實現階段,我們的模型都可以在訓練集上去的比較好的效果,但我們的模型在測試集上的效果才是我們所關心的。因此正則化就顯得尤為重要,正則化可以防止模型過擬合,增加魯棒性。

     總的來說,監督學習的核心原理就是如下公式 :

                                            

fig

    該公式分為兩部分,前一項是經驗最小化,後一項為正則項。經驗最小化是為了極大程度的擬合訓練資料,正則項則是為了防止過分擬合訓練資料。機器學習中的正則項有L1正則和L2正則.

     在聊這兩個正則前,我們先說說L0正則。L0正則也就是矩陣中所有非0元素的個數,對於L0正則的理解就是希望引數矩陣W的大多數元素都為0,這樣正則項就會很小。此時,可能會有人會說L1正則不就是在幹這個事嗎?這裡面的原理,扯就一大堆,簡答說:在機器學習中,L0和L1正則都可以實現矩陣的稀疏性,但在實踐中,L1的泛化求解特徵更好一些,所以人們大多使用L1正則而不是用L0正則。對於L1正則而言,L1正規化就是矩陣中各個元素絕對值之和。至於為啥稀疏,稀疏的作用,主要是為了特徵的選擇和易於解釋模型.

                   v2-3b7ae6b5e2644a88b561dca8d265e2e0_b