1. 程式人生 > >各種風險及其最小化的解釋

各種風險及其最小化的解釋

最小化 ali 訓練 效果 emp logs 度量 ica end

各種風險及其最小化的解釋

對於給定的輸入 \(X\) ,由 \(f(X)\) 給出輸出 \(Y\) ,這個輸出的預測值 \(f(X)\) 與真實值 \(Y\) 可能一致也可能不一致,用一個損失函數 (loss function) 來度量預測錯誤的程度,記作 \(L(Y,f(X))\)

常用的損失函數比如 0-1 損失函數:
\[ L(Y,f(X)) =\left\{ \begin{aligned} 1, & & Y \neq f(X) \0, & &Y = f(X) \end{aligned} \right. \]

期望風險(expected loss)

\(R_{exp} = E_p[L(Y,f(X))]\)

學習的目的就是選擇期望風險最小的模型。

經驗風險(empirical risk)

模型 \(f(X)\) 關於訓練集的平均損失稱為經驗風險,記作:
\[ R_{emp} = \frac{1}{N}\sum_{i=1}^{N}L(y_i, f(x_i)) \]
當樣本容量很小時,經驗風險最小化的學習效果未必好,會產生過擬合現象。

結構風險(Structural Risk Minimization)

結構風險最小化是為了防止過擬合而提出的策略。結構風險最小化在經驗風險上加入了表示模型復雜度的正則化項。定義是:
\[ R_{srm}(f) = \frac{1}{N}\sum_{i=1}^{N}L(y_i, f(x_i)) + \lambda J(f) \]

各種風險及其最小化的解釋