GBDT中損失函式的負梯度用來擬合的一些理解

阿新 • • 發佈：2022-05-23

將\(L(y_i,f(x_i))\)在\(f(x_i)=f_{m-1}(x_i)\)處泰勒展開到一階（捨去餘項，故為近似）

\[L(y_i,f(x_i))\approx L(y_i,f_{m-1}(x_i))+\left. \frac{\partial L(y_i,f(x_i))}{\partial f(x_i)} \right|_{f(x_i)=f_{m-1}(x_i)}\cdot (f(x_i)-f_{m-1}(x_i)) \]

令\(f(x_i) = f_{m-1}(x_i)\)且\(f_m(x_i) = f_{m-1}(x_i)+T_m(x_i;\theta _m)\)帶入上式並移項

\[L(y_i,f_m(x_i))-L(y_i,f_{m-1}(x_i))\approx \left. \frac{\partial L(y_i,f(x_i))}{\partial f(x_i)} \right|_{f(x_i)=f_{m-1}(x_i)}\cdot T_m(x_i;\theta _m) \]

左式需小於0（每輪得到的強學習器需要比上一輪強學習器在損失函式更小，不然優化無意義），故令\(T_m(x_i;\theta _m)\)去擬合\(-\left. \frac{\partial L(y_i,f(x_i))}{\partial f(x_i)} \right|_{f(x_i)=f_{m-1}(x_i)}\)

使得右式小於0。
混淆點：\(f(x_i)\)是一個變數，代表最終求得的強學習器在第\(i\)個樣本\(x_i\)上的預測，\(f_{m-1}(x_i)\)和\(f_m(x_i)\)是常量，即\((m-1)\)輪和\(m\)輪得到的強學習器在樣本\(x_i\)上的預測

GBDT中損失函式的負梯度用來擬合的一些理解

GBDT中損失函式的負梯度用來擬合的一些理解

為什麼深度學習中用到損失函式和梯度

聊聊PHP中require_once()函式為什麼不好用

《戰地2042》中的維修工具可以用來維修企鵝

在第9章例9.9和例9.10的基礎上,寫一個函式del,用來刪除動態連結串列中指定的節點

功能：請編寫一個函式 void fun(int s, int n, int k)，用來求出陣列s中的最大元素在陣列中的下標, 用k帶回。其中n為主函式陣列中的資料個數。

TensorFlow自定義損失函式來預測商品銷售量

Keras中的多分類損失函式用法categorical_crossentropy

torch 中的損失函式

盤點深度學習中常見的損失函式

tensorflow中階API (啟用函式，損失函式，評估指標，優化器，回撥函式)

寫一個函式insert,用來向一個動態連結串列插入結點

django中如果不是第一次遷移的時候就配置AUTH_USER_MODEL(用來告知django認證系統識別我們自定義的模型類)，那麼該如何解決才能讓django的認證系統識別且不會報未知錯誤？

用 PHP 自帶函式 fputcsv 和 fgetcsv 來匯出和匯入csv

傻子都能看懂的——梯度下降與損失函式

python用socket中的TCP\IP協議來傳輸檔案

解決：Java Web中getParameter函式返回值為null (千萬不要用 Eclipse 的 RENAME！！！！！）

fit函式 model_Tensorflow2.0中複雜損失函式實現

函式實驗：編寫5個函式分別用來求兩個整數的加、減、乘、除及取餘數。製作一個選單，列出這5種運算，以便讓使用者能夠用輸入運算子的方法選擇進行的運算。

sklearn中train_test_split函式中的random_state有什麼用？

GBDT中損失函式的負梯度用來擬合的一些理解

相關推薦