1. 程式人生 > >12.10學習筆記(gg機器學習)

12.10學習筆記(gg機器學習)

標籤:我們要預測的真實事物:y。基本線性迴歸中的y變數。
特徵:用於描述資料的輸入變數:Xi。基本線性迴歸中的{x1、x2、…xn}變數
樣本:資料的特定例項x0
有標籤樣本:同時包含特徵和標籤,我們使用有標籤樣本來訓練模型。
無標籤樣本:包含特徵但不包含標籤,用於對新資料作出預測。
模型:定義了特徵與標籤之間的關係,可將樣本對映到預測標籤:y’。由模型的內部引數定義,這些內部引數值是通過學習得到的
訓練:建立或學習模型
推斷:將訓練後的模型應用於無標籤樣本
迴歸:迴歸模型可預測連續值
分類:分類模型可預測離散值
L2損失=平方誤差=(觀測值-預測值)^2
=(y-y‘)^2
線性關係
y’=b+w1x1
y’指的是預測標籤(理想輸出值)。
b指的是偏差(y 軸截距)。而在一些機器學習文件中,它稱為 w0。
w1 指的是特徵 1 的權重。權重與上文中用 m 表示的“斜率”的概念相同。
x1 指的是特徵(已知輸入項)。
訓練模型表示通過有標籤樣本來學習(確定)所有權重和偏差的理想值。在監督式學習中,機器學習演算法通過以下方式構建模型:檢查多個樣本並嘗試找出可最大限度地減少損失的模型;這一過程稱為經驗風險最小化

.
MSE均方誤差