1. 程式人生 > >李宏毅-分類

李宏毅-分類

img 數值 分享圖片 函數 增加 中心 神奇 alt .com

  1. 為什麽不能用回歸代替分類?

    答:因為回歸與分類對模型評估的好壞定義不一樣。當訓練集出現異常點時,回歸會盡量去擬合這些異常點,增加模型魯棒性。但是在分類中,異常點的出現會使得分割界偏離最優位置,原本可能並不是這個類別的異常點當成該類別進行模型訓練,導致模型不準確。

   2. 分類問題,預測隨機抓一個神奇寶貝屬於某一類別的概率(樸素貝葉斯公式):

    技術分享圖片

    p(c1)表示一群神奇寶貝中,類別1的寶貝概率(占比)。p(x|c1)表示,在類別1中抓一只神奇寶貝是x的概率,這個沒有直接告訴。視頻中,老師以水系寶貝為例,以防禦力和特殊防禦力為兩個坐標軸,將水系寶貝在這個坐標軸中是按照高斯分布進行分布的。從手中已有的神奇寶貝資料(什麽東西<400),可以擬合出一個高斯分布函數,即求得高斯分布的方差和平均值,然後放入新的神奇寶貝,得到一個新的高斯函數值,這個函數值與從該類別中獲取該寶貝的概率成正比,因此看成p(x|c1)。

    上面提到的用一個高斯分布函數代替概率值,其實相當於該種類寶貝的分布概率是一個高斯分布。因為高斯分布有一個中心點,當寶貝分布位置越靠近這個點,它就越可能屬於這個類別,而越靠近這個中心點的高斯函數值越大,也就表示高斯函數值越大屬於該類別的概率就越大。

    怎樣得到一個最好的高斯分布函數來擬合訓練集?

      技術分享圖片

李宏毅-分類