1. 程式人生 > >machine learning 機器學習入門(三)

machine learning 機器學習入門(三)

分類和邏輯迴歸

在之前說過了線性迴歸的一些問題,線性迴歸常常用在一些預測值為連續的情況下,但生活中有的結果是以離散的形態分佈的,比如下雨還是不下雨,瀏覽到新聞會點選還是不會點選,看到商品買還是不買,這些都是有特定的結果類別的,我們稱這一類問題為分類問題

對於二元分類的問題,從線性的角度來看,最終的預測值依然是連續的,但我們可以對於預測的值設定一個閾值,當預測值超過這個值則另結果為1,否則為0,因為y ∈ {0, 1},所以我們的模型函式h_{\theta}(x)最終的值也在0和1之間,我們用sigmoid(logistic) function來表示這個函式

其中

函式影象如下

z\rightarrow -\inftyg(z)\rightarrow 0

z\rightarrow \inftyg(z)\rightarrow 1

對分類模型做一些統計學假設

更簡潔的可以寫為:

可以分別代入0和1驗證上面的式子,上面這個式子其實是一個指數族的分佈的形式,在後面的內容會進行講解

假設m個訓練樣本都是獨立的,所以可以按照下面的形式寫引數的似然函式

和之前的似然函式處理方式一樣,這裡也取對數方便計算

未完待續...