從概率的角度看logistic regression
阿新 • • 發佈:2018-11-27
logistic regression假設樣本
為正的概率是:
我們在看這個公式的時候,可以理解成
- 是一個事件,一共有1,2,…,N個事件
- 是類別,有0和1,這兩種類別
那麼 我理解就是一個後驗概率,後驗概率的意思是
後驗概率:事情已經發生,要求這件事情發生的原因是由某個因素引起的可能性的大小
所以 就是事件 已經發生了, 屬於這個 這個類別的概率是多少。
現在就假設 ,同理 也可以是這麼理解。
OK,我們假設是這個概率,那麼假設中的引數 怎麼求呢?答案是:
極大似然函式估計法
為什麼用這個方法求 ?因為
極大似然函式估計法就是用來求模型已知,引數未知的情況下,通過若干次試驗,觀察其結果,利用試驗結果得到某個引數值能夠使樣本出現的概率為最大。
在logistic regression裡,模型已知了啊,是 ,和 ,引數 未知,用試驗結果,就是訓練資料 , 去估計引數啊。
所以用極大化似然函式的方法,可以列出似然函式
這裡解釋一下這個似然函式 ,意思是事件 已經發生了, 的值等於某個值時使得事件 發生的可能性等於多少。那麼 的意思是,在給定w的值等於多少,事件 發生的概率是想到的。所以就可以列出上面的似然函式。
我們要求 發生的可能性最大啊,那麼就是極大化似然函式,求出來的 就是我們想要的引數了。由於該極大似然函式無法直接求解,我們一般通過對該函式進行梯度下降來不斷逼急最優解。