關於邏輯迴歸向量化的一點總結

阿新 • • 發佈：2019-02-03

照斯坦福的機器學習課程用Octave敲了一下邏輯迴歸的演算法然後搬到python上各種出問題...感覺自己對向量化還是理解不夠徹底又重新推導了一遍

用的資料集是課程的作業 training data包含100條資料兩個特徵（兩門課程的分數）一個類別（能否入學）

#載入資料集
data = np.loadtxt(path, dtype = float, encoding = 'utf-8', delimiter = ',')
X = data[:, 0:2]#二維陣列 100x2
y = data[:, 2]#一維陣列 1x100

需要把y轉換為100x1的列向量方法有很多

#y = np.c_[data[:, 2]]#100x1
y = data[:, 2].reshape(-1, 1)#100x1

邏輯迴歸假設函式：

#S形函式(h(x;theta))
def sigmoid(z):
	return 1 / (1 + np.exp(-z))
#100x1

X = [ ]100x3(新增x0 ==1), theta = [ ]1x3, X * theta'= [ ]100x1

代價函式：

向量化：

#代價函式
def costFunction(theta, X, y):
	m = y.size#100
	h = sigmoid(X.dot(theta.reshape(-1, 1)))#100x1

	J = -1 * (1 / m) * (np.log(h).T.dot(y) + np.log(1 - h).T.dot(1 - y))#1x1

	if np.isnan(J[0]):
		return(np.inf)
	return J[0]

相當於兩矩陣對應行點乘之後求和

梯度也就是代價函式對theta(j)的偏導:

向量化：

#計算梯度
def compute_grad(theta, X, y):
	m = y.size
	h = sigmoid(X.dot(theta.reshape(-1, 1)))#100x1

	grad = (1 / m) * ((h - y).T.dot(X))#應該是1x3的行向量 有三個theta值
	#但是打印出的結果為100x3的矩陣
	#===因為剛開始定義的y 是1x100的行向量
	return grad#1x3

梯度演算法目的是求costFunction的最小值和最小值點的theta

用scipy.optimize中的minimize函式

from scipy.optimize import minimize#無約束最小化損失函式
res = minimize(costFunction, initial_theta, args = (X, y),
	jac = compute_grad, options = {'maxiter': 400})

#test1LogisticRegression.py:43: RuntimeWarning: 
#divide by zero encountered in log
#  J = -1 * (1 / m) * (np.log(h).T.dot(y) + np.log(1 - h).T.dot(1 - y))#1x1
#test1LogisticRegression.py:43: RuntimeWarning: divide by zero encountered in log
#  J = -1 * (1 / m) * (np.log(h).T.dot(y) + np.log(1 - h).T.dot(1 - y))#1x1
#      fun: 0.20349770158950983
# hess_inv: array([[ 2.85339493e+03, -2.32908823e+01, -2.27416470e+01],
#       [-2.32908823e+01,  2.04489131e-01,  1.72969525e-01],
#       [-2.27416470e+01,  1.72969525e-01,  1.96170322e-01]])
#      jac: array([-2.68557634e-09,  4.36433479e-07, -1.39671758e-06])
#  message: 'Optimization terminated successfully.'
#     nfev: 34
#      nit: 25
#     njev: 30
#   status: 0
#  success: True
#        x: array([-25.16131634,   0.2062316 ,   0.20147143])

最後得到的theta為

[-25.16131634,   0.2062316 ,   0.20147143]

預測函式

def predict(theta, X, threshold = 0.5):
	p = sigmoid(X.dot(theta.T)) >= threshold
	return(p.astype('int'))

對分數為[30, 43]的同學進行預測

pre = sigmoid(np.array([1, 30, 43]).dot(res.x.T))

3.326083521580104e-05
#近似於零

參考：

關於邏輯迴歸向量化的一點總結

照斯坦福的機器學習課程用Octave敲了一下邏輯迴歸的演算法然後搬到python上各種出問題...感覺自己對向量化還是理解不夠徹底又重新推導了一遍用的資料集是課程的作業 training data包含100條資料兩個特徵（兩門課程的分數）一個類別（能否入學）#載

機器學習中向量化程式設計總結記錄

向量化程式設計總結記錄很多時候，我們在實現演算法的時候，總會碰到累和的虛擬碼：比如下面這個：為了簡單我這裡只重複5次，但是原理是一樣的。很顯然我們要得到這個結果，非常簡單，比如下面的這段python程式碼：那麼我們有沒有更好的辦法呢？有的，看到

邏輯迴歸問題總結

來源：http://www.cnblogs.com/ModifyRong/p/7739955.html https://www.cnblogs.com/zhizhan/p/5038747.html 1.簡介邏輯迴

邏輯迴歸模型總結-機器學習

邏輯迴歸被廣泛的用來解決分類問題。由於分類是非線性問題，所以建模的主要難點是如何把非線性問題轉換為線性問題。在模型評估層面，討論了兩類相互有關聯的評估指標。對於分類問題的預測結果，可以定義為相應的查準查全率。對於基於概率的分類模型，還可以繪製它的ROC曲線，以及計算曲線線面的面積AUC。

吳恩達深度學習deeplearning.ai-Week2課後作業-Logistic迴歸與梯度下降向量化

一、deeplearning-assignment 這篇文章會幫助構建一個用來識別貓的邏輯迴歸分類器。通過這個作業能夠知道如何進行神經網路學習方面的工作,指導你如何用神經網路的思維方式做到這些，同樣也會加深你對深度學習的認識。儘量不要在程式碼中出現for迴圈，可以用nu

機器學習總結之----2.邏輯迴歸

我也只是在學習的過程中，相當於自己理解推導一遍做個筆記，參考了別人很多東西，文末有相關連結。什麼是邏輯迴歸邏輯迴歸也叫做對數機率迴歸，但它卻用來做二分類。線性迴歸產生的預測值為 z=θTxz = \theta^{T}xz=θTx，線性迴歸通常用來做迴歸。

線性迴歸,邏輯迴歸,神經網路,SVM的總結

目錄線性迴歸,邏輯迴歸,神經網路,SVM的總結線性迴歸,邏輯迴歸,神經網路,SVM的總結詳細的學習筆記. markdown的公式編輯手冊. 迴歸的含義: 迴歸就是指根據之前的資料預測一個準確的輸出值. 分類的含義: 分類就是預測離散的輸出值, 比如男生為1, 女生為0(

邏輯迴歸的常見面試點總結

1.簡介邏輯迴歸是面試當中非常喜歡問到的一個機器學習演算法，因為表面上看邏輯迴歸形式上很簡單，很好掌握，但是一問起來就容易懵逼。所以在面試的時候給大家的第一個建議不要說自己精通邏輯迴歸，非常容易被問倒，從而減分。下面總結了一些平常我在作為面試官面試別人和被別人面試的時候，經常遇到的一些問題。 2

NG機器學習總結-（四）邏輯迴歸以及python實現

在第一篇部落格NG機器學習總結一中，我們提到了監督學習通常一般可以分為兩類：迴歸和分類。線性迴歸屬於迴歸問題，例如房價的預測問題。而判斷一封郵件是否是垃圾郵件、腫瘤的判斷（良性還是惡性）、線上交易是否欺詐都是分類問題，當然這些都是二分類的問題。 Email：Spam /

機器學習演算法總結--線性迴歸和邏輯迴歸

1. 線性迴歸簡述在統計學中，線性迴歸（Linear Regression）是利用稱為線性迴歸方程的最小平方函式對一個或多個自變數和因變數之間關係進行建模的一種迴歸分析。這種函式是一個或多個稱為迴歸係數的模型引數的線性組合（自變數都是一次方）。只有一

線性迴歸、嶺迴歸、Lasso迴歸、邏輯迴歸的總結

對於所有的模型和演算法，都有一個目標方程，比較理想的目標方程應該有兩部分構成：損失函式和正則項，一個用來衡量模型的擬合效果，一個用來儘可能保證模型的簡單和穩定： Obj(Θ)=L(Θ)+Ω(Θ)(2)(2)Obj(Θ)=L(Θ)+Ω(Θ) 損失函式：平方

雙層神經網路與邏輯迴歸正反向傳播數學公式簡要推導

邏輯迴歸正向傳播和反向傳播推導: z=wTx+b(1) a=σ(z)=11+e−z(2) L(a,y)=−(ylog(a)+(1−y)log(1−a))(3) da=∂L(a,y)

迴歸問題總結（梯度下降、線性迴歸、邏輯迴歸、原始碼、正則化）

原文地址：http://blog.csdn.net/gumpeng/article/details/51191376 最近，應妹子要求，對迴歸問題進行了總結。網上相關資料很多，主要是針對Andrew Ng的線上課程寫的筆記，但大部分都講得不清晰。這篇部落格不能

機器學習邏輯迴歸模型總結——從原理到sklearn實踐

0x00 基本原理邏輯迴歸演算法，從名字上看似乎是個迴歸問題，但實際上邏輯迴歸是個典型的分類演算法。對於分類問題，一般都是一些離散變數，且y的取值如下： y∈{0,1,2,3,...,n}，顯然不能使用線性迴歸擬合。以二元分類問題開始討論，y的取值

Python 入門、量化策略、量化知識總結貼

量化交易移動平均出了編程入門股票知識經濟學 python 入門原因 Ricequant 量化社區的初衷讓各位愛好量化的人士可以碰撞思維，在分享和爭辯中學習到有用且實戰的量化知識。有賴於各位在社區中貢獻滿滿的幹貨以及有質量的討論，從編程入門教學到技術指標再到多因

關於局部指針的一點總結

地址 ng- -a 全局 ack 一點詳細所在 trac 常常碰到的問題，碰到函數局部變量指針的時候會出錯。那麽C++中函數局部變量指針是怎樣釋放的呢？在函數內定義的變量所占的內存會在函數返回時被清空，因此

吳恩達-深度學習-課程筆記-3: Python和向量化( Week 2 )

有時指數檢查都是效果很快 -1 tro str 1 向量化( Vectorization ) 在邏輯回歸中，以計算z為例，z = w的轉置和x進行內積運算再加上b，你可以用for循環來實現。但是在python中z可以調用numpy的方法，直接一句z = np.d

HttpSession的一點總結（持續更新）

ida https 服務器一點生命周期 max false ssi ive 1.HttpSessio的生命周期 1）.什麽時候創建HttpSession對象 JSP：若當前的JSP是客戶端訪問的WEB應用的第一個資源，且JSP的page指定的session屬性為fal

對Java原子類AtomicInteger實現原理的一點總結

sync add cef 比較 and offset active 基本即時編譯 java原子類不多，包路徑位於：java.util.concurrent.atomic，大致有如下的類： java.util.concurrent.atomic.AtomicBoolean

Numpy常用概念-對象的副本和視圖、向量化、廣播機制

一維數組運算 shape nbsp 兼容性需要 for numpy 方式一、引言在我們操作數組的時候，返回的是新數組還是原數組的鏈接，我們就需要了解對象副本和視圖的區別。向量化和廣播是numpy內部實現的基礎。二、對象副本和視圖我們應該註意到，在操作數組的時候

關於邏輯迴歸向量化的一點總結

相關推薦