機器學習作業-Logistic Regression（邏輯迴歸）

阿新 • • 發佈：2018-12-10

ML課堂的第二個作業，邏輯迴歸要求如下：

資料集連結如下：

邏輯迴歸的關鍵是運用了sigmod函式，sigmod函式有一個很好的性質是其導函式很好求

函式影象：

sigmod會將函式值對映到（0，1）區間內，將其輸出值看作是概率則有邏輯迴歸的二分類模型：

上式很好理解，sigmod(x)是x屬於pos類的概率則x屬於neg類的概率自然就是1-sigmod(x)，兩式子組合一下可得到下式：

上式其實就是一個概率密度函式，對θ做最大似然估計，使最大似然函式求到最大值。

用梯度下降法，梯度和更新公式如下：

題目要求用GD、SGD還有牛頓法目前實現了GD和SGD的，牛頓法會在後面更新，需要提到的是資料需要進行歸一化，不然由於計算機內浮點數精度原因sigmod函式會取到1，log(sigmod）會出log(0）錯，後面用tensorflow實現的版本用adam優化在不進行歸一化的情況下可以收斂。

首先是梯度下降的程式碼

nolinear.py裡面封裝了一下sigmod函式

import math
def sigmods(x):
    return 1/(math.exp(-x)+1)

然後是主檔案：

import nolinear as nl
import numpy as np
import matplotlib.pyplot as plt
import math

data_x = np.loadtxt("ex4Data/ex4x.dat")
data_y = np.loadtxt("ex4Data/ex4y.dat")

plt.axis([15, 65, 40, 90])
plt.xlabel("exam 1 score")
plt.ylabel("exam 2 score")
for i in range(data_y.size):
    if data_y[i] == 1:
        plt.plot(data_x[i][0], data_x[i][1], 'b+')
    else:
        plt.plot(data_x[i][0], data_x[i][1], 'bo')

mean = data_x.mean(axis=0)
variance = data_x.std(axis=0)
data_x = (data_x-mean)/variance

data_y = data_y.reshape(-1, 1)          # 拼接
temp = np.ones(data_y.size)
data_x = np.c_[data_x, temp]

learn_rate = 0.1
theda = np.zeros([3])

loss = 0
old_loss = 0

for i in range(data_y.size):
    if data_y[i] == 1:
        loss += math.log10(nl.sigmods(np.matmul(data_x[i], theda)))
    else:
        loss += math.log10(1-nl.sigmods(np.matmul(data_x[i], theda)))

while abs(loss-old_loss) > 0.001:
    temp = np.matmul(data_x, theda)
    dew = np.zeros([3])
    for i in range(data_y.size):
        dew += (data_y[i]-nl.sigmods(temp[i]))*data_x[i]
    theda = theda+learn_rate*dew
    old_loss = loss
    loss = 0
    for i in range(data_y.size):
        if data_y[i] == 1:
            loss += math.log10(nl.sigmods(np.matmul(data_x[i], theda)))
        else:
            loss += math.log10(1 - nl.sigmods(np.matmul(data_x[i], theda)))
    print(-old_loss)
plot_y = np.zeros(65-16)
plot_x = np.arange(16, 65)
for i in range(16, 65):
    plot_y[i-16] = -(theda[2]+theda[0]*((i-mean[0])/variance[0]))/theda[1]
    plot_y[i - 16] = plot_y[i-16]*variance[1]+mean[1]
plt.plot(plot_x, plot_y)
plt.show()

最後得到結果：

loss函式的值可以看到幾步就收斂了，跟同學比有點過快，現在還沒搞明白原因

接著給出SGD的程式碼，SGD每次隨機抽取兩個樣本進行梯度下降

import nolinear as nl
import numpy as np
import matplotlib.pyplot as plt
import math
import random

data_x = np.loadtxt("ex4Data/ex4x.dat")
data_y = np.loadtxt("ex4Data/ex4y.dat")

plt.axis([15, 65, 40, 90])
plt.xlabel("exam 1 score")
plt.ylabel("exam 2 score")
for i in range(data_y.size):
    if data_y[i] == 1:
        plt.plot(data_x[i][0], data_x[i][1], 'b+')
    else:
        plt.plot(data_x[i][0], data_x[i][1], 'bo')

mean = data_x.mean(axis=0)
variance = data_x.std(axis=0)
data_x = (data_x-mean)/variance

data_y = data_y.reshape(-1, 1)          # 拼接
temp = np.ones(data_y.size)
data_x = np.c_[data_x, temp]

learn_rate = 0.1
theda = np.zeros([3])

loss = 0
old_loss = 0

for i in range(data_y.size):
    if data_y[i] == 1:
        loss += math.log10(nl.sigmods(np.matmul(data_x[i], theda)))
    else:
        loss += math.log10(1-nl.sigmods(np.matmul(data_x[i], theda)))

while abs(loss-old_loss) > 0.001:
    temp = np.matmul(data_x, theda)
    dew = np.zeros([3])
    j = random.randint(0, data_y.size-1)
    dew += (data_y[j]-nl.sigmods(temp[j]))*data_x[j]
    z = random.randint(0, data_y.size - 1)
    while j == z:
        z = random.randint(0, data_y.size - 1)
    dew += (data_y[z] - nl.sigmods(temp[z])) * data_x[z]
    theda = theda+learn_rate*dew
    old_loss = loss
    loss = 0
    for i in range(data_y.size):
        if data_y[i] == 1:
            loss += math.log10(nl.sigmods(np.matmul(data_x[i], theda)))
        else:
            loss += math.log10(1 - nl.sigmods(np.matmul(data_x[i], theda)))
    print(-old_loss)
plot_y = np.zeros(65-16)
plot_x = np.arange(16, 65)
for i in range(16, 65):
    plot_y[i-16] = -(theda[2]+theda[0]*((i-mean[0])/variance[0]))/theda[1]
    plot_y[i - 16] = plot_y[i-16]*variance[1]+mean[1]
plt.plot(plot_x, plot_y)
plt.show()

每次執行sgd其結果都不一定一樣，但是loss值都是收斂於14左右，執行結果圖示：

第二次執行

loss的變化：

tensorflow實現版

import numpy as np
import tensorflow as tf
import matplotlib.pyplot as plt

data_x = np.loadtxt("ex4Data/ex4x.dat")
data_y = np.loadtxt("ex4Data/ex4y.dat")


plt.axis([15, 65, 40, 90])
plt.xlabel("exam 1 score")
plt.ylabel("exam 2 score")
for i in range(data_y.size):
    if data_y[i] == 1:
        plt.plot(data_x[i][0], data_x[i][1], 'b+')
    else:
        plt.plot(data_x[i][0], data_x[i][1], 'bo')
data_y = data_y.reshape(-1, 1)
x = tf.placeholder("float", [None, 2])
y = tf.placeholder("float", [None, 1])

w = tf.Variable(tf.zeros([2, 1]))
bias = tf.Variable(tf.zeros([1, 1]))
z = tf.matmul(x, w)+bias
xita = w
b = bias
loss = tf.reduce_sum(y*tf.log(tf.sigmoid(z))+(1-y)*tf.log(1-tf.sigmoid(z)))
tf.summary.scalar("loss_function", -loss)

train_opt = tf.train.AdamOptimizer(0.1).minimize(-loss)

merge = tf.summary.merge_all()

init = tf.global_variables_initializer()
summary_writer = tf.summary.FileWriter("log", tf.get_default_graph())

sess = tf.Session()
sess.run(init)

for i in range(1000):
    train, loss_value, w_value, b_value, summary = sess.run([train_opt, loss, xita, b, merge], feed_dict={x: data_x, y: data_y})
    summary_writer.add_summary(summary, i)
    print(loss_value)
w_value = np.array(w_value)
w_value = w_value.reshape(-1)
b_value = np.array(b_value)
plot_y = np.zeros(65 - 16)
plot_x = np.arange(16, 65)
for j in range(16, 65):
    plot_y[j - 16] = -(b_value[0] + w_value[0] * j) / w_value[1]
plt.plot(plot_x, plot_y)
plt.show()


summary_writer.close()

結果圖：

牛頓法將在後面更新……

機器學習作業-Logistic Regression（邏輯迴歸）

ML課堂的第二個作業，邏輯迴歸要求如下：資料集連結如下：邏輯迴歸的關鍵是運用了sigmod函式，sigmod函式有一個很好的性質是其導函式很好求函式影象： sigmod會將函式值對映到（0，1）區間內，將其輸出值看作是概率則有邏輯迴歸的二分類模型

【原創】Logistic regression （邏輯迴歸）概述

Logistic regression （邏輯迴歸）是當前業界比較常用的機器學習方法，用於估計某種事物的可能性。比如某使用者購買某商品的可能性，某病人患有某種疾病的可能性，以及某廣告被使用者點選的可能性等。（注意這裡是：“可能性”，而非數學上的“概率”，logis

Logistic Regression（邏輯迴歸）

介紹邏輯迴歸雖然稱為迴歸，但它卻是一個分類演算法，一個用來解決二分類問題的演算法，它通過將線性迴歸預測出的值對映到 {0,1} 上來實現分類的（0叫做負類，1叫做正類）。這是一個很簡單的二分類演算法，它的思想也很容易理解。邏輯迴歸與線性迴歸的流程很相似：

[機器學習入門] 李巨集毅機器學習筆記-6 （Classification: Logistic Regression；邏輯迴歸）

[機器學習] 李巨集毅機器學習筆記-6 （Classification: Logistic Regression；Logistic迴歸） PDF VIDEO Three steps Step 1: Function Set

機器學習&深度學習實踐（python版）系列----Linear Regression（線性迴歸）

今天和一位師兄決定複習一下Andrew Ng的機器學習和深度學習教程理論知識，用Python實現教程中的練習。教程分為：我們決定從機器學習開始，逐漸實現。寫這個系列主要

機器學習實戰【4】（邏輯迴歸）

本部落格記錄《機器學習實戰》（MachineLearningInAction）的學習過程，包括演算法介紹和python實現。邏輯迴歸對於一個數據集中的樣本，將其每個特徵乘上一個對應的係數，然後輸入sigmoid函式中把結果對映到0-1區間內，

【原】Andrew Ng斯坦福機器學習 Coursera—Programming Exercise 3 邏輯迴歸多分類和神經網路

作業說明 Exercise 3，Week 4，使用Octave實現手寫數字0-9的識別，採用兩種方式（1）邏輯迴歸多分類（2）三層神經網路多分類。對比結果。每張圖片20px * 20px，也就是一共400個特徵（因為Octave裡從1開始。所以將0對映為10）（1）邏輯迴歸多分類：實現 lrCost

李巨集毅機器學習P11 Logistic Regression 筆記

我們要找的是一個概率。 f即x屬於C1的機率。上面的過程就是logistic regression。下面將logistic regression與linear regression作比較。接下來訓練模型，看看模型的好壞。假設有N組trainin

機器學習之用Python進行邏輯迴歸分析

前言迴歸和分類方法是機器學習中經常用到的方法，本文首先介紹這兩種方法的區別和聯絡，然後對分類方法中的邏輯迴歸進行較詳細的說明（包括其基本原理及評估指標），最後結合案例介紹如何利用Python進行邏輯迴歸分析。一、分類與迴歸 1.1什麼是分類和迴歸區分迴歸問題

機器學習 scikit-learn2 模型實踐 - 邏輯迴歸

邏輯迴歸 - 目錄 1 簡介 1.1 程式碼下載 1.2 程式碼使用方法 3 核心程式碼說明 3.1 模型配置 3.2 模型訓練 3.3 輸出結果 1 簡介 1.1 程式

Bobo老師機器學習筆記第五課-邏輯迴歸理論

1、什麼是邏輯迴歸？（Logistic Regresssion）邏輯迴歸（Logistic Regression）是一種用於解決二分類（0 or 1）問題的機器學習方法，用於估計某種事物的可能性。邏輯迴歸既可以看做是一個迴歸演算法，也可以看作是一個分類問題，通常是用過分類，並且是二分類。分類

小白的機器學習筆記系列之四-邏輯迴歸

一個概率問題前面我們講了線性分類和線性迴歸，這裡讓我們來思考另外一類問題——求概率問題。比如說，我們根據一個人的既往病歷，生活習慣，年齡等來判斷一個人是否會得心肌梗塞。我們想要的答案不僅僅是一個簡單的是或否，實際上我們希望知道的是得心肌梗塞的風險有多大。醫生

Bobo老師機器學習筆記第九課-邏輯迴歸新增多項式

在上面部落格中我們主要使用邏輯迴歸進行線性資料的分類，那麼邏輯如何處理非線性資料分類呢？比如下面的資料： 1、利用邏輯迴歸如何處理非線性資料迴歸？針對上面的資料，我們首先嚐試迴歸一下，看看獲取的結果是： 0.605，這個評分不是很高，讓後我們繪製一下決策邊界：

Bobo老師機器學習筆記第九課-邏輯迴歸程式碼展示

在上一篇部落格中我們學習了邏輯迴歸（LogisticRegression）的理論。那麼在這篇部落格中，我們用程式碼展示一下，如何用梯度下降法獲取邏輯迴歸的引數步驟1：我們載入sklearn中的鳶尾花資料進行測試，由於為了資料視覺化，我們選擇2種類型的鳶尾花，並且只選擇2個特徵。

機器學習之 Logistic 回歸(邏輯回歸)

準備 eight 後者 sel sigmoid sts 公式兩種回歸算法目錄 Logistic回歸博客園地址：https://www.cnblogs.com/chenyoude/ git 地址：https://github.com/nickcyd/machine_

機器學習中Logistic Regression的個人理解

這段時間一直在看Andrew Ng的機器學習的公開課，感覺真的是很棒，極力推薦大家去看，這是對應的網易公開課的連結：在看Logistic Regression的過程中，Ng首先介紹了伯努利分佈｛0，1｝，而後引入sigmoid函式，之後就說我們假設(Le

【機器學習演算法-python實現】邏輯迴歸的實現(LogicalRegression)

1.背景知識在剛剛結束的天貓大資料s1比賽中，邏輯迴歸是大家都普遍使用且效果不錯的一種演算法。（1）迴歸先來說說什麼是迴歸，比如說我們有兩類資料，各有50十個點組成，當我門把這些點畫出

機器學習爬大樹之（GBDT原理）--迴歸篇

整合學習（ensemble learning）想必應該是最為火爆的機器學習演算法了，它通過構建並結合多個學習器來完成學習任務；類似於我們長說的“採百家之長”，目前的整合學習方法

機器學習--吳恩達（線性迴歸，梯度下降，正規方程法）

本節課是對監督學習的講解，ng以自動駕駛為例，告訴我們汽車對方向的預測是連續值，故而是迴歸問題。什麼是迴歸問題？（regression）確定兩種或兩種以上變數相互依賴的定量關係的一種統計分析方法迴歸與分類問題的不同迴歸與分類都屬於預測問題，而回歸預測的結果是連續的值

機器學習案例——梯度下降與邏輯迴歸簡單例項

梯度下降例項下圖是f(x) = x2+3x+4 的函式影象，這是初中的一元二次函式，它的導數為g(x) = f’(x) = 2x+3。我們很明確的知道，當x = -1.5時，函式取得最小值。下面就通過梯度下降法來計算函式取最小值時x的

機器學習作業-Logistic Regression（邏輯迴歸）

相關推薦