機器學習之 Logistic 迴歸(邏輯迴歸)

阿新 • • 發佈：2018-12-31

Logistic迴歸

Logistic迴歸

部落格園地址：https://www.cnblogs.com/chenyoude/

git 地址：https://github.com/nickcyd/machine_learning

微信：a1171958281

程式碼中涉及的數學公式可以自己下載 Typora 這款軟體後，把內容複製到.md檔案內通過 Typora 開啟

Logistic 迴歸

本章內容

Sigmoid 函式和 Logistic 迴歸分類器
最優化理論初步
梯度下降最優化演算法
資料中的缺失項處理

迴歸演算法
迴歸演算法：假設現在有一些資料點，我們用一條直線對這些點進行擬合（該線稱為最佳擬合直線），這個擬合過程就稱作迴歸。與分類演算法一樣同屬於監督學習。

Logistic 迴歸的一般過程

收集資料：採用任意方法收集資料。
準備資料：由於需要進行距離計算，因此要求資料型別為數值型。
分析資料：採用任意方法對資料進行分析。
訓練演算法：大部分時間講用於訓練，訓練的目的是為了找到最佳的分類迴歸係數。
測試演算法：一旦訓練步驟完成，分類將會很快。
使用演算法：基於訓練好的迴歸係數對這些數值進行簡單的迴歸計算，判定他們屬於哪個類別，在此基礎上做一些其他分析工作。

Logistic的優缺點

優點：計算代價不高，易於理解和實現。
缺點：容易欠擬合，分類精度可能不高。
適用資料型別：數值型和標稱型。

基於 Logistic 迴歸和 Sigmoid 函式的分類

Sigmoid 函式
海維賽德階躍函式(單位階躍函式)：輸出只有0或1的函式，並且0到1的過程屬於跳躍過程，即非0即1。
Sigmoid 函式：x=0時，sigmoid 值為0.5；隨著 x 的增大，對應值將逼近1；隨著 x 的減小，對應值將逼近0。
Sigmoid 函式公式：$\sigma(z)={\frac{1}{1+e^{-z}}}$。

Logistic 迴歸分類器
Logistic 迴歸分類器：我們在每個特徵上都乘以一個迴歸係數 之後詳細介紹，然後把所有的結果值相加，將這個總和代入 sigmoid 函式，進而得到一個範圍在0~1之間的數值。大於0.5的資料被分入1類，小於0.5即被歸入0類。

圖5-1 兩種座標尺度下的 Sigmoid 函式圖
通過圖5-1 下面一張圖可以看出，如果橫座標的尺度足夠大，在 x=0出 sigmoid 函式看起來很像階躍函式。

基於最優化方法的最佳迴歸係數確定
Sigmoid函式的輸入記為 z，可由該公式得出：$z=w_0x_0+w_1x_1+w_2x_2+\cdots+w_nx_n$。
上述公式向量寫法：$z=w^Tx$ 向量 x 是分類器的輸入資料，向量 w 是我們需要找的最佳引數（係數）。

梯度上升法
梯度上升法：沿著函式的梯度方向探尋某函式的最大值。即求函式的最大值。
如果梯度記為\nebla，則函式$f(x,y)$的梯度公式：$\nabla f(x,y)=\begin{pmatrix} {\frac{\part f(x,y)}{\part x}} \ {\frac{\part f(x,y)}{\part y}} \ \end{pmatrix}$。
${\frac{\part f(x,y)}{\part x}}$：沿 x 的方向移動${\frac{\part f(x,y)}{\part x}}$，函式$f(x,y)$必須要在待計算的點上有定義並且可微。
${\frac{\part f(x,y)}{\part y}}$：沿 x 的方向移動${\frac{\part f(x,y)}{\part y}}$，函式$f(x,y)$必須要在待計算的點上有定義並且可微。

圖5-2 梯度上升圖
通過圖5-2 可以看出梯度上升演算法到達每個點後都會重新估計移動的方向。
梯度上升演算法的迭代公式：$w:=w+\alpha \nabla_wf(w)$，該公式將一直被迭代執行，直至達到某個停止條件為止。
$\alpha$：移動量的大小，稱為步長。

梯度下降演算法
梯度下降演算法：沿著函式的梯度方向探尋某函式的最小值。即求函式的最小值。
梯度下降演算法的迭代公式：$w:=w-\alpha \nabla_wf(w)$

訓練演算法：使用梯度上升找到最佳引數

圖5-3 資料集圖

資料集圖

圖5-3中有100個樣本點，每個點包含兩個數值型特徵 X1和X2。

梯度上升演算法的虛擬碼

每個迴歸係數初始化為1
重複 R 次：
    計算整個資料集的梯度
    使用 alpha*gradient 更新迴歸係數的向量
    返回迴歸係數

程式5-1 Logistic 迴歸梯度上升優化演算法

import os
import numpy as np
import matplotlib.pyplot as plt
from path_settings import machine_learning_PATH

data_set_path = os.path.join(machine_learning_PATH, '第五章/data-set')
testSet_path = os.path.join(data_set_path, 'testSet.txt')
horseColicTraining_path = os.path.join(data_set_path, 'horseColicTraining.txt')
horseColicTest_path = os.path.join(data_set_path, 'horseColicTest.txt')


def load_data_set():
    """匯入資料集"""
    data_mat = []
    label_mat = []

    # 迴圈匯入.txt文字資料構造成列表
    fr = open(testSet_path)
    for line in fr.readlines():
        line_arr = line.strip().split()
        data_mat.append([1, float(line_arr[0]), float(line_arr[1])])
        label_mat.append(int(line_arr[2]))

    return data_mat, label_mat


def sigmoid(in_x):
    return 1 / (1 + np.exp(-in_x))


def grad_ascent(data_mat_in, class_labels):
    # 生成特徵矩陣
    data_matrix = np.mat(data_mat_in)
    # 生成標記矩陣並反置
    label_mat = np.mat(class_labels).transpose()

    # 計算data_matrix的行列
    m, n = np.shape(data_matrix)

    # 設定移動的步長為0.001
    alpha = 0.001
    # 設定最大遞迴次數500次
    max_cycles = 500

    # 初始化係數為1*3的元素全為1的矩陣
    weights = np.ones((n, 1))

    # 迴圈迭代梯度上升演算法
    for k in range(max_cycles):
        # 計算真實類別與預測類別的差值
        h = sigmoid(data_matrix * weights)
        error = (label_mat - h)
        
        # 調整迴歸係數
        weights = weights + alpha * data_matrix.transpose() * error

    return weights


def test_grad_ascent():
    data_mat, label_mat = load_data_set()
    weights = grad_ascent(data_mat, label_mat)
    print(weights)
    """
    [[ 4.12414349]
     [ 0.48007329]
     [-0.6168482 ]]
    """


if __name__ == '__main__':
    test_grad_ascent()

分析資料：畫出決策邊界

該節將通過程式碼畫出決策邊界

程式5-2 畫出資料集和 Logistic 迴歸最佳擬合直線的函式

def plot_best_fit(wei):
    # getA==np.asarrayz(self)
    # 使用__class__.__name__為了判斷是梯度上升和隨機梯度上升
    if wei.__class__.__name__ == 'matrix':
        weights = wei.getA()
    elif wei.__class__.__name__ == 'ndarray':
        weights = wei
    else:
        weights = wei

    data_mat, label_mat = load_data_set()

    # 把特徵集轉換成陣列
    data_arr = np.array(data_mat)
    n = np.shape(data_arr)[0]

    # 迴圈資料集分類
    xcord1 = []
    ycord1 = []
    xcord2 = []
    ycord2 = []
    for i in range(n):
        if int(label_mat[i]) == 1:
            xcord1.append(data_arr[i, 1])
            ycord1.append(data_arr[i, 2])
        else:
            xcord2.append(data_arr[i, 1])
            ycord2.append(data_arr[i, 2])

    fig = plt.figure()
    ax = fig.add_subplot(111)
    ax.scatter(xcord1, ycord1, s=30, c='red', marker='s')
    ax.scatter(xcord2, ycord2, s=30, c='green')

    # 0.1是步長
    x = np.arange(-3, 3, 0.1)
    # 假設 sigmoid 函式為0，並且這裡的 x，y 相當於上述的 x1和x2即可得出 y 的公式
    y = (-weights[0] - weights[1] * x) / weights[2]

    ax.plot(x, y)
    plt.xlabel('X1')
    plt.ylabel('X2')
    plt.show()


def test_plot_best_fit():
    data_mat, label_mat = load_data_set()
    weights = grad_ascent(data_mat, label_mat)
    plot_best_fit(weights)


if __name__ == '__main__':
    # test_grad_ascent()
    test_plot_best_fit()

圖5-4 梯度上升演算法500次迭代後的結果

梯度上升演算法500次迭代後的結果

通過圖5-4 可以看出我們只分錯了2-4個點。

訓練演算法：隨機梯度上升
梯度上升法每次更新迴歸係數時都需要遍歷整個資料集，如果樣本或者特徵數過多就應該考慮使用隨機梯度上升演算法。
隨機梯度上升：一次僅用一個樣本點來更新迴歸係數，不需要重新讀取整個資料集。

隨機梯度上升演算法虛擬碼

所有迴歸係數初始化為1
對資料集中每個樣本
    計算該樣本的梯度
    使用 alpha*gradient 更新迴歸係數值
返回迴歸係數值

程式5-3 隨機梯度上升演算法

def stoc_grad_ascent0(data_matrix, class_labels):
    """隨機梯度上升演算法"""
    m, n = np.shape(data_matrix)

    alpha = 0.01
    weights = np.ones(n)
    for i in range(m):
        # 使用 sum 函式得出一個值，只用計算一次
        h = sigmoid(sum(data_matrix[i] * weights))
        error = class_labels[i] - h
        weights = weights + alpha * error * data_matrix[i]

    return weights


def test_stoc_grad_ascent0():
    data_arr, label_mat = load_data_set()
    weights = stoc_grad_ascent0(np.array(data_arr), label_mat)
    plot_best_fit(weights)


if __name__ == '__main__':
    # test_grad_ascent()
    # test_plot_best_fit()
    test_stoc_grad_ascent0()

梯度上升和隨機梯度上升：從程式碼中我們可以看到前者變數 h 和誤差 error 都是向量，而後者全是數值；前者是矩陣轉換，後者則是 numpy 陣列。

圖5-5 隨機梯度上升演算法圖

隨機梯度上升演算法圖

圖5-5可以看出隨機梯度上升演算法的最佳擬合直線並非最佳分類線

程式5-4 改進的隨機梯度上升演算法

def stoc_grad_ascent1(data_matrix, class_labels, num_iter=150):
    """改進隨機梯度上升演算法，預設迭代150次"""
    m, n = np.shape(data_matrix)
    weights = np.ones(n)
    for j in range(num_iter):
        data_index = list(range(m))
        for i in range(m):
            # 每次迭代減小 alpha 的值，但最小為0.01，確保新資料依然有影響。緩解係數波動的情況
            alpha = 4 / (1 + j + i) + 0.01

            # 隨機選取值進行更新
            rand_index = int(np.random.uniform(0, len(data_index)))

            h = sigmoid(sum(data_matrix[rand_index] * weights))
            error = class_labels[rand_index] - h
            weights = weights + alpha * error * data_matrix[rand_index]

            # 刪除更新後的值
            del (data_index[rand_index])

    return weights


def test_stoc_grad_ascent1():
    data_arr, label_mat = load_data_set()
    weights = stoc_grad_ascent1(np.array(data_arr), label_mat)
    plot_best_fit(weights)


if __name__ == '__main__':
    # test_grad_ascent()
    # test_plot_best_fit()
    # test_stoc_grad_ascent0()
    test_stoc_grad_ascent1()

圖5-6 改進隨機梯度上升演算法圖

改進隨機梯度上升演算法圖

圖5-6可以看出150次的跌打就能得到一條很好的分類線，而梯度上升演算法需要迭代500次。

示例：從疝氣病預測病馬的死亡率
疝氣病：描述馬胃腸痛的術語
資料集中包含368個樣本和28個特徵，並且有30%的值是缺失的

示例：使用 Logistic 迴歸估計馬疝病的死亡率

收集資料：給定資料檔案
準備資料：用 Python 解析文字檔案並填充缺失值
分析資料：視覺化並觀察資料
訓練演算法：使用優化演算法，找到最佳的係數
測試演算法：觀察錯誤率，根據錯誤率決定是否會退到訓練階段；改變迭代的次數和步長等引數來得到更好的迴歸係數
使用演算法：實現一個簡單的程式來手機馬的症狀並輸出預測結果

準備資料：處理資料中的缺失值

資料的獲取是相當昂貴的，扔掉和重新獲取都是不可取的
以下幾種方法可以解決資料的缺失的問題

使用可用特徵的均值來填補缺失值
使用特殊值來填補缺失值
忽略有缺失值的樣本
使用相似樣本的均值填補缺失值
使用另外的機器學習演算法預測缺失值

預處理第一件事：用0替代所有的缺失值，因為缺失值為0時迴歸係數的更新公式不會更新並且 sigmoid(0)=0.5，他對結果的預測不具有任何傾向性
預處理第二件事：對於資料標記缺失的資料捨棄，因為標記很難確定採用某個合適的值來替換。
預處理後的檔案：對於原始資料檔案可以去 http://archive.ics.uci.edu/ml/datasets/Horse+Colic 獲取，此處只提供預處理之後的檔案

測試演算法：用 Logistic 迴歸進行分類

def classify_vector(in_x, weights):
    prob = sigmoid(sum(in_x * weights))
    if prob > 0.5:
        return 1
    else:
        return 0


def colic_test():
    """馬疝病造成馬死亡概率預測"""
    fr_train = open(horseColicTraining_path)
    fr_test = open(horseColicTest_path)

    training_set = []
    training_labels = []
    for line in fr_train.readlines():
        # 切分所有特徵並把特徵加入 line_arr 列表中
        curr_line = line.strip().split('\t')  # type:list
        line_arr = []
        for i in range(21):
            line_arr.append(float(curr_line[i]))
        # 分開處理特徵和標記
        training_set.append(line_arr)
        training_labels.append(float(curr_line[21]))

    train_weights = stoc_grad_ascent1(np.array(training_set), training_labels, 500)
    print(train_weights)

    error_count = 0
    num_test_vec = 0
    for line in fr_test.readlines():
        num_test_vec += 1
        curr_line = line.strip().split('\t')  # type:list
        line_arr = []
        for i in range(21):
            line_arr.append(float(curr_line[i]))

        # 通過比較樣本標記與輸入係數與特徵相乘值 sigmoid 函式得到的標記判斷是否預測失誤
        if int(classify_vector(np.array(line_arr), train_weights)) != int(curr_line[21]):
            error_count += 1

    error_rate = (float(error_count) / num_test_vec)
    print('測試集的錯誤率: {}'.format(error_rate))
    # 測試集的錯誤率: 0.373134328358209

    return error_rate


def multi_test():
    num_tests = 10
    error_sum = 0
    for k in range(num_tests):
        error_sum += colic_test()
    print('迭代 {} 次後平均錯誤率為: {}'.format(num_tests, error_sum / float(num_tests)))
    # 迭代 10 次後平均錯誤率為: 0.3656716417910448


if __name__ == '__main__':
    # test_grad_ascent()
    # test_plot_best_fit()
    # test_stoc_grad_ascent0()
    # test_stoc_grad_ascent1()
    multi_test()

完整程式碼logRegres.py

import os
import numpy as np
import matplotlib.pyplot as plt
from path_settings import machine_learning_PATH

data_set_path = os.path.join(machine_learning_PATH, '第五章/data-set')
testSet_path = os.path.join(data_set_path, 'testSet.txt')
horseColicTraining_path = os.path.join(data_set_path, 'horseColicTraining.txt')
horseColicTest_path = os.path.join(data_set_path, 'horseColicTest.txt')


def load_data_set():
    """匯入資料集"""
    data_mat = []
    label_mat = []

    # 迴圈匯入.txt文字資料構造成列表
    fr = open(testSet_path)
    for line in fr.readlines():
        line_arr = line.strip().split()
        data_mat.append([1, float(line_arr[0]), float(line_arr[1])])
        label_mat.append(int(line_arr[2]))

    return data_mat, label_mat


def sigmoid(in_x):
    """構造 sigmoid 函式"""
    return 1 / (1 + np.exp(-in_x))


def grad_ascent(data_mat_in, class_labels):
    """梯度上升演算法"""
    # 生成特徵矩陣
    data_matrix = np.mat(data_mat_in)
    # 生成標記矩陣並反置
    label_mat = np.mat(class_labels).transpose()

    # 計算data_matrix的行列
    m, n = np.shape(data_matrix)

    # 設定移動的步長為0.001
    alpha = 0.001
    # 設定最大遞迴次數500次
    max_cycles = 500

    # 初始化係數為1*3的元素全為1的矩陣
    weights = np.ones((n, 1))

    # 迴圈迭代梯度上升演算法
    for k in range(max_cycles):
        # 計算真實類別與預測類別的差值
        h = sigmoid(data_matrix * weights)
        error = (label_mat - h)

        # 調整迴歸係數
        weights = weights + alpha * data_matrix.transpose() * error

    return weights


def test_grad_ascent():
    data_mat, label_mat = load_data_set()
    weights = grad_ascent(data_mat, label_mat)
    print(weights)
    """
    [[ 4.12414349]
     [ 0.48007329]
     [-0.6168482 ]]
    """


def plot_best_fit(wei):
    """畫出被分割的資料集"""
    # getA==np.asarrayz(self)
    # 使用__class__.__name__為了判斷是梯度上升和隨機梯度上升
    if wei.__class__.__name__ == 'matrix':
        weights = wei.getA()
    elif wei.__class__.__name__ == 'ndarray':
        weights = wei
    else:
        weights = wei

    data_mat, label_mat = load_data_set()

    # 把特徵集轉換成陣列
    data_arr = np.array(data_mat)
    n = np.shape(data_arr)[0]

    # 迴圈資料集分類
    xcord1 = []
    ycord1 = []
    xcord2 = []
    ycord2 = []
    for i in range(n):
        if int(label_mat[i]) == 1:
            xcord1.append(data_arr[i, 1])
            ycord1.append(data_arr[i, 2])
        else:
            xcord2.append(data_arr[i, 1])
            ycord2.append(data_arr[i, 2])

    fig = plt.figure()
    ax = fig.add_subplot(111)
    ax.scatter(xcord1, ycord1, s=30, c='red', marker='s')
    ax.scatter(xcord2, ycord2, s=30, c='green')

    # 0.1是步長
    x = np.arange(-3, 3, 0.1)
    # 假設 sigmoid 函式為0，並且這裡的 x，y 相當於上述的 x1和x2即可得出 y 的公式
    y = (-weights[0] - weights[1] * x) / weights[2]

    ax.plot(x, y)
    plt.xlabel('X1')
    plt.ylabel('X2')
    plt.show()


def test_plot_best_fit():
    data_mat, label_mat = load_data_set()
    weights = grad_ascent(data_mat, label_mat)
    plot_best_fit(weights)


def stoc_grad_ascent0(data_matrix, class_labels):
    """隨機梯度上升演算法"""
    m, n = np.shape(data_matrix)

    alpha = 0.01
    weights = np.ones(n)
    for i in range(m):
        # 使用 sum 函式得出一個值，只用計算一次
        h = sigmoid(sum(data_matrix[i] * weights))
        error = class_labels[i] - h
        weights = weights + alpha * error * data_matrix[i]

    return weights


def test_stoc_grad_ascent0():
    data_arr, label_mat = load_data_set()
    weights = stoc_grad_ascent0(np.array(data_arr), label_mat)
    plot_best_fit(weights)


def stoc_grad_ascent1(data_matrix, class_labels, num_iter=150):
    """改進隨機梯度上升演算法，預設迭代150次"""
    m, n = np.shape(data_matrix)
    weights = np.ones(n)
    for j in range(num_iter):
        data_index = list(range(m))
        for i in range(m):
            # 每次迭代減小 alpha 的值，但最小為0.01，確保新資料依然有影響。緩解係數波動的情況
            alpha = 4 / (1 + j + i) + 0.01

            # 隨機選取值進行更新
            rand_index = int(np.random.uniform(0, len(data_index)))

            h = sigmoid(sum(data_matrix[rand_index] * weights))
            error = class_labels[rand_index] - h
            weights = weights + alpha * error * data_matrix[rand_index]

            # 刪除更新後的值
            del (data_index[rand_index])

    return weights


def test_stoc_grad_ascent1():
    data_arr, label_mat = load_data_set()
    weights = stoc_grad_ascent1(np.array(data_arr), label_mat)
    plot_best_fit(weights)


def classify_vector(in_x, weights):
    prob = sigmoid(sum(in_x * weights))
    if prob > 0.5:
        return 1
    else:
        return 0


def colic_test():
    """馬疝病造成馬死亡概率預測"""
    fr_train = open(horseColicTraining_path)
    fr_test = open(horseColicTest_path)

    training_set = []
    training_labels = []
    for line in fr_train.readlines():
        # 切分所有特徵並把特徵加入 line_arr 列表中
        curr_line = line.strip().split('\t')  # type:list
        line_arr = []
        for i in range(21):
            line_arr.append(float(curr_line[i]))
        # 分開處理特徵和標記
        training_set.append(line_arr)
        training_labels.append(float(curr_line[21]))

    train_weights = stoc_grad_ascent1(np.array(training_set), training_labels, 500)
    print(train_weights)

    error_count = 0
    num_test_vec = 0
    for line in fr_test.readlines():
        num_test_vec += 1
        curr_line = line.strip().split('\t')  # type:list
        line_arr = []
        for i in range(21):
            line_arr.append(float(curr_line[i]))

        # 通過比較樣本標記與輸入係數與特徵相乘值 sigmoid 函式得到的標記判斷是否預測失誤
        if int(classify_vector(np.array(line_arr), train_weights)) != int(curr_line[21]):
            error_count += 1

    error_rate = (float(error_count) / num_test_vec)
    print('測試集的錯誤率: {}'.format(error_rate))
    # 測試集的錯誤率: 0.373134328358209

    return error_rate


def multi_test():
    num_tests = 10
    error_sum = 0
    for k in range(num_tests):
        error_sum += colic_test()
    print('迭代 {} 次後平均錯誤率為: {}'.format(num_tests, error_sum / float(num_tests)))
    # 迭代 10 次後平均錯誤率為: 0.3656716417910448


if __name__ == '__main__':
    # test_grad_ascent()
    # test_plot_best_fit()
    # test_stoc_grad_ascent0()
    # test_stoc_grad_ascent1()
    multi_test()

總結

Logistic 迴歸：尋找一個非線性函式 Sigmoid 的最佳擬合引數。
求解過程：通過最優化演算法（常用的梯度上升演算法），通過簡化梯度上升演算法得到隨機梯度上升演算法
對缺失資料的處理：機器學習中最後只能更要的問題之一，主要還是取決於實際應用中的需求。

支援向量機 coding……

==尊重原創==
==可以伸出你的小手點個關注，謝謝！==

部落格園地址：https://www.cnblogs.com/chenyoude/
git 地址：https://github.com/nickcyd/machine_learning
微信：a1171958281

機器學習之核函式邏輯迴歸（機器學習技法）

從軟間隔SVM到正則化從引數ξ談起在軟間隔支援向量機中引數ξ代表某一個資料點相對於邊界犯錯的程度，如下圖：在資料點沒有違反邊界時ξ的值為0，在違反邊界時的值就會大於0。所以總的來說ξ的值等於max(1 - y(WZ + b) , 0)。所以我們把問題合併如下：這樣這個問題就變

機器學習之SVM與邏輯迴歸的聯絡和區別

　　通常說的SVM與邏輯迴歸的聯絡一般指的是軟間隔的SVM與邏輯迴歸之間的關係，硬間隔的SVM應該是與感知機模型的區別和聯絡。而且工程中也不能要求所有的點都正確分類，訓練資料中噪聲的存在使得完全正確分類很可能造成過擬合。　　軟間隔SVM與邏輯迴歸的聯絡　　要說軟間隔SVM與聯絡就要看軟間隔SVM的緣由。

機器學習之 Logistic 迴歸(邏輯迴歸)

目錄 Logistic迴歸部落格園地址：https://www.cnblogs.com/chenyoude/ git 地址：https://github.com/nickcyd/machine_learning 微信：a1171958281 Logistic 迴

機器學習之logistic迴歸演算法與程式碼實現

Logistic迴歸演算法與程式

機器學習之logistic迴歸

logistic迴歸又稱logistic迴歸分析，是一種廣義的線性迴歸分析模型，它解決的是分類問題，常用於資料探勘，疾病自動診斷，經濟預測等領域。 1.logistic迴歸和線性迴歸的區別 logistic迴歸和線性迴歸的區別在於以下幾點： 1）線性迴歸要求變數

機器學習筆記04：邏輯迴歸(Logistic regression)、分類(Classification)

說明：本文章所有圖片均屬於Stanford機器學課程，轉載請註明出處面對一些類似迴歸問題，我們可以通過線性迴歸方法來擬合一個函式，以此來預測資料，但它的輸出是連續的。有時候呢，我們需要一種方法給出一個判定結果，例如”同意(agree)”、”不同意

機器學習之logistic迴歸的梯度上升演算法

#coding=utf-8#logistic迴歸的梯度上升法from numpy import *import matplotlib.pyplot as plt#載入資料集def loadDataSet(): dataMat = []; labelMat = [] fr = open(

機器學習之logistic迴歸與分類

logistic迴歸與分類是一種簡單的分類演算法。在分類的過程中只需要找到一個劃分不同類的權重向量即可，對新的資料只需要乘上這個向量並比較就可以得到分類。比如下圖的二分類問題：每個樣本點可以看成包含兩個特徵（x1,x2）,現在需要把他們分開，如果這是訓練

機器學習系列(3)_邏輯迴歸應用之Kaggle泰坦尼克之災

1.引言先說一句，年末雙十一什麼的一來，真是非(mang)常(cheng)歡(gou)樂(le)！然後push自己抽出時間來寫這篇blog的原因也非常簡單：寫完前兩篇邏輯迴歸的介紹和各個角度理解之後，我們討論群(戳我入群)的小夥伴們紛紛表示『好像很

Coursera機器學習-第三週-邏輯迴歸Logistic Regression

Classification and Representation 1. Classification Linear Regression （線性迴歸）考慮的是連續值（[0,1]之間的數）的問題，而Logistic Regression（邏輯迴歸）考

【原】Andrew Ng斯坦福機器學習 Programming Exercise 2——邏輯迴歸

作業說明　　Exercise 2，Week 3，使用Octave實現邏輯迴歸模型。資料集 ex2data1.txt ，ex2data2.txt 　　實現 Sigmoid 、代價函式計算Computing Cost 和梯度下降Gradient Descent。檔案清單

機器學習之優雅落地線性迴歸法

在統計學中，線性迴歸（Linear regression）是利用稱為線性迴歸方程的最小二乘函式對一個或多個自變數和因變數之間關係進行建模的一種迴歸分析維基百科。簡單線性迴歸當只有一個自變數的時候，成為簡單線性迴歸。簡單線性迴歸模型的思路為了得到一個簡單線性迴歸模型，假設存在以房屋面積為特徵

吳恩達機器學習之多變數線性迴歸實現部分

C++實現梯度下降法 “linear_regression.h” //多變數線性迴歸模型 struct elem_var2 { double y; double* x; //用陣列傳入自變數資料(x[0]=1,便於之後的計算) }; class var2

吳恩達機器學習之多變數線性迴歸理論部分

本部落格主要參考此部落格：戀雨心一.Multiple Features — 多維特徵相對於單變數線性迴歸模型，多變數線性迴歸模型適用於處理多個變數/特徵。對比：以之前我們介紹的單變數線性迴歸模型為例：用房屋面積x預測房子價格y。現在我們對房價模型增加更多的特徵，例如房間

吳恩達機器學習之單變數線性迴歸實現部分

C++實現程式碼實現 “linear_regression.h” //單變數線性迴歸模型 struct elem_var1 { double x, y; //訓練集元素資料：自變數、因變數 }; class var1_lin_reg { p

吳恩達機器學習之單變數線性迴歸理論部分

理論部分 1.方程形式在進行資料處理過程中，有時資料影象可擬合成單變數線性函式，即 2.如何擬合此時，我們雖知道擬合函式的形式，但如何擬合仍是個問題，怎樣擬合可以最接近實際資料情況呢？最小二乘法此時我們引入代價函式這個概念代價函式接下來我們來分析如何

機器學習（四）邏輯迴歸模型訓練

本篇不講演算法只講用Python （pandas, matplotlib, numpy, sklearn) 進行訓練的一些要點 1.合併index np.concatenate([index1,index2]) 2.from sklearn.cross_va

機器學習（一）邏輯迴歸與softmax迴歸及程式碼示例

本文適合已經對機器學習、人工智慧有過一定了解，但是還沒有自己寫過程式碼，或者一直在使用現有框架的同學。不用框架自己寫一次程式碼的過程還是很有必要的，能讓你真正地理解原理與機器學習中各個步驟的實現過程，而不是停留在“好像懂了”、只會調庫的階段。目錄

吳恩達-機器學習(3)-分類、邏輯迴歸、多分類、過擬合

文章目錄 Classification and Representation Classification Hypothesis Representation Decision Boundary

機器學習筆記3：邏輯迴歸

機器學習筆記3：邏輯迴歸 Andrew Ng機器學習課程學習筆記3 邏輯迴歸就是分類問題，比如把郵件標示為垃圾郵件和正常郵件，判斷腫瘤是良性的還是惡性的. Sigmoid function 線性迴歸方程中，hθ(x) 的取值ｙ是連續的，而邏輯迴歸中輸出則是離散的。以兩個類別

機器學習之 Logistic 迴歸(邏輯迴歸)

Logistic迴歸

部落格園地址：https://www.cnblogs.com/chenyoude/

git 地址：https://github.com/nickcyd/machine_learning

微信：a1171958281

Logistic 迴歸

本章內容

迴歸演算法

Logistic 迴歸的一般過程

Logistic的優缺點

基於 Logistic 迴歸和 Sigmoid 函式的分類

Sigmoid 函式

Logistic 迴歸分類器

圖5-1 兩種座標尺度下的 Sigmoid 函式圖

基於最優化方法的最佳迴歸係數確定

梯度上升法

圖5-2 梯度上升圖

梯度下降演算法

訓練演算法：使用梯度上升找到最佳引數

圖5-3 資料集圖

梯度上升演算法的虛擬碼

程式5-1 Logistic 迴歸梯度上升優化演算法

分析資料：畫出決策邊界

程式5-2 畫出資料集和 Logistic 迴歸最佳擬合直線的函式

圖5-4 梯度上升演算法500次迭代後的結果

訓練演算法：隨機梯度上升

隨機梯度上升演算法虛擬碼

程式5-3 隨機梯度上升演算法

圖5-5 隨機梯度上升演算法圖

程式5-4 改進的隨機梯度上升演算法

圖5-6 改進隨機梯度上升演算法圖

示例：從疝氣病預測病馬的死亡率

示例：使用 Logistic 迴歸估計馬疝病的死亡率

準備資料：處理資料中的缺失值

測試演算法：用 Logistic 迴歸進行分類

完整程式碼logRegres.py

總結

支援向量機 coding……

相關推薦