邏輯迴歸之考試是否錄取

阿新 • • 發佈：2018-11-28

一、其中LogisticRegression是自己寫的模組，該模組是波士頓房價預測裡的程式碼波士頓房價預測

二、完全程式碼

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from LogisticRegression import gradDescent,cost_function,accuracy,feature_scalling

def load_data():
    data = pd.read_csv('./data/LogiReg_data.txt', names=['exam1', 'exam2', 'label']).as_matrix()#加names是新增pa格式的列的標籤，as_matrix是做成numpy格式的資料，沒有了橫和豎的標籤
    X = data[:, :-1]  # 取前兩列
    y = data[:, -1:]  # 取最後一列
    print(X)
    print(X.shape)#100*2
    print(X.shape[0])#100
    shuffle_index = np.random.permutation(X.shape[0])#其中X.shape[0]=100,這一行的作用是將列的索引打亂。np.random.permutation為隨機打亂函式
    print(shuffle_index)#從0到99隨機打亂的陣列
    X = X[shuffle_index]
    print(X)
    y = y[shuffle_index]
    return X, y#得到打亂的特徵X和打亂的標籤y


def visualize_data(X, y):
    positive = np.where(y == 1)[0]#得到正樣本的索引
    negative = np.where(y == 0)[0]#得到負樣本的索引
    plt.scatter(X[positive,0],X[positive,1],s=30,c='b',marker='o',label='Admitted')
    plt.scatter(X[negative,0],X[negative,1],s=30,c='r',marker='o',label='Not Admitted')
    plt.legend()#用於顯示標註admitted和not admitted
    plt.show()

def visualize_cost(ite,cost):#用來畫出代價函式和迭代次數曲線
    plt.plot(np.linspace(0,ite,ite),cost,linewidth=1)#np.linspace(0,ite,ite)表均分為#10000份，不是橫座標顯示出一萬份，因為cost對應有10000份，所以np.linspace也應該有10000份
    plt.title('cost history',color='r')
    plt.xlabel('iterations')
    plt.ylabel('cost J')
    plt.show()


if __name__ == '__main__':
    # Step 1.  Load data
    X, y = load_data()
    # Step 2.  Visualize data
    visualize_data(X, y)
    #
    m, n = X.shape#100*2
    X = feature_scalling(X)
    alpha = 0.1
    W = np.random.randn(n, 1)
    b = 0.1
    maxIt = 10000
    W, b, cost_history = gradDescent(X, y, W, b, alpha, maxIt)
    print("******************")
    print(cost_history[:20])
    visualize_cost(maxIt,cost_history)
    print("accuracys is :         " + str(accuracy(X, y, W, b)))
    print("W：",W)
    print("b: ",b)
    print("******************")

三、資料

https://github.com/TolicWang/MachineLearningWithMe/blob/master/Lecture_02/data/LogiReg_data.txt

四、用sklearn來實現

程式碼:

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
from LogisticRegression import feature_scalling
from sklearn.linear_model import LogisticRegression

def load_data():
    data = pd.read_csv('./data/LogiReg_data.txt', names=['exam1', 'exam2', 'label']).as_matrix()
    X = data[:, :-1]  # 取前兩列
    y = data[:, -1:]  # 取最後一列
    shuffle_index = np.random.permutation(X.shape[0])
    X = X[shuffle_index]
    y = y[shuffle_index]
    return X, y


def visualize_cost(ite,cost):
    plt.plot(np.linspace(0,ite,ite),cost,linewidth=1)
    plt.title('cost history',color='r')
    plt.xlabel('iterations')
    plt.ylabel('cost J')
    plt.show()


if __name__ == '__main__':
    X, y = load_data()
    X = feature_scalling(X)
    lr = LogisticRegression()
    lr.fit(X,y)
    print("******************")
    print("accuracys is :" ,lr.score(X,y))
    print("W:{},b:{}".format(lr.coef_,lr.intercept_))
    print("******************")

邏輯迴歸之考試是否錄取

一、其中LogisticRegression是自己寫的模組，該模組是波士頓房價預測裡的程式碼波士頓房價預測二、完全程式碼 import matplotlib.pyplot as plt import pandas as pd import numpy as np from

邏輯迴歸之癌症預測

import numpy as np from sklearn.datasets import load_breast_cancer def feature_scalling(X): mean = X.mean(axis=0) std = X.std(axis=0) re

機器學習5：邏輯迴歸之多分類Multi-class classification

上一節講解了邏輯迴歸中的二分類問題的原理與步驟，本節講解多分類問題。以三個class分類為例，過程如圖所示：原理性推導省略。 1、如圖1所示，對於每個類別，各分配一個線性模型，通過softmax處理得到每個類別的輸出概率y，且所有y的和等於1； 2、如圖2所示，輸出的

SAS邏輯迴歸之二分類

資料集這裡用的是australian,有14個自變數Xi,一個因變數Y，Y值只取0或1。程式碼如下： /*邏輯迴歸資料集australian（690個觀測值，每個含14個屬性，目標變數y(0、1)）*/ /*匯入資料集australian到邏輯庫work中*/ proc

tensorflow 邏輯迴歸之解決欠擬合問題（一）

本篇主要總結1.二分類邏輯迴歸簡單介紹， 2.演算法的實現 3.對欠擬合問題的解決方法及實現（第二部分） 1.邏輯迴歸邏輯迴歸主要用於非線性分類問題。具體思路是首先對特徵向量進行權重分配之後用 sigmoid 函式啟用。如下公式(1)(2) : h > 0.5時，分

廣義線性迴歸之邏輯斯諦迴歸（ Logistic Regression）

廣義線性模型邏輯斯諦迴歸概念可以認為是屬於廣義線性迴歸的範疇，但它是用來進行分類的。線性模型的表示式為： f (

機器學習之數學系列（二）邏輯迴歸反向傳播數學推導

一、簡介在深度學習領域，我們往往採用梯度下降(或上升)法來優化訓練函式模型，梯度下降法尤其是在優化凸函式上表現極佳。模型優化涉及到反向傳播過程，反向傳播過程需要先推匯出梯度計算公式然後利用機器進行代數運算。這篇博文的工作是詳細推導了邏輯迴歸反向傳播梯度計算公式(什麼是梯度？簡單來講

我的人工智慧之旅——邏輯迴歸

本文，將涉及以下知識點，（1）決策邊界，decision boundary （2）凸函式，convex function （3）非凸函式，non convex function 此前所討論的問題，都為線性迴歸問題。本文將介紹邏輯迴歸演算法，該演算法為分類問題提出解決方

機器學習之用Python進行邏輯迴歸分析

前言迴歸和分類方法是機器學習中經常用到的方法，本文首先介紹這兩種方法的區別和聯絡，然後對分類方法中的邏輯迴歸進行較詳細的說明（包括其基本原理及評估指標），最後結合案例介紹如何利用Python進行邏輯迴歸分析。一、分類與迴歸 1.1什麼是分類和迴歸區分迴歸問題

Spark-MLlib的快速使用之六（迴歸分析之邏輯迴歸）

（1）演算法描述邏輯迴歸（Logistic Regression）是用於處理因變數為分類變數的迴歸問題，常見的是二分類或二項分佈問題，也可以處理多分類問題，它實際上是屬於一種分類方法（2）測試資料 1 1:-0.222222 2:0.5 3:-0.762712 4:-0.833333

sklearn的快速使用之三（邏輯迴歸）

import sys from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.linear_model.logistic import LogisticRegression X = [] &nbs

機器學習之LogisticRegression邏輯迴歸

機器學習之LogisticRegression邏輯迴歸 # -*- coding: utf-8 -*- """ Created on Wed Nov 21 20:31:59 2018 @author: muli """ import matplotlib.pyplo

利用python實現梯度下降和邏輯迴歸原理(Python詳細原始碼：預測學生是否被錄取)

本案例主要是：建立邏輯迴歸模型預測一個學生是否被大學錄取，沒有詳細介紹演算法推到，讀者可查閱其他部落格理解梯度下降演算法的實現：https://blog.csdn.net/wangliang0633/article/details/79082901 資料格式如下：第三列表示錄取狀態，0--

機器學習實踐（十五）—sklearn之分類演算法-邏輯迴歸、精確率、召回率、ROC、AUC

邏輯迴歸雖然名字中帶有迴歸兩字，但它實際是一個分類演算法。一、邏輯迴歸的應用場景廣告點選率是否為垃圾郵件是否患病金融詐騙虛假賬號看到上面的例子，我們可以發現其中的特點，那就是都屬於兩個類別之間的判斷。邏輯迴歸就是

吳恩達機器學習之邏輯迴歸理論部分

一.特徵函式對應分類問題，我們先針對二分類問題進行討論，對應計算機而言，分類即將資料按其特徵值不同分為不同的集合，僅對應二分類問題，我們只需考慮分為：正類和負類，為此我們引入特徵函式。 y=1 — 代表二分類中的正類 y=0 — 代表二分類中的反類這是特殊函式

吳恩達《神經網路與深度學習》課程筆記歸納（二）-- 神經網路基礎之邏輯迴歸

上節課我們主要對深度學習（Deep Learning）的概念做了簡要的概述。我們先從房價預測的例子出發，建立了標準的神經網路（Neural Network）模型結構。然後從監督式學習入手，介紹了Standard NN，CNN和RNN三種不同的神經網路模型。接著介紹了兩種不

機器學習演算法與Python實踐之邏輯迴歸（Logistic Regression）（二）

#!/usr/bin/python # -*- coding:utf-8 -*- import numpy as np from numpy import * import matplotlib.pyplot as plt #處理資料函式 def loadDataSet():

小白的機器學習筆記系列之四-邏輯迴歸

一個概率問題前面我們講了線性分類和線性迴歸，這裡讓我們來思考另外一類問題——求概率問題。比如說，我們根據一個人的既往病歷，生活習慣，年齡等來判斷一個人是否會得心肌梗塞。我們想要的答案不僅僅是一個簡單的是或否，實際上我們希望知道的是得心肌梗塞的風險有多大。醫生

tensorflow之邏輯迴歸

邏輯迴歸 (1)手寫數字介紹資料分為訓練集合測試集，資料對應有：特徵及標籤；為了方便實現分類，本文使用one-hot 編碼方式； (2)手寫數字識別載入手寫數字集；分批次訓練，定義

機器學習之_邏輯迴歸

邏輯迴歸又稱logistic迴歸，邏輯斯諦迴歸，是一種廣義的線性迴歸分析模型。 1. Sigmod函式 Sigmoid函式也是神經網路中常用的函式，用於把x從負無窮到正無窮壓縮到y從0到1之間。畫出來就是一條S型曲線，如下圖中的藍色曲線：它以0點為中心對稱，公

邏輯迴歸之考試是否錄取

相關推薦