邏輯迴歸之癌症預測

阿新 • • 發佈：2018-11-28

import numpy as np
from sklearn.datasets import load_breast_cancer


def feature_scalling(X):
    mean = X.mean(axis=0)
    std = X.std(axis=0)
    return (X - mean) / std


def load_data(shuffled=False):
    data_cancer = load_breast_cancer()
    x = data_cancer.data
    y = data_cancer.target
    x = feature_scalling(x)
    y = np.reshape(y, (len(y), 1))
    if shuffled:
        shuffled_index = np.random.permutation(y.shape[0])
        x = x[shuffled_index]
        y = y[shuffled_index]
    return x, y


def sigmoid(z):
    gz = 1 / (1 + np.exp(-z))
    return gz


def gradDescent(X, y, W, b, alpha, maxIt):
    cost_history = []
    maxIteration = maxIt
    m, n = X.shape
    for i in range(maxIteration):
        z = np.dot(X, W) + b
        error = sigmoid(z) - y
        W = W - (1 / m) * alpha * np.dot(X.T, error)
        b = b - (1.0 / m) * alpha * np.sum(error)
        cost_history.append(cost_function(X, y, W, b))
    return W, b, cost_history


def accuracy(X, y, W, b):
    m, n = np.shape(X)
    z = np.dot(X, W) + b
    y_hat = sigmoid(z)
    predictioin = np.ones((m, 1), dtype=float)
    for i in range(m):
        if y_hat[i, 0] < 0.5:
            predictioin[i] = 0.0
    return 1 - np.sum(np.abs(y - predictioin)) / m


def cost_function(X, y, W, b):
    m, n = X.shape
    z = np.dot(X, W) + b
    y_hat = sigmoid(z)
    J = (-1 / m) * np.sum(y * np.log(y_hat) + (1 - y) * np.log(1 - y_hat))
    return J

if __name__ == '__main__':
    X, y = load_data()
    m, n = X.shape
    alpha = 0.1
    W = np.random.randn(n, 1)
    b = 0.1
    maxIt = 200
    W, b, cost_history = gradDescent(X, y, W, b, alpha, maxIt)
    print("******************")
    print("W is :             ")
    print(W)
    print("accuracy is :         " + str(accuracy(X, y, W, b)))
    print("******************")

來源：https://github.com/TolicWang/MachineLearningWithMe/blob/master/Lecture_02/LogisticRegression.py

邏輯迴歸之癌症預測

import numpy as np from sklearn.datasets import load_breast_cancer def feature_scalling(X): mean = X.mean(axis=0) std = X.std(axis=0) re

邏輯迴歸之考試是否錄取

一、其中LogisticRegression是自己寫的模組，該模組是波士頓房價預測裡的程式碼波士頓房價預測二、完全程式碼 import matplotlib.pyplot as plt import pandas as pd import numpy as np from

機器學習5：邏輯迴歸之多分類Multi-class classification

上一節講解了邏輯迴歸中的二分類問題的原理與步驟，本節講解多分類問題。以三個class分類為例，過程如圖所示：原理性推導省略。 1、如圖1所示，對於每個類別，各分配一個線性模型，通過softmax處理得到每個類別的輸出概率y，且所有y的和等於1； 2、如圖2所示，輸出的

ML.NET 示例：迴歸之銷售預測

寫在前面準備近期將微軟的machinelearning-samples翻譯成中文，水平有限，如有錯漏，請大家多多指正。如果有朋友對此感興趣，可以加入我：https://github.com/feiyun0112/machinelearning-samples.zh-cn eShopDash

機器學習--邏輯迴歸及乳腺癌預測

邏輯迴歸演算法是用來解決分類問題的演算法。邏輯迴歸模型由sklearn.linear_model.LogisticRegression實現例項：乳腺癌預測 a. 模型訓練 # 載入自帶乳腺癌資料集 from sklearn.datasets import lo

SAS邏輯迴歸之二分類

資料集這裡用的是australian,有14個自變數Xi,一個因變數Y，Y值只取0或1。程式碼如下： /*邏輯迴歸資料集australian（690個觀測值，每個含14個屬性，目標變數y(0、1)）*/ /*匯入資料集australian到邏輯庫work中*/ proc

tensorflow 邏輯迴歸之解決欠擬合問題（一）

本篇主要總結1.二分類邏輯迴歸簡單介紹， 2.演算法的實現 3.對欠擬合問題的解決方法及實現（第二部分） 1.邏輯迴歸邏輯迴歸主要用於非線性分類問題。具體思路是首先對特徵向量進行權重分配之後用 sigmoid 函式啟用。如下公式(1)(2) : h > 0.5時，分

Spark中元件Mllib的學習27之邏輯迴歸-多元邏輯迴歸，較大資料集，帶預測準確度計算

2.程式碼： /** * @author xubo * ref:Spark MlLib機器學習實戰 * more code:https://github.com/xubo245/SparkLearning

預測概率的邏輯迴歸演算法

原創： wk Refinitiv創新實驗室ARGO 10月1日 "本篇文章包含部分數學公式，閱讀時間約10分鐘" 曾有報道說，性感女神安吉麗娜朱莉因確認攜帶致癌基因，患乳腺癌概率為87%，所以她選擇主動切除乳腺。當時這篇報道給我的震驚在於女神的果斷，

機器學習入門之房價預測（線性迴歸）

#!/usr/bin/env python # coding: utf-8 # In[1]: # 1.定義問題 # 2.匯入資料 # 匯入類庫 import numpy as np import pandas as pd import matplotlib.pyplot as plt impo

廣義線性迴歸之邏輯斯諦迴歸（ Logistic Regression）

廣義線性模型邏輯斯諦迴歸概念可以認為是屬於廣義線性迴歸的範疇，但它是用來進行分類的。線性模型的表示式為： f (

機器學習之數學系列（二）邏輯迴歸反向傳播數學推導

一、簡介在深度學習領域，我們往往採用梯度下降(或上升)法來優化訓練函式模型，梯度下降法尤其是在優化凸函式上表現極佳。模型優化涉及到反向傳播過程，反向傳播過程需要先推匯出梯度計算公式然後利用機器進行代數運算。這篇博文的工作是詳細推導了邏輯迴歸反向傳播梯度計算公式(什麼是梯度？簡單來講

我的人工智慧之旅——邏輯迴歸

本文，將涉及以下知識點，（1）決策邊界，decision boundary （2）凸函式，convex function （3）非凸函式，non convex function 此前所討論的問題，都為線性迴歸問題。本文將介紹邏輯迴歸演算法，該演算法為分類問題提出解決方

機器學習之用Python進行邏輯迴歸分析

前言迴歸和分類方法是機器學習中經常用到的方法，本文首先介紹這兩種方法的區別和聯絡，然後對分類方法中的邏輯迴歸進行較詳細的說明（包括其基本原理及評估指標），最後結合案例介紹如何利用Python進行邏輯迴歸分析。一、分類與迴歸 1.1什麼是分類和迴歸區分迴歸問題

Spark-MLlib的快速使用之六（迴歸分析之邏輯迴歸）

（1）演算法描述邏輯迴歸（Logistic Regression）是用於處理因變數為分類變數的迴歸問題，常見的是二分類或二項分佈問題，也可以處理多分類問題，它實際上是屬於一種分類方法（2）測試資料 1 1:-0.222222 2:0.5 3:-0.762712 4:-0.833333

sklearn的快速使用之三（邏輯迴歸）

import sys from sklearn.feature_extraction.text import TfidfVectorizer from sklearn.linear_model.logistic import LogisticRegression X = [] &nbs

機器學習之LogisticRegression邏輯迴歸

機器學習之LogisticRegression邏輯迴歸 # -*- coding: utf-8 -*- """ Created on Wed Nov 21 20:31:59 2018 @author: muli """ import matplotlib.pyplo

邏輯迴歸預測貸款使用者是否會逾期

學習筆記（二）邏輯迴歸預測貸款使用者是否會逾期演算法實踐能力的【整個思路】：構建模型——>模型融合——>模型評估——>交叉驗證——>模型調參——>特徵工程。【遵循】一次只做一件事，【先做再優化】的思路。每一個過程在完成任務的前提下，都可以拓展學習。【期望目

通過使用各種演算法（線性迴歸，邏輯迴歸，隨機森林，繼承演算法）預測泰坦尼克號上的某個人是否獲救

Python原始碼: #!/usr/bin/env python # encoding: utf-8 """ @Company：華中科技大學電氣學院聚變與等離子研究所 @version: V1.0 @author: Victor @contact: [email protected]

利用python實現梯度下降和邏輯迴歸原理(Python詳細原始碼：預測學生是否被錄取)

本案例主要是：建立邏輯迴歸模型預測一個學生是否被大學錄取，沒有詳細介紹演算法推到，讀者可查閱其他部落格理解梯度下降演算法的實現：https://blog.csdn.net/wangliang0633/article/details/79082901 資料格式如下：第三列表示錄取狀態，0--

邏輯迴歸之癌症預測

相關推薦