深度學習之路, 從邏輯迴歸開始, 手寫一個分類器.

阿新 • • 發佈：2019-02-15

要給同事講神經網路和tensorflow. 需要普及一些前導知識.
所以我準備了一個課件, 寫了下面這個不使用工具和庫,全手寫的分類器. . 個人感覺, 對於幫助理解機器學習的具體實現過程是很有幫助的. (僅僅為了演示原理,實現寫的比較粗糙,談不上效能. )
放在這裡, 希望可以幫到其他同學.

宣告 : The MIT License
有需要的隨便拿去用.

import numpy as np
import matplotlib
import matplotlib.pyplot as plt
import math
import sys


dataset_raw = [
[0.051267 
,0.69956,1 ],
[-0.092742,0.68494,1    ],
[-0.21371,0.69225,1 ],
[-0.375,0.50219,1   ],
[-0.51325,0.46564,1 ],
[-0.52477,0.2098,1  ],
[-0.39804,0.034357,1    ],
[-0.30588,-0.19225,1    ],
[0.016705,-0.40424,1    ],
[0.13191,-0.51389,1 ],
[0.38537,-0.56506,1 ],
[0.52938,-0.5212,1  ],
[0.63882,-0.24342,1 ],
[0.73675,-0.18494,1 ],
[0.54666,0.48757 
,1  ],
[0.322,0.5826,1     ],
[0.16647,0.53874,1  ],
[-0.046659,0.81652,1    ],
[-0.17339,0.69956,1 ],
[-0.47869,0.63377,1 ],
[-0.60541,0.59722,1 ],
[-0.62846,0.33406,1 ],
[-0.59389,0.005117,1    ],
[-0.42108,-0.27266,1    ],
[-0.11578,-0.39693,1    ],
[0.20104,-0.60161,1 ],
[0.46601,-0.53582,1 ],
[0.67339,-0.53582,1 ],
[-0.13882,0.54605 
,1 ],
[-0.29435,0.77997,1 ],
[-0.26555,0.96272,1 ],
[-0.16187,0.8019,1  ],
[-0.17339,0.64839,1 ],
[-0.28283,0.47295,1 ],
[-0.36348,0.31213,1 ],
[-0.30012,0.027047,1    ],
[-0.23675,-0.21418,1    ],
[-0.06394,-0.18494,1    ],
[0.062788,-0.16301,1    ],
[0.22984,-0.41155,1 ],
[0.2932,-0.2288,1   ],
[0.48329,-0.18494,1 ],
[0.64459,-0.14108,1 ],
[0.46025,0.012427,1 ],
[0.6273,0.15863,1   ],
[0.57546,0.26827,1  ],
[0.72523,0.44371,1  ],
[0.22408,0.52412,1  ],
[0.44297,0.67032,1  ],
[0.322,0.69225,1    ],
[0.13767,0.57529,1  ],
[-0.0063364,0.39985,1   ],
[-0.092742,0.55336,1    ],
[-0.20795,0.35599,1 ],
[-0.20795,0.17325,1 ],
[-0.43836,0.21711,1 ],
[-0.21947,-0.016813,1   ],
[-0.13882,-0.27266,1    ],
[0.18376,0.93348,0  ],
[0.22408,0.77997,0  ],
[0.29896,0.61915,0  ],
[0.50634,0.75804,0  ],
[0.61578,0.7288,0   ],
[0.60426,0.59722,0  ],
[0.76555,0.50219,0  ],
[0.92684,0.3633,0   ],
[0.82316,0.27558,0  ],
[0.96141,0.085526,0 ],
[0.93836,0.012427,0 ],
[0.86348,-0.082602,0    ],
[0.89804,-0.20687,0 ],
[0.85196,-0.36769,0 ],
[0.82892,-0.5212,0  ],
[0.79435,-0.55775,0 ],
[0.59274,-0.7405,0  ],
[0.51786,-0.5943,0  ],
[0.46601,-0.41886,0 ],
[0.35081,-0.57968,0 ],
[0.28744,-0.76974,0 ],
[0.085829,-0.75512,0    ],
[0.14919,-0.57968,0 ],
[-0.13306,-0.4481,0 ],
[-0.40956,-0.41155,0    ],
[-0.39228,-0.25804,0    ],
[-0.74366,-0.25804,0    ],
[-0.69758,0.041667,0    ],
[-0.75518,0.2902,0  ],
[-0.69758,0.68494,0 ],
[-0.4038,0.70687,0  ],
[-0.38076,0.91886,0 ],
[-0.50749,0.90424,0 ],
[-0.54781,0.70687,0 ],
[0.10311,0.77997,0  ],
[0.057028,0.91886,0 ],
[-0.10426,0.99196,0 ],
[-0.081221,1.1089,0 ],
[0.28744,1.087,0    ],
[0.39689,0.82383,0  ],
[0.63882,0.88962,0  ],
[0.82316,0.66301,0  ],
[0.67339,0.64108,0  ],
[1.0709,0.10015,0   ],
[-0.046659,-0.57968,0   ],
[-0.23675,-0.63816,0    ],
[-0.15035,-0.36769,0    ],
[-0.49021,-0.3019,0 ],
[-0.46717,-0.13377,0    ],
[-0.28859,-0.060673,0   ],
[-0.61118,-0.067982,0   ],
[-0.66302,-0.21418,0    ],
[-0.59965,-0.41886,0    ],
[-0.72638,-0.082602,0   ],
[-0.83007,0.31213,0 ],
[-0.72062,0.53874,0 ],
[-0.59389,0.49488,0 ],
[-0.48445,0.99927,0 ],
[-0.0063364,0.99927,0   ],
[0.63265,-0.030612,0    ],
]

dataset_np = np.array(dataset_raw)

#feature engineering

def prep_feature(x):
    x = np.insert(x, 2, np.power(x[:,0],2), axis=1)
    x = np.insert(x, 3, np.power(x[:,1],2), axis=1)
    x = np.insert(x, 4, np.multiply( x[:,0],x[:,1] ), axis=1)
    x = np.insert(x, 0, 1, axis=1)
    return x

dataset_np = prep_feature(dataset_np)


dataset_positive = dataset_np[ dataset_np[:,6] == 1 ]
dataset_nagtive = dataset_np[ dataset_np[:,6] == 0 ]


fig, ax = plt.subplots()
ax.hold(True)
ax.plot(dataset_positive[:,1], dataset_positive[:,2], 'o')
ax.plot(dataset_nagtive[:,1], dataset_nagtive[:,2], 'x')

#sys.exit()
#extract the Y.
dataset_y = dataset_np[:,6]


#3 steps
# define the model.

theta = np.ones(6)
learning_rate = 0.01

loss = []

def Sigmoid(z):
    # 1/(1+e^-z)
    s = np.frompyfunc(lambda x:  1/(1 + math.e**-z) , 1, 1)
    return s(z)[0]

def Model(theta_,dataset_):
    # h(theta) theta' * dataset
    biased_dataset = dataset_.copy()
    #biased_dataset = np.insert(biased_dataset, 0, 1, axis=1)
    mt = np.matrix(biased_dataset)[:,:6].transpose()
    tt = np.matrix(theta)
    z = np.squeeze(np.asarray(tt * mt))
    return Sigmoid(z),z


def Cost(theta,predict,y):
    #J(theta) -y*log(h_theta(x)) - (1-y)log(1-h_theta(x))
    part_1 = np.multiply(-y ,np.log( predict ) )
    part_2 =  np.multiply(1-y ,np.log( 1- predict ))
    total = np.subtract( part_1 , part_2)
    return np.sum(total) / len(y) / 2


#for test

try:
    while True:
        theta_copy = theta.copy()
        predict_test,z = Model(theta_copy,dataset_np)
        cost_test = Cost(theta,predict_test,dataset_y)
        print(cost_test)
        loss.append(cost_test)

        for i in range(6):
            diff = np.subtract(predict_test , dataset_y)
            i_col_dataset =  dataset_np[:,i]
            mt_diff = np.matrix(diff)
            mt_x = np.matrix(i_col_dataset).transpose()
            g = np.sum(mt_diff * mt_x) / len(dataset_np) * learning_rate
            #print("g(%d) is %f"%(i,g))
            theta_copy[i] -= g
        theta = theta_copy
except KeyboardInterrupt as e:
    print("stop traning...")

# draw the decision bundry


bundry_set = []
for i in range(200):
    for j in range(200):
        bundry_set.append([i/100-1,j/100 -1])

bundry_set_np = np.array(bundry_set)
bundry_set_np_featured = prep_feature(bundry_set_np)
predict_test,z = Model(theta,bundry_set_np_featured)
dundry = bundry_set_np_featured[ np.logical_and( predict_test  > 0.5 ,predict_test  < 0.51 ) ]

ax.plot(dundry[:,1], dundry[:,2], '.')


print("end program...")

執行後自動開始訓練, 控制檯輸出loss, 當loss可以接受之後,按ctrl+c停止訓練.
稍等片刻, 可以看到程式影象輸出如下, 點為1, x為0, 綠色的圈是decision bundry.

這裡寫圖片描述

深度學習之路, 從邏輯迴歸開始, 手寫一個分類器.

要給同事講神經網路和tensorflow. 需要普及一些前導知識. 所以我準備了一個課件, 寫了下面這個不使用工具和庫,全手寫的分類器. . 個人感覺, 對於幫助理解機器學習的具體實現過程是很有幫助的. (僅僅為了演示原理,實現寫的比較粗糙,談不上效能.

Tensorflow深度學習之七：再談mnist手寫數字識別程式

之前學習的第一個深度學習的程式就是mnist手寫字型的識別，那個時候對於很多概念不是很理解，現在回過頭再看當時的程式碼，理解了很多，現將加了註釋的程式碼貼上，與大家分享。（本人還是在學習Tensorflow的初始階段，如果有什麼地方理解有誤，還請大家不吝指出。）

mysql學習之路--從安裝開始

我是直接裝的安裝版，這個比較容易上手，官方下載地址：點我點我點我呀安裝教程：在這裡，系統是win10，雖然不好用，但也沒辦法，好了，不瞎bb了，下面直接開始。第一部分：基本概念資料庫分關係型資料庫和非關係型資料庫，最常用的關係資料庫就是mysql，其次還有MariaDB，sql

機器學習&深度學習之路

線性概率論向量正則決策下機正則化希望池化計劃最近好好按步驟按階段系統性的學習下機器學習和深度學習，希望能堅持下去。基礎數學篇 [高等數學：求導、梯度] [高等數學：泰勒展開] [概率論：基本概念、條件概率、全概率、樸素貝葉斯] [概率論：期望、方差

[TensorFlow深度學習入門]實戰四·邏輯迴歸鳶尾花進行分類（對比均方根誤差與softmax交叉熵誤差區別）

[TensorFlow深度學習入門]實戰四·邏輯迴歸鳶尾花進行分類問題描述資料集鳶尾花資料集下載地址鳶尾花資料集包含四個特徵和一個標籤。這四個特徵確定了單株鳶尾花的下列植物學特徵： 1、花萼長度 2、花萼寬度 3、花瓣長度 4、花瓣寬度該標籤確定了鳶尾花品種，

大資料學習之路------藉助HDP SANDBOX開始學習

一開始... 　　一開始知道大資料這個概念的時候，只是感覺很高大上，引起了我的興趣。當時也不知道，這個東西是做什麼的，有什麼用，當然現在看來也是很模糊的樣子，但是的確比一開始強了不少。　　所以學習的過程可能會很艱辛甚至有時候會很緩慢，但是感覺這東西未來會很有用途，最

機器學習之核函式邏輯迴歸（機器學習技法）

從軟間隔SVM到正則化從引數ξ談起在軟間隔支援向量機中引數ξ代表某一個資料點相對於邊界犯錯的程度，如下圖：在資料點沒有違反邊界時ξ的值為0，在違反邊界時的值就會大於0。所以總的來說ξ的值等於max(1 - y(WZ + b) , 0)。所以我們把問題合併如下：這樣這個問題就變

[js高手之路]從原型鏈開始圖解繼承到組合繼承的產生

於javascript原型鏈的層層遞進查詢規則，以及原型物件(prototype)的共享特性，實現繼承是非常簡單的事情一、把父類的例項物件賦給子類的原型物件（prototype），可以實現繼承 1 function Person(){ 2

機器學習之SVM與邏輯迴歸的聯絡和區別

　　通常說的SVM與邏輯迴歸的聯絡一般指的是軟間隔的SVM與邏輯迴歸之間的關係，硬間隔的SVM應該是與感知機模型的區別和聯絡。而且工程中也不能要求所有的點都正確分類，訓練資料中噪聲的存在使得完全正確分類很可能造成過擬合。　　軟間隔SVM與邏輯迴歸的聯絡　　要說軟間隔SVM與聯絡就要看軟間隔SVM的緣由。

深度學習之路：（一）Keras中mnist資料集測試

Keras環境搭建本地環境 MacOS 一、安裝Anaconda 1、下載Anaconda最新版本：官網下載地址附：清華映象源 2、下載後直接安裝，點選next 3、檢測版本開啟終端輸入conda -

機器學習&深度學習之路

計劃最近好好按步驟按階段系統性的學習下機器學習和深度學習，希望能堅持下去。課程學習斯坦福李飛飛視覺識別學習筆記 —— 2 影象分類斯坦福李飛飛視覺識別學習筆記 —— 3 損失函式和優化斯坦福李飛飛視覺識別學習筆記 —— 4 介紹神經網路斯坦福李飛飛視覺識別學習筆記 —— 5 卷積神經

【itext學習之路】-------（第一篇）建立一個簡單的pdf文件

iText是著名的開放原始碼的站點sourceforge一個專案，是用於生成PDF文件的一個java類庫。通過iText不僅可以生成PDF或rtf的文件，而且可以將XML、Html檔案轉化為PDF檔案本教程中，首先要說明的是，itext技術在網上很少能有一個相對全面文

Python小白學習之路（二十一）—【迭代器】

迭代器 1.迭代器協議物件必須提供一個 next 方法，執行該方法要麼返回迭代中的下一項，要麼就引起一個Stoplteration異常，以終止迭代（只能往後走不能往前退） 2.可迭代物件實現了迭代器協議的物件（如何實現：物件內部定義一個_iter_()方法）協議是一種約定，可迭代物件實現了

Netty學習之路（六）-分隔符和定長解碼器的應用

之前已經使用了LineBasedFrameDecoder解決TCP粘包問題，現在再學兩種解決TCP粘包的方法。 DelimiterBasedFrameDecoder：可以自動完成以分隔符做結束標誌的訊息的解碼，分隔符自定義。 FixedLengthFrameDecoder:

《TensorFlow：實戰Google深度學習框架》--5.2.1 MNIST手寫識別問題（程式已改進）

目錄 MNIST資料集介紹： TensorFlow完整訓練MNIST資料集（程式已改進）：本篇部落格涉及很多本書第4章的知識：啟用函式、指數衰減的學習率設定、正則化、滑動平均等知識。如有疑問請參考本部落格關於第4章記錄介紹。 MNIST資料集介紹： MNIST資料集是N

從 0 開始手寫一個 Spring MVC 框架，向高手進階

Spring框架對於Java後端程式設計師來說再熟悉不過了，以前只知道它用的反射實現的，但瞭解之後才知道有很多巧妙的設計在裡面。如果不看Spring的原始碼，你將會失去一次和大師學習的機會：它的程式碼規範，設計思想很值得學習。我們程式設計師大部分人都是野路子，不懂什麼

java深度學習框架Deeplearning4j實戰（一）BP神經網路分類器

1、Deeplearning4j 深度學習，人工智慧今天已經成了IT界最流行的詞，而tensorflow,phython又是研究深度學習神經網路的熱門工具。tensorflow是google的出品，而phython又以簡練的語法，獨特的程式碼結構和語言特性為眾多資料科學家和

Tensorflow學習之路（一）：從MNIST資料集開始

MNIST資料集簡單介紹： MNIST 資料集可在 http://yann.lecun.com/exdb/mnist/ 獲取, 它包含了四個部分: Training set images: train-images-idx3-ubyte.gz (9.9 MB,

深度學習之TensorFlow 第三章基本開發步驟--以邏輯迴歸擬合二維資料為例

深度學習有四個步驟：準備資料搭建模型迭代訓練使用模型 import tensorflow as tf import numpy as np #陣列 import matplotlib.pyplot as plt # matplotlib.pyplot

Sklearn學習之路（1）——從20newsgroups開始講起

1. Sklearn 簡介 Sklearn是一個機器學習的python庫，裡面包含了幾乎所有常見的機器學習與資料探勘的各種演算法。具體的，它常見的包括資料預處理（preprocessing）（正則化，歸一化等），特徵提取（feature_extractio

深度學習之路, 從邏輯迴歸開始, 手寫一個分類器.

相關推薦