機器學習2---線性模型

阿新 • • 發佈：2018-11-14

LDA的程式碼可參見：https://blog.csdn.net/yt71656/article/details/45199603

來補充程式碼，萌新寫的，也沒有經過整理，只是為了熟悉思路，大神輕噴。

線性迴歸，python3。使用的資料是吳恩達的機器學習資料。

import numpy as np
import matplotlib.pyplot as plt

A = np.zeros((97,2),dtype=float)    #先建立一個 3x3的全零方陣A，並且資料的型別設定為float浮點型
 
f = open('\ex1data1.txt')               #開啟資料檔案檔案
lines = f.readlines()           #把全部資料檔案讀到一個列表lines中
A_row = 0                       #表示矩陣的行，從0行開始
for line in lines:              #把lines中的資料逐行讀取出來
    list = line.strip('\n').split(' ')      #處理逐行資料：strip表示把頭尾的'\n'去掉，split表示以空格來分割行資料，然後把處理後的行資料返回到list列表中
    A[A_row:] = list[0:2]                    #把處理後的資料放到方陣A中。list[0:3]表示列表的0,1,2列資料放到矩陣A中的A_row行
    A_row+=1                                #然後方陣A的下一行接著讀

x=A[:,0]
y=A[:,1]



# y = th1 + th2*x
th1=0
th2=1
N=20

m=len(A)
rl=0.02
sumt=[]  # 記錄代價函式取值
for i in range(N):    ## 優化10次
    sum=0
    sum1=0
    sum2=0
    for j in range(m):
        sum1=sum1+th1+th2*x[j]-y[j]   # th1
        sum2=sum2+(th1+th2*x[j]-y[j])*x[j]   # th2
        sum=sum+(th1+th2*x[j]-y[j])**2
    if (sum/m)<0.1:
        break
    sumt.append(sum/m)
        
    sum1=sum1/m
    sum2=sum2/m
    th1=th1-rl*sum1
    th2=th2-rl*sum2
    
print(th1,'+',th2,'x')

#繪製散點圖,examDf.jt為X軸，examDf.hk為Y軸
plt.scatter(x,y,color = 'darkgreen',label = "Exam Data")
 
#新增圖的標籤（x軸，y軸）
plt.xlabel("x")#設定X軸標籤
plt.ylabel("y")#設定Y軸標籤

x1 = np.linspace(0, 25, 100)
y1 = th1+th2*x1
plt.plot(x1, y1, color="blue")
plt.show()#顯示影象

plt.xlabel("n")#設定X軸標籤  次數
plt.ylabel("J")#設定Y軸標籤  代價函式
N1 = np.linspace(0, N, N)
plt.plot(N1, sumt, color="blue")
plt.show()#顯示影象

執行結果：

中間的藍色直線是擬合直線，其實看起來不太好，畢竟也只跑了20次。

代價函式的一個影象，橫座標是學習次數，可以看到是下降趨勢。

小tips：

（1）一定要動手啊~

（2）有時候其實不是演算法思路的問題，也不是程式碼的問題（簡潔性、優美之類的除外），就是取值的問題，多看看大神的程式碼真的有幫助。

多元線性迴歸分析的程式碼，資料是自己做的（3個輸入變數，一個輸出變數），這次是基於向量的思想在寫程式，比之前用迴圈的程式能簡潔些，哈哈哈~

# -*- coding: utf-8 -*-
"""
Created on Thu Nov  1 15:10:44 2018

@author: user
"""

import numpy as np
import matplotlib.pyplot as plt

# 生成隨機數
x=np.random.random([1,100])*5

x0=np.ones([1,100])
x1=x
x2=np.multiply(x,x)    # 矩陣元素做點乘
x3=np.multiply(x2,x)
x1=x1+np.random.random([1,100])-0.5
x2=x2+np.random.random([1,100])-0.5
x3=x3+np.random.random([1,100])-0.5
X=np.vstack((x0,x1,x2,x3))   # 按列合併，即將矩陣直接放在下面；np.hstack是按行合併
y=2*x0+3*x1+4*x2+5*x3    # m=100, n=3


# 求解 y=th0+th1*x1+th2*x2+th3*x3 中的引數th

# 初始化 
m=100 # 100個樣本
n=3  # 3個輸入變數（特徵）
ths=np.array([0,1,0,1]).reshape([4,1])
lr=0.00065
N=50  # 迭代次數
Co=[]
T=np.zeros([n+1,1])

# 梯度下降法訓練引數
for iter in range(N):
    cost=0
    for j in range(n+1):
        mm=X[j,:]
        mm=np.mat(mm)
        a=np.dot(ths.T,X)   # 矩陣做乘法
        b=np.dot(a,mm.T)
        c=np.dot(y,mm.T)
        T[j,0]=b-c
    ths=ths-lr*T/m
    for i in range(m):
        a=np.dot(ths.T,np.mat(X[:,i]).T)
        cost=cost+(a[0,0]-y[0,i])**2 
    Co.append(cost)
    
plt.xlabel("n")#設定X軸標籤  次數
plt.ylabel("J")#設定Y軸標籤  代價函式
N1 = np.linspace(0, N, N)
plt.plot(N1, Co, color="blue")
plt.show()#顯示影象

執行的代價函式結果：

感覺這個結果很佛性。。。其實引數結果還可以，設定初始值是個大學問。。。

小tip：

（1）矩陣的乘法要分清楚：*和dot() 不一樣。

（2）變數命名要看清楚，這個當時調了好久，後來發現是名字重複了。。。。。當時的心情，本來想去吃飯的。。。

（3）正則化，下次可以用上。

羅傑斯特迴歸

兩個程式碼，後期會修改比對：

import numpy as np
import math
import matplotlib.pyplot as plt

# 讀入資料
A = np.zeros((100,3),dtype=float)    
 
f = open('。。。')               #開啟資料檔案檔案
lines = f.readlines()           #把全部資料檔案讀到一個列表lines中
A_row = 0                       #表示矩陣的行，從0行開始
for line in lines:              #把lines中的資料逐行讀取出來
    list = line.strip('\n').split(' ')      #處理逐行資料：strip表示把頭尾的'\n'去掉，split表示以空格來分割行資料，然後把處理後的行資料返回到list列表中
    A[A_row:] = list[0:3]                    #把處理後的資料放到方陣A中。list[0:3]表示列表的0,1,2列資料放到矩陣A中的A_row行
    A_row+=1                                #然後方陣A的下一行接著讀

x=A[:,0:2]
y=A[:,2]
x=np.mat(x)
x=x.T
y=np.mat(y)
y=y.T


# 初始化引數
ths=np.array([1,1],dtype=float)
ths=np.mat(ths).T
m=len(y)
N=10
lr=0.001
J=[]

def mysigmoid(x):      
    h=1/(1+np.vectorize(math.exp)(-x))
    return h

# 訓練引數
for it in range(N):
    sum1= np.vectorize(math.log)(mysigmoid(-ths.T*x))*y+np.vectorize(math.log)(1-mysigmoid(-ths.T*x))*(1-y)
    temp= mysigmoid(-ths.T*x)
    sum2= x* (temp.T-y)
    J.append(-sum1[0,0]/m)
    dths= sum2/m
    ths=ths-lr*dths
    
plt.xlabel("n")#設定X軸標籤  次數
plt.ylabel("J")#設定Y軸標籤  代價函式
N1 = np.linspace(0, N, N)
plt.plot(N1, J, color="blue")
plt.show()#顯示影象


H=mysigmoid(-ths.T*x)

# -*- coding: utf-8 -*-
"""
Created on Mon Nov  5 17:16:00 2018

@author: user
"""

import numpy as np
 
 
class LogisticRegression:
    """
    Logistic Regression:邏輯迴歸
    Author：CommissarMa
    """
 
    def __init__(self, m, n, X, y, alpha, iterThreshold):
        """
        建構函式：初始化成員變數
        :param m: 記錄數量（int）
        :param n: 特徵數量（int）
        :param X: 記錄矩陣（n*m）（float）
        :param y: 類別向量（1*m）（取值範圍：0或1）
        :param alpha: 更新速率（float）
        :param iterThreshold: 梯度下降迭代停止條件（float）
        :var w: 引數向量（n*1）（float）
        :var b: 引數（float）
        """
        self.m = m
        self.n = n
        self.X = X
        self.y = y
        self.alpha = alpha
        self.iterThreshold = iterThreshold
        self.w = np.ones((n, 1))
        self.b = 0
        return
 
    def train(self):
        """
        訓練：使用資料進行訓練，使用梯度下降進行迭代使得損失值不斷下降直到小於設定的迭代停止條件
        :return:訓練完成後得到最優的w和b
        """
        JLast = -1  # 用來存放上一次迭代的損失值。用-1是因為損失值>=0
        count = 0  # 迭代次數
        while True:
            count += 1
            J = 0  # 損失值
            dw = np.zeros((self.n, 1))  # a對w的導數（n*1）
            db = 0  # a對b的導數
            Z = np.dot(self.w.T, self.X) + self.b  # Z=wT*X+b
            a = 1 / (1 + np.exp(-Z))  # Sigmoid函式
            J += -(np.dot(self.y, np.log(a).T) + np.dot(1 - self.y, np.log(1 - a).T))  # 損失函式的計算
            dz = a - self.y  # a對z的導數（m*1）
            dw += np.dot(self.X, dz.T)
            db += np.sum(dz, axis=1)
            J /= self.m  # 平均損失
            dw /= self.m
            db /= self.m
            self.w -= self.alpha * dw
            self.b -= self.alpha * db
            print("第" + str(count) + "次梯度下降的損失值J：" + str(J))
            if (np.abs(J - JLast) < self.iterThreshold and JLast > 0) or count>200:
                break
            JLast = J
        return self.w, self.b
 
    def predict(self, x):
        """
        預測:對新的記錄進行預測，給出預測的類別
        :param x:需要進行預測的一條記錄（n*1）
        :return:如果預測出的概率大於0.5就返回類別1，小於等於0.5就返回類別0
        """
        result = np.dot(self.w.T, x) + self.b
        result = 1 / (1 + np.exp(-result))
        if result > 0.5:
            return 1
        else:
            return 0
 
 
if __name__ == '__main__':
    
    A = np.zeros((100,3),dtype=float)    
    f = open('。。。')               #開啟資料檔案檔案
    lines = f.readlines()           #把全部資料檔案讀到一個列表lines中
    A_row = 0                       #表示矩陣的行，從0行開始
    for line in lines:              #把lines中的資料逐行讀取出來
        list = line.strip('\n').split(' ')      #處理逐行資料：strip表示把頭尾的'\n'去掉，split表示以空格來分割行資料，然後把處理後的行資料返回到list列表中
        A[A_row:] = list[0:3]                    #把處理後的資料放到方陣A中。list[0:3]表示列表的0,1,2列資料放到矩陣A中的A_row行
        A_row+=1
    x=A[:,:2]
    m,n=np.shape(x)
    X=x.reshape([n,m])
    y=A[:,2]
    
    alpha = 0.001  # 設定更新速率
    iterThreshold = 0.00001  # 設定迭代停止條件
    lr = LogisticRegression(m, n, X, y, alpha, iterThreshold)
    lr.train()
    print(lr.predict(np.array([np.random.rand(1), np.random.rand(1)])))
    print(help(LogisticRegression))

機器學習2---線性模型

LDA的程式碼可參見：https://blog.csdn.net/yt71656/article/details/45199603 來補充程式碼，萌新寫的，也沒有經過整理，只是為了熟悉思路，大神輕噴。線性迴歸，python3。使用的資料是

機器學習2 線性模型

引言線性模型形式簡單、易於建模，就好像“hello world”。但許多功能強大的非線性模型都是線上性模型上的延伸。我們主要介紹幾種經典的線性模型：線性迴歸，多項式迴歸，嶺迴歸，lasso迴歸，邏輯斯提回歸。線性迴歸以西瓜問題為例，它有三個屬性（也就做特徵），{色澤，根蒂，敲聲}，

機器學習演算法--線性模型

1.基本形式線性模型：給定一組樣本X=(x1,x2...xd)，其中xi是X在第i個屬性上的取值，通過屬性線性組合來預測函式其中W=(w1,w2...wd)分別為各個屬性xi的權重。 1.1線性迴歸：資料集D={(x1,y1),(x2,y2)...(xm,y

基於TensorFlow的機器學習(2) -- 迴歸模型

兩種典型的迴歸模型是linear regression 和 logistic regression。以下將分別對兩種迴歸模型進行分析以及基於tensorflow的實現。 Linear Regression(線性迴歸) 線性迴歸基本概念之前基於吳恩達的《

《機器學習_05_線性模型_最大熵模型》

```python import numpy as np import os os.chdir('../') import matplotlib.pyplot as plt %matplotlib inline ``` ### 一.最大熵原理最大熵的思想很樸素，即將已知事實以外的未知部分看做“等可能”的，

機器學習_線性迴歸模型

1.線性迴歸 1.1模型 1.1.1目標函式（損失函式、正則） a.無正則：最小二乘線性迴歸（OLS） b.L2正則：嶺迴歸（Ridge Regression） c.L1正則：Lasso 1.1.2概率解釋最小二乘線性迴歸等價於

CS229機器學習課程筆記---監督學習之線性模型

監督學習首先，我們考慮以下資料集，基於此資料集預測房價。可以畫出如下散點圖：定義符號 m — 訓練集樣本總數 x — 輸入變數/輸入特徵 (例，living area) y — 輸出/目標變數（例，price） { (x(i),y(i)) ；i =

機器學習之線性迴歸模型

當我們拿到樣本並經過特徵降維後得到 x1、x2 … 低維特徵，經過多項式對映得到線性迴歸的模型假設：上式 x1、x2 是樣本特徵，如果 y 是現實中房子的價格，那麼 x1、x2 相當於房子的面積、臥室數量等影響房子價格的因素，而 θ0、θ1、θ2 … 是係數

吳恩達-機器學習(2)-多元線性迴歸、正規方程

文章目錄 Multivariate Linear Regression 特徵縮放學習率多項式迴歸(Ploynomial regression) Normal Equation

機器學習2/100天-簡單線性迴歸

#Simple Linear Regression github: 100-Days-Of-ML-Code 假設X和Y之間是線性關係，基於自變數(independent variables)X，預測因變數(dependent variable)Y。目標是尋找最佳的線形關係，尋找線形關係使得

【機器學習】線性迴歸模型分析

具體原理不講了，線性迴歸模型，代價損失函式 COST是均方誤差，梯度下降方法。屬性取值。模型的屬性取值設定需要根據每一個引數的取值範圍來確定，將所有的屬性的取值統一正則化normalization，統一規定在0~1的範圍，或者-1~1的範圍內，這樣在進行線性迴歸時不會造成

機器學習-2：MachineLN之模型評估

你要的答案或許都在這裡：小鵬的部落格目錄開篇廢話：很多文章其實都是將書中的東西、網上課程、或者別人的論文的東西總結一下，發出來，但是個人感覺還是加入個人的理解，然後加上一些工程中遇到的

從零單排入門機器學習：線性回歸（linear regression）實踐篇

class rom enter instr function ont 線性 gin 向量線性回歸（linear regression）實踐篇之前一段時間在coursera看了Andrew ng的機器學習的課程，感覺還不錯，算是入門了。這次打算以該課程的作業

機器學習：線性判別式分析(LDA)

get generated 分類 learn 參數關註 ble 直線圖片 1.概述線性判別式分析（Linear Discriminant Analysis），簡稱為LDA。也稱為Fisher線性判別（Fisher Linear Disc

第四篇[機器學習] 機器學習，線性回歸的優化

images .html span mod 來看 itl sso linear 我們當我們的數據存在多重共線性時，即其中的一個自變量可以用其他一個或幾個自變量的線性表達式進行表示，你會發現，擬合之後的方差會特別大一般說來當解釋變量的容忍度(TOLERANCE)小於0.1

20171028機器學習之線性回歸過擬合問題的解決方案

ces 函數彈性 alpha mach rom 定性 ast cep 在函數中加入一個正則項：三種方式：一、Ridge回歸（嶺回歸）：　　優點：具有較高的準確性、魯棒性以及穩定性　　缺點：求解速度慢二、Lasso回歸：　　優點：求解速度快（原理降維計算

【機器學習】--線性回歸中L1正則和L2正則

last clas nbsp post pan red font 推廣 http 一、前述 L1正則，L2正則的出現原因是為了推廣模型的泛化能力。相當於一個懲罰系數。二、原理 L1正則：Lasso Regression L2正則：Ridge Regression

模式識別筆記2-線性模型

align 極大似然估計 play 模式連線激活 phi 最小二乘屬於 1. 參數VS非參數給定樣本集 $(x_i, y_i), i= 1,2,\cdots, n $,其中 $x_i$ 表示特征向量， $y_i$ 表示樣本標簽。考慮一個新的向量 \(x\

機器學習_線性回歸

ray 線性回歸麻煩小時數據集 nal best lin rand() 線性回歸人工智能是機器學習的父類；機器學習是深度學習的父類 1. 怎麽做線性回歸？ 2. 理解回歸 -- 最大似然函數 3. 應用正態分布概率密度函數 -- 對數總似然 4

機器學習：線性回歸——理論與代碼實現（基於正規方程與梯度下降）

overfit 返回 pen ear 隨機梯度是否很大的建模回歸一線性模型給定由n個屬性描述的列向量$f(\mathbf{x})={(x^{(1)};x^{(2)};...;x^{(n)})}$，其中 $x^{(j)}$是$\textbf{x}$

機器學習2---線性模型

相關推薦