基於梯度下降法實現線性迴歸演算法

阿新 • • 發佈：2019-02-05

# coding: utf-8

# In[1]:

# 資料校驗
def validate(X, Y):
    if len(X) != len(Y):
        raise Exception("引數異常")
    else:
        m = len(X[0])
        for l in X:
            if len(l) != m:
                raise Exception("引數異常")
        if len(Y[0]) != 1:
            raise Exception("引數異常")

# 計算差異值
def calcDiffe(x, y, a):
    lx = len(x)
    la = len(a)
    if lx == la:
        result = 0
        for i in range(lx):
            result += x[i] * a[i]
        return y - result
    elif lx + 1 == la:
        result = 0
        for i in range(lx):
            result += x[i] * a[i]
        result += 1 * a[lx] # 加上常數項
        return y - result
    else :
        raise Exception("引數異常")

                
## 要求X必須是List集合，Y也必須是List集合
def fit(X, Y, alphas, threshold=1e-6, maxIter=20, addConstantItem=True):
    import math
    import numpy as np
    ## 校驗
    validate(X, Y)
    ## 開始模型構建
    l = len(alphas)
    m = len(Y)
    n = len(X[0]) + 1 if addConstantItem else len(X[0])
    B = [True for i in range(l)]
    ## 差異性(損失值)
    J = [np.nan for i in range(l)]
    # 1. 隨機初始化0值(全部為0), a的最後一列為常數項
    a = [[0 for j in range(n)] for i in range(l)]
    # 2. 開始計算
    for times in range(maxIter):
        for i in range(l):
            if not B[i]:
                # 如果當前alpha的值已經計算到最優解了，那麼不進行繼續計算
                continue
            
            ta = a[i]
            for j in range(n):
                alpha = alphas[i]
                ts = 0
                for k in range(m):
                    if j == n - 1 and addConstantItem:
                        ts += alpha*calcDiffe(X[k], Y[k][0], a[i]) * 1
                    else:
                        ts += alpha*calcDiffe(X[k], Y[k][0], a[i]) * X[k][j]
                t = ta[j] + ts
                ta[j] = t
            ## 計算完一個alpha值的0的損失函式
            flag = True
            js = 0
            for k in range(m):
                js += math.pow(calcDiffe(X[k], Y[k][0], a[i]),2)
                if js > J[i]:
                    flag = False
                    break;
            if flag:
                J[i] = js
                for j in range(n):
                    a[i][j] = ta[j]
            else:
                # 標記當前alpha的值不需要再計算了
                B[i] = False        
        ## 計算完一個迭代，當目標函式/損失函式值有一個小於threshold的結束迴圈
        r = [0 for j in J if j <= threshold]
        if len(r) > 0:
            break
        # 如果全部alphas的值都結算到最後解了，那麼不進行繼續計算
        r = [0 for b in B if not b]
        if len(r) > 0:
            break;
    # 3. 獲取最優的alphas的值以及對應的0值
    min_a = a[0]
    min_j = J[0]
    min_alpha = alphas[0]
    for i in range(l):
        if J[i] < min_j:
            min_j = J[i]
            min_a = a[i]
            min_alpha = alphas[i]
    
    print "最優的alpha值為:",min_alpha
    
    # 4. 返回最終的0值
    return min_a

# 預測結果
def predict(X,a):
    Y = []
    n = len(a) - 1
    for x in X:
        result = 0
        for i in range(n):
            result += x[i] * a[i]
        result += a[n]
        Y.append(result)
    return Y

# 計算實際值和預測值之間的相關性
def calcRScore(y,py):
    if len(y) != len(py):
        raise Exception("引數異常")
    import math
    import numpy as np
    avgy = np.average(y)
    m = len(y)
    rss = 0.0
    tss = 0
    for i in range(m):
        rss += math.pow(y[i] - py[i], 2)
        tss += math.pow(y[i] - avgy, 2)
    r = 1.0 - 1.0 * rss / tss
    return r


# In[2]:

import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
import pandas as pd
import warnings
import sklearn
from sklearn.linear_model import LinearRegression,Ridge, LassoCV, RidgeCV, ElasticNetCV
from sklearn.preprocessing import PolynomialFeatures
from sklearn.pipeline import Pipeline
from sklearn.linear_model.coordinate_descent import ConvergenceWarning


# In[3]:

## 設定字符集，防止中文亂碼
mpl.rcParams['font.sans-serif']=[u'simHei']
mpl.rcParams['axes.unicode_minus']=False


# In[4]:

warnings.filterwarnings(action = 'ignore', category=ConvergenceWarning)
## 建立模擬資料
np.random.seed(0)
np.set_printoptions(linewidth=1000, suppress=True)
N = 10
x = np.linspace(0, 6, N) + np.random.randn(N)
y = 1.8*x**3 + x**2 - 14*x - 7 + np.random.randn(N)
x.shape = -1, 1
y.shape = -1, 1


# In[5]:

plt.figure(figsize=(12,6), facecolor='w')

## 模擬資料產生
x_hat = np.linspace(x.min(), x.max(), num=100)
x_hat.shape = -1,1

## 線性模型
model = LinearRegression()
model.fit(x,y)
y_hat = model.predict(x_hat)
s1 = calcRScore(y, model.predict(x))
print model.score(x,y) ## 自帶R^2輸出
print "模組自帶實現==============="
print "引數列表:", model.coef_
print "截距:", model.intercept_


## 自模型
ma = fit(x,y,np.logspace(-4,-2,100), addConstantItem=True)
y_hat2 = predict(x_hat, ma)
s2 = calcRScore(y, predict(x,ma))
print "自定義實現模型============="
print "引數列表:", ma

## 開始畫圖
plt.plot(x, y, 'ro', ms=10, zorder=3)
plt.plot(x_hat, y_hat, color='#b624db', lw=2, alpha=0.75, label=u'Python模型，$R^2$:%.3f' % s1, zorder=2)
plt.plot(x_hat, y_hat2, color='#6d49b6', lw=2, alpha=0.75, label=u'自己實現模型，$R^2$:%.3f' % s2, zorder=1)
plt.legend(loc = 'upper left')
plt.grid(True)
plt.xlabel('X', fontsize=16)
plt.ylabel('Y', fontsize=16)

plt.suptitle(u'自定義的線性模型和模組中的線性模型比較', fontsize=22)
plt.show()


# In[6]:

from sklearn.ensemble import GradientBoostingRegressor#梯度下降的迴歸
clf = GradientBoostingRegressor()
y1 = y.ravel()
clf.fit(x,y1)
print "自帶梯度下降法R方:", clf.score(x,y1)
y_hat3=clf.predict(x_hat)
s3=calcRScore(y, clf.predict(x))

## 開始畫圖
plt.plot(x, y, 'ro', ms=10, zorder=3)
plt.plot(x_hat, y_hat, color='#b624db', lw=2, alpha=0.75, label=u'Python模型，$R^2$:%.3f' % s1, zorder=2)
plt.plot(x_hat, y_hat2, color='#6d49b6', lw=2, alpha=0.75, label=u'自己實現模型，$R^2$:%.3f' % s2, zorder=1)
plt.plot(x_hat, y_hat3, color='#6daaba', lw=2, alpha=0.75, label=u'自帶梯度下降方法，$R^2$:%.3f' % s3, zorder=1)
plt.legend(loc = 'upper left')
plt.grid(True)
plt.xlabel('X', fontsize=16)
plt.ylabel('Y', fontsize=16)

plt.suptitle(u'自定義的線性模型和模組中的線性模型比較', fontsize=22)
plt.show()


# In[ ]:

基於梯度下降法實現線性迴歸演算法

# coding: utf-8 # In[1]: # 資料校驗 def validate(X, Y): if len(X) != len(Y): raise Exception("引數異常") else: m = len(

機器學習演算法入門之(一) 梯度下降法實現線性迴歸

1. 背景線性迴歸的目標很簡單，就是用一條線，來擬合這些點，並且使得點集與擬合函式間的誤差最小。如果這個函式曲線是一條直線，那就被稱為線性迴歸，如果曲線是一條二次曲線，就被稱為二次迴歸。資料來自於GradientDescentExample中的data.

用梯度下降法實現線性迴歸

import math import matplotlib.pyplot as plt import random #不懂 def sum_of_gradient(x, y, thetas): """計算梯度向量，引數分別是x和y軸點座標資料以及方程引數""" m = len(x);

梯度下降法解決線性迴歸

''' 用梯度下降的優化方法來快速解決線性迴歸問題 ''' import tensorflow as tf import numpy as np import matplotlib.pyplot as plt import os os.environ['TF_

[ch04-02] 用梯度下降法解決線性迴歸問題

系列部落格，原文在筆者所維護的github上：https://aka.ms/beginnerAI，點選star加星不要吝嗇，星越多筆者越努力。 4.2 梯度下降法有了上一節的最小二乘法做基準，我們這次用梯度下降法求解w和b，從而可以比較二者的結果。 4.2.1 數學原理在下面的公式中，我們規定x是樣本特

梯度下降法實現最簡單線性迴歸問題python實現

梯度下降法是非常常見的優化方法，在神經網路的深度學習中更是必會方法，但是直接從深度學習去實現，會比較複雜。本文試圖使用梯度下降來優化最簡單的LSR線性迴歸問題，作為進一步學習的基礎。 import numpy as np import pandas as pd from numpy import *

【機器學習】基於梯度下降法的自線性迴歸模型

回顧關於梯度下降法以及線性迴歸的介紹，我們知道了：線性迴歸的損失函式為： J (

利用梯度下降法實現簡單的線性迴歸

最近做了好多個資料探勘的小專案，使用並比較了N多演算法，瞭解了很多機器學習的工具，如R語言、Spark機器學習庫、Python、Tensorflow和RapidMiner等等。但是我感覺到自己沒能深入下去，充其量也只是把別人的工具拿來玩玩而已。對演算法本身的優劣

tensorflow實現svm多分類 iris 3分類——本質上在使用梯度下降法求解線性回歸（loss是定制的而已）

points near plot asi atm lob put matplot ive # Multi-class (Nonlinear) SVM Example # # This function wll illustrate how to # implement

Python梯度下降法實現二元邏輯迴歸

Python梯度下降法實現二元邏輯迴歸二元邏輯迴歸假設函式定義當函式值大於等於0.5時，結果為1，當函式值小於0.5時，結果為0.函式的值域是(0, 1)。二元邏輯迴歸的損失函式上圖為二元邏輯迴歸的概率公式，則代價函式可以表示為損失函式求偏倒數為可以發

基於sciket-learn實現線性迴歸演算法

線性迴歸演算法主要用來解決迴歸問題，是許多強大的非線性模型的基礎，無論是簡單線性迴歸，還是多元線性迴歸，思想都是一樣的，假設我們找到了最佳擬合方程（對於簡單線性迴歸，多元線性迴歸對應多個特徵作為一組向量）y=ax+b，則對於每一個樣本點xi，根據我們的直線方程，預測值為y^i = axi + b,真

優化演算法——梯度下降法實現

批量梯度下降演算法實現 import numpy as np # 設定資料集的行數和維數 r = 20 c = 10 # 生成資料集合label x = np.random.randint(0, 10, r * c).reshape(r, c) # 20行，10列 x = n

梯度下降原理及線性迴歸程式碼實現（python/java/c++）

“梯度下降”顧名思義通過一步一步迭代逼近理想結果，當達到一定的精度或者超過迭代次數才退出，所以所獲得的結果是一個近似值。在其他部落格上面基本都有一個通俗的比喻：從山頂一步步下山。下面將用到幾個概念： - 步長：移動一步的長度。 - 維度：一個空間的表示方式，

2018.08.28 ali 梯度下降法實現最小二乘

4.3 div 數量 ask pre oss 找到 1.7 二維 - 要理解梯度下降和牛頓叠代法的區別 #include<stdio.h> // 1. 線性多維函數原型是 y = f(x1,x2,x3) = a * x1 + b * x2 + c * x

【機器學習三】梯度下降法K-means優化演算法

K-means演算法延伸對於之前的一篇文章中說過K-means雖然效果可以，但是對給定的K值敏感，簇中心位置敏感以及計算量大。所以針對以上兩點有了一些優化的方法。對於給定的K值偏大或者偏小都將影響聚類效果。而由於對於需要聚類的資料本身沒有一個y值即分類值，這正是需要演算法最後得出的。所以

梯度下降方法實現邏輯迴歸效能

Logistic Regression #三大件,%將那些用matplotlib繪製的圖顯示在頁面裡而不是彈出一個視窗 import numpy as np import pandas as pd import matplotlib.pyplot as plt %matpl

TensorFlow——實現線性迴歸演算法

import tensorflow as tf import numpy as np import matplotlib.pyplot as plt #使用numpy生成200個隨機點 x_data=np.linspace(-0.5,0.5,200)[:,np.newaxis] noise=np.rand

python利用梯度下降求多元線性迴歸

之前一直看Ng的課程，以為掌握了，結果自己動手實現發現問題很多。多元線性迴歸向量形式：Y=W∗X 展開：y=w0∗x0+w1∗x1+...+wn∗xn 參數:W:w0,w1,...wn 代價函數：J(w0,w1,...wn)=

梯度下降法求多元線性迴歸及Java實現

對於資料分析而言，我們總是極力找數學模型來描述資料發生的規律，有的資料我們在二維空間就可以描述，有的資料則需要對映到更高維的空間。資料表現出來的分佈可能是完全離散的，也可能是聚整合堆的，那麼機器學習的任務就是讓計算機自己在資料中學習到資料的規律。那麼這個規律通常是可以用一些函式來描述，

Python實現線性迴歸2，梯度下降演算法

接上篇 4.梯度下降演算法《斯坦福大學公開課：機器學習課程》吳恩達講解第二課時，是直接從梯度下降開始講解，最後採用向量和矩陣的方式推導瞭解析解，國內很多培訓視訊是先講解析解後講梯度下降，個人認為梯度下降演算法更為重要，它是很多演算法（邏輯迴歸、神經網路）都可

基於梯度下降法實現線性迴歸演算法

相關推薦