P37 Ridge嶺迴歸分析

阿新 • • 發佈：2020-12-24

http://bilibili.com/video/BV184411Q7Ng?p=37

#python嶺迴歸進行房間預測：

#load_boston裡面的數值都是連續的
from sklearn.datasets import load_boston
#從sklearn中的線性模型匯入線性迴歸，SGD隨機梯度下降
from sklearn.linear_model import LinearRegression,SGDRegressor,Ridge
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
 
from sklearn.metrics import mean_squared_error

def mylinear():
    """
    線性迴歸預測房子價格
    :return:
    """
    # 獲取資料
    lb=load_boston()
    # 分割資料集到訓練集和測試集
    x_train,x_test,y_train,y_test=train_test_split(lb.data,lb.target,test_size=0.25)

    #print(y_train) #列印訓練樣本
    #print("\n")
    #print(y_test) #列印測試樣本
    # 對特徵值進行標準化處理，目標值要不要進行標準化處理？答：也要標準化，因為特徵值標準化之後，乘以小權重之後，得到
    # 的值肯定也很小，這與原本的目標值相差會很大
    # 特徵值和目標值都必須進行標準化處理,例項化兩個標準化API
    std_x 
=StandardScaler()

    #x_train=std_x.fit_transform(x_train.reshape(-1,13))
    #x_test=std_x.fit_transform(x_test.reshape(-1,13))

    x_train=std_x.fit_transform(x_train)
    x_test=std_x.fit_transform(x_test)

    # 對目標值進行標準化
    std_y=StandardScaler()

    y_train=std_y.fit_transform(y_train.reshape(-1 
,1)) #樣本訓練標籤y_train源程式提供的是1維資料，
    # 這裡要做一個維度的形狀轉換，1維->2維，不知道有多少個樣本，所以第一個引數是"-1",但是每個樣本都只有一個目標值
    y_test=std_y.transform(y_test.reshape(-1,1))

    #y_train=std_y.fit_transform(y_train) #樣本訓練標籤y_train源程式提供的是1維資料，
    # 這裡要做一個維度的形狀轉換，1維->2維，不知道有多少個樣本，所以第一個引數是"-1",但是每個樣本都只有一個目標值
    #x_test=std_y.transform(y_test)




    #estimator預測

    # 首先使用正規方程求解方式預測結果：
    zhengguifunction=LinearRegression()
    zhengguifunction.fit(x_train,y_train)
    #print("通過正規方程的方法求解的迴歸方程的係數是：\n",zhengguifunction.coef_) # 打印出求解的權重引數

    # 沒有準確率了，但是可以使用求出的權重預測測試集樣本的價格
    #y_predict=lr.predict(x_test) #這個是根據測試樣本預測的價格
    # 之前標準化了，現在轉化回去，不然預測的都是小值
    y_zhengguifunction_predict = std_y.inverse_transform(zhengguifunction.predict(x_test))  # 這個是根據測試樣本預測的價格
    #print("正規方程的方法，測試集裡面每個測試樣本中房子的預測價格是：\n",y_zhengguifunction_predict) #打印出預測價格

    print("正規方程的均方誤差是：",mean_squared_error(std_y.inverse_transform(y_test),y_zhengguifunction_predict),'單位是：萬元的平方')

    # 通過梯度下降的方式進行房價預測：
    #lr=LinearRegression()
    sgdmethod=SGDRegressor() #SGD是隨機梯度下降的意思，regressor就是迴歸的意思
    sgdmethod.fit(x_train,y_train)
    sgdmethod.coef_=sgdmethod.coef_.reshape(1,-1)
    #print("通過梯度下降的方法迭代求解的迴歸方程的係數是：\n",sgdmethod.coef_) # 打印出求解的權重引數

    # 沒有準確率了，但是可以使用求出的權重預測測試集樣本的價格
    #y_predict=lr.predict(x_test) #這個是根據測試樣本預測的價格
    # 之前標準化了，現在轉化回去，不然預測的都是小值
    y_sgdmethod_predict = std_y.inverse_transform(sgdmethod.predict(x_test))  # 這個是根據測試樣本預測的價格
    y_sgdmethod_predict=y_sgdmethod_predict.reshape(-1,1)
    #print("梯度下降的方法，測試集裡面每個測試樣本中房子的預測價格是：\n",y_sgdmethod_predict) #打印出預測價格
    print("梯度下降的均方誤差是：", mean_squared_error(std_y.inverse_transform(y_test),  y_sgdmethod_predict),'單位是：萬元的平方')

    # 通過嶺迴歸的方式進行房價預測：
    sgd_Ridge=Ridge(alpha=1.0) #alpha是迴歸力度引數
    sgd_Ridge.fit(x_train,y_train)
    sgd_Ridge.coef_=sgd_Ridge.coef_.reshape(1,-1)
    #print("通過梯度下降的方法迭代求解的迴歸方程的係數是：\n",sgdmethod.coef_) # 打印出求解的權重引數

    # 之前標準化了，現在轉化回去，不然預測的都是小值
    sgd_Ridge_predict = std_y.inverse_transform(sgd_Ridge.predict(x_test))  # 這個是根據測試樣本預測的價格
    sgd_Ridge_predict=sgd_Ridge_predict.reshape(-1,1)
    #print("梯度下降的方法，測試集裡面每個測試樣本中房子的預測價格是：\n",sgd_Ridge_predict) #打印出預測價格
    print("嶺迴歸的均方誤差是：", mean_squared_error(std_y.inverse_transform(y_test),  sgd_Ridge_predict),'單位是：萬元的平方')


    # 下面列印正規方程和隨機梯度下降分別預測的權重係數的差值
    #print("通過正規方程方法求得的係數和隨機梯度下降迭代求得的係數差值是：")
    #for i in range(sgdmethod.coef_.shape[1]):
    #    print(sgdmethod.coef_[0][i]-zhengguifunction.coef_[0][i])


    # 下面列印正規方程和隨機梯度下降分別預測的房價的差值
    #print("通過正規方程方法預測的房價和隨機梯度下降迭代預測的房價的差值是：")
    #for i in range(y_sgdmethod_predict.shape[0]):
    #    print("%.1f"%abs((y_sgdmethod_predict[i][0]-y_zhengguifunction_predict[i][0])*10),"千元")



    return None





if __name__=="__main__":
    mylinear()

執行結果：

C:\Users\TJ\AppData\Local\Programs\Python\Python37\python.exe D:/qcc/python/mnist/fangjia_yuce.py
正規方程的均方誤差是： 22.63101875379508 單位是：萬元的平方
梯度下降的均方誤差是： 23.391171004734396 單位是：萬元的平方
嶺迴歸的均方誤差是： 22.639158049580825 單位是：萬元的平方

可見，加了正則化的線性迴歸好於一般的線性迴歸。

病態資料：異常資料，有異常資料的話最容易出現過擬合的情況，而嶺迴歸能在一定程度上抵抗這種異常資料。

P37 Ridge嶺迴歸分析

http://bilibili.com/video/BV184411Q7Ng?p=37 #python嶺迴歸進行房間預測： #load_boston裡面的數值都是連續的

關於多元線性迴歸分析——Python&SPSS

原始資料在這裡 1.觀察資料首先，用Pandas開啟資料，並進行觀察。 import numpy import pandas as pd

python 線性迴歸分析模型檢驗標準--擬合優度詳解

建立完迴歸模型後，還需要驗證咱們建立的模型是否合適，換句話說，就是咱們建立的模型是否真的能代表現有的因變數與自變數關係，這個驗證標準一般就選用擬合優度。

Python 線性迴歸分析以及評價指標詳解

廢話不多說，直接上程式碼吧！ \"\"\" # 利用 diabetes資料集來學習線性迴歸 # diabetes 是一個關於糖尿病的資料集，該資料集包括442個病人的生理資料及一年以後的病情發展情況。

R語言解決單因素方差分析以及迴歸分析問題--T檢驗+逐步迴歸法+顯著性檢驗

題目1 一位老師想要檢查3種不同的教學方法的效果，為此隨機地選取水平相當的15位學生，把他們分為3組，每組5人，每一組用一種方法教學，一段時間以後，這位老師對15位學生進行統考，成績見下表，問這3種教學

使用sklearn自帶的糖尿病資料集，進行迴歸分析

需求：對糖尿病資料集進行迴歸分析，以便對未知資料進行預測。資料集Diabetes：1.包含442個患者的10個生理特徵

47-模型泛化與嶺迴歸

模型正則化（Regularization）在上一篇部落格提到了過擬合這樣的問題或者解決我們的模型中含有巨大的方差這樣的問題，其中有一種非常標準的處理手段就是模型正則化（Regularization）。

R語言-嶺迴歸及lasso演算法

前文我們講到線性迴歸建模會有共線性的問題，嶺迴歸和lasso演算法都能一定程度上消除共線性問題。

遞進式講解線性迴歸、區域性加權、嶺迴歸和逐步線性迴歸

一、多變數線性迴歸模型標準線性迴歸的理論知識很簡單，我們既可以寫出它的標量表達式也可以寫成矩陣的形式，其中矩陣的形式也可以通過投影矩陣進行推到得到。本部分就對標準線性迴歸的表示式進行下簡單的推導。

【機器學習】【數學建模】迴歸分析

引言前面我們講過曲線擬合問題。曲線擬合問題的特點是，根據得到的若干有關變數的一組資料，尋找因變數與（一個或幾個）自變數之間的一個函式，使這個函式對那組資料擬合得最好。通常，函式的形式可以由經驗、先驗

迴歸分析方法總結

技術標籤：統計模型人工智慧這裡寫自定義目錄標題歡迎使用Markdown編輯器新的改變功能快捷鍵合理的建立標題，有助於目錄的生成如何改變文字的樣式插入連結與圖片如何插入一段漂亮的程式碼片生成一個適合你的

迴歸分析

基本概念變數之間的非嚴格函式關係：變數x、y之間存在某種密切的聯絡，但並非嚴格的函式關係（非確定性關係）。

線性迴歸的改進-嶺迴歸

1、帶有L2正則化的線性迴歸-嶺迴歸嶺迴歸，其實也是一種線性迴歸。只不過在演算法建立迴歸方程時候，加上正則化的限制，從而達到解決過擬合的效果

隨機森林R語言程式碼實現迴歸分析

技術標籤：隨機森林r語言 library(randomForest) library(foreign) 選擇樹種，避免每次執行不一致，數字可以隨便選

十二、機器學習演算法整合（knn、樸素貝葉斯、決策樹、隨機森林、線性迴歸、嶺迴歸、邏輯迴歸、聚類、支援向量機）

技術標籤：機器學習決策樹聚類機器學習一、需要匯入的庫： \'\'\' 作者:小宇最後完成日期：2021.2.28

手擼機器學習演算法 - 嶺迴歸

系列文章目錄：感知機線性迴歸非線性問題多項式迴歸嶺迴歸演算法介紹今天我們來一起學習一個除了線性迴歸、多項式迴歸外最最最簡單的迴歸演算法：嶺迴歸，如果用等式來介紹嶺迴歸，那麼就是：\\(嶺迴歸 = 多

機器學習sklearn（77）：演算法例項（三十四）迴歸（六）線性迴歸大家族（四）多重共線性：嶺迴歸與Lasso（一）嶺迴歸

1 最熟悉的陌生人：多重共線性逆矩陣存在的充分必要條件行列式不為0的充分必要條件

機器學習sklearn（78）：演算法例項（三十五）迴歸（七）線性迴歸大家族（五）多重共線性：嶺迴歸與Lasso（二）Lasso

3 Lasso 3.1 Lasso與多重共線性 3.2 Lasso的核心作用：特徵選擇 import numpy as np import pandas as pd

R語言--迴歸（迴歸分析、迴歸診斷、模型綜合驗證）

1 OLS迴歸（最小二乘法迴歸） 1.1 用lm()擬合迴歸模型在R中，擬合線性模型最基本的函式是lm()，格式為：myfit<-lm(formula,data)

機器學習筆記（七）——嶺迴歸（sklearn）

本部落格僅用於個人學習，不用於傳播教學，主要是記自己能夠看得懂的筆記（

P37 Ridge嶺迴歸分析

相關推薦