機器學習：線性迴歸和嶺迴歸入門程式碼

阿新 • • 發佈：2018-12-16

機器學習中運用python進行對房子價格的預測程式碼，資料庫直接使用sklearn自帶的boston，使用三種方法進行預測，分別是：線性迴歸直接預測、梯度下降預測、嶺迴歸預測

from sklearn.datasets import load_boston
from sklearn.linear_model import LinearRegression, SGDRegressor,Ridge
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error


def mylinear():
    """
    線性迴歸直接預測房子價格
    :return: None
    """

    # 獲取資料
    lb = load_boston()

    # 分割資料集到訓練集和測試集
    x_train, x_test, y_train, y_test = train_test_split(lb.data, lb.target, test_size=0.25)

    # print(y_train, y_test)

    # 進行標準化處理(?)目標值處理？
    # 特徵值和目標值都必須進行標準化處理,例項化兩個標準化API
    std_x = StandardScaler()

    x_train = std_x.fit_transform(x_train)
    x_test = std_x.transform(x_test)

    # 目標值
    std_y = StandardScaler()

    y_train = std_y.fit_transform(y_train.reshape(-1, 1))
    y_test = std_y.transform(y_test.reshape(-1, 1))

    # estimator預測
    # 正規方程求解方式預測結果
    lr = LinearRegression()

    lr.fit(x_train, y_train)

    print(lr.coef_)



    # 預測測試集房子價格
    y_lr_predict = std_y.inverse_transform(lr.predict(x_test))

    print("測試集裡面每個房子的預測價格：", y_lr_predict)

    print("正規方程的均方誤差：",mean_squared_error(std_y.inverse_transform(y_test), y_lr_predict))
    # 梯度下降去預測房價
    sgd = SGDRegressor()

    sgd.fit(x_train, y_train)

    print(sgd.coef_)



    # 預測測試集房子價格
    y_sgd_predict = std_y.inverse_transform(sgd.predict(x_test))

    print("測試集裡面每個房子的預測價格：", y_sgd_predict)

    print("梯度下降方程的均方誤差：", mean_squared_error(std_y.inverse_transform(y_test), y_sgd_predict))

    # 嶺迴歸去預測房價
    rd = Ridge()

    rd.fit(x_train, y_train)

    print(rd.coef_)



    # 預測測試集房子價格
    y_rd_predict = std_y.inverse_transform(rd.predict(x_test))

    print("測試集裡面每個房子的預測價格：", y_rd_predict)

    print("嶺迴歸方程的均方誤差：", mean_squared_error(std_y.inverse_transform(y_test), y_rd_predict))



    return None




if __name__ == '__main__':
    mylinear()

機器學習：線性迴歸和嶺迴歸入門程式碼

機器學習中運用python進行對房子價格的預測程式碼，資料庫直接使用sklearn自帶的boston，使用三種方法進行預測，分別是：線性迴歸直接預測、梯度下降預測、嶺迴歸預測 from sklearn.datasets import load_boston fr

機器學習：線性迴歸、嶺迴歸、Lasso迴歸

轉載自：https://blog.csdn.net/hzw19920329/article/details/77200475 線性迴歸作為一種迴歸分析技術，其分析的因變數屬於連續型變數，如果因變數轉變為離散型變數，將轉換為分類問題。迴歸分析屬於有監督學習問題，本部落格將重點回

機器學習：線性迴歸與Python程式碼實現

前言：本篇博文主要介紹線性迴歸模型（linear regression），首先介紹相關的基礎概念和原理，然後通過Python程式碼實現線性迴歸模型。特別強調，其中大多理論知識來源於《統計學習方法_李航》和斯坦福課程翻譯筆記以及Coursera機器學習課程。 1.線性迴歸

機器學習之區域性加權、嶺迴歸和前向逐步迴歸

　　都說萬事開頭難，可一旦開頭，就是全新的狀態，就有可能收穫自己未曾預料到的成果。記錄是為了更好的監督、理解和推進，學習過程中用到的資料集和程式碼都將上傳到github 　　迴歸是對一個或多個自變數和因變數之間的關係進行建模，求解的一種統計方法，之前的部落格中總結了線上性迴歸中使用最小二乘法推導最優引

吳恩達機器學習：線性迴歸

首先說一些關於課程的題外話。對於 Ng 的這個課程，筆者沒有選擇在 Coursera 上學習課程，一來是因為 Coursera 有自己的課程週期，但這個週期不一定適合所有人。其次 Coursera 的課程作業是使用 Octave 語言，而筆者個人覺得不管是學習還

機器學習(四)變數選擇技術----------嶺迴歸，Lasso

機器學習(四)變數選擇技術----------嶺迴歸，Lasso 我們回顧一下之前線性迴歸模型裡面的一元線性迴歸模型和多元線性迴歸模型，裡面在談論如何找到最佳係數時，使用的是最小二乘法，在這裡我們先把多元線性迴歸的最小二乘解簡化表達一下這裡可能會有疑問的是X的第一列

線性迴歸——lasso迴歸和嶺迴歸（ridge regression）

目錄線性迴歸 Lasso迴歸和嶺迴歸為什麼 lasso 更容易使部分權重變為 0 而 ridge 不行？ References 線性迴歸很簡單，用線性函式擬合數據，用 mea

從零單排入門機器學習：線性回歸（linear regression）實踐篇

class rom enter instr function ont 線性 gin 向量線性回歸（linear regression）實踐篇之前一段時間在coursera看了Andrew ng的機器學習的課程，感覺還不錯，算是入門了。這次打算以該課程的作業

機器學習：線性判別式分析(LDA)

get generated 分類 learn 參數關註 ble 直線圖片 1.概述線性判別式分析（Linear Discriminant Analysis），簡稱為LDA。也稱為Fisher線性判別（Fisher Linear Disc

機器學習：模型評估和選擇

val 上一個 bootstrap 自助法 break all 誤差 rec 數據集 2.1 經驗誤差與擬合精度（accuracy）和錯誤率（error rate）：精度=1-錯誤率訓練誤差（training error）或經驗誤差（empirical error）泛

機器學習：線性回歸——理論與代碼實現（基於正規方程與梯度下降）

overfit 返回 pen ear 隨機梯度是否很大的建模回歸一線性模型給定由n個屬性描述的列向量\(f(\mathbf{x})={(x^{(1)};x^{(2)};...;x^{(n)})}\)，其中 \(x^{(j)}\)是\(\textbf{x}\)

Stata: 拉索迴歸和嶺迴歸 (Ridge, Lasso) 簡介

作者：王翰洋 (北京大學) Stata 連享會：知乎 | 簡書 | 碼雲 Stata 現場班報名中…… 文章目錄 [Stata 現場班報名中……](https://gitee.c

圖解機器學習：神經網路和 TensorFlow 的文字分類

開發人員經常說，如果你想開始機器學習，你應該首先學習演算法。但是我的經驗則不是。我說你應該首先了解：應用程式如何工作。一旦瞭解了這一點，深入探索演算法的內部工作就會變得更加容易。那麼，你如何開發直覺學習，並實現理解機器學習這個目的？一個很好的方法是建立機器學習模型。假設

機器學習：梯度下降和牛頓法

一、問題描述考慮將基本梯度下降和牛頓法應用到表中的資料上。 (a)用這兩種演算法對二維資料給出和的判別。對梯度下降法取。畫出以迭代次數為準則函式的曲線。 (b)估計這兩種方法的數學運算量。 (c)畫出收斂時間-學習率曲線。求出無法收斂的最小學習率。二、

機器學習：核函式和核矩陣簡介

核函式也就是一種函式，本質上跟其他常見的函式（如冪函式）是一樣的。我們知道，冪函式有它的特點，形如的函式才能稱為冪函式。同樣，核函式也有他的特點，只不過它的特點更復雜一點，滿足以下要求的函式才能稱為核函式（定理）：令為輸入空間，是定義在上的對稱函式，則是核函式當且僅當對於

機器學習：生成模型和判別模型

經典提問：Navie Bayes和Logistic迴歸區別是什麼？ Navie Bayes是生成式模型，Logistic迴歸是判別式模型，二者的區別就是生成式模型與判別式模型的區別。首先，Navie Bayes通過已知樣本求得先驗概率P(Y), 及條件概率P(X|Y),

機器學習：交叉驗證和模型選擇與Python程式碼實現

前言：本篇博文主要介紹交叉驗證（cross validation）和模型選擇，首先介紹相關的基礎概念和原理，然後通過Python程式碼實現交叉驗證和模型評估以及選擇。特別強調，其中大多理論知識來源於《統計學習方法_李航》和斯坦福課程翻譯筆記。 1.分類器的評價評價分類

機器學習：核方法和soft svm

淺談SVM核方法在用svm進行二分類的時候，如果資料在當前維上不是線性可分的，那麼就需要把原始的樣本資料投影到高維的空間上。高維可分之後在大會到現

機器學習--Lasso回歸和嶺回歸

最小二乘改變篩選 bsp 相交二維 block 大於主成分分析之前我們介紹了多元線性回歸的原理, 又通過一個案例對多元線性回歸模型進一步了解, 其中談到自變量之間存在高度相關, 容易產生多重共線性問題, 對於多重共線性問題的解決方法有: 刪除自變量, 改變數據形式

機器學習：探索資料和資料預處理

機器學習之預測房價系列：機器學習實戰第一篇：探索資料和資料預處理探索資料是指研究資料，發現數據的結構。資料集由資料物件構成，一個數據物件代表一個實體，實體由屬性構成，屬性是一個數據欄位，表示資料物件的一個特徵，通常，在資料分析和機器學習中，屬性、維度、特徵和變數這四個術語可以互換。用

機器學習：線性迴歸和嶺迴歸入門程式碼

相關推薦