基於sciket-learn實現多項式迴歸

阿新 • • 發佈：2018-11-22

多項式迴歸在思想上和線性迴歸是一致的，都使用一條線去擬合樣本值，進入用得出的模型去進行預測，在樣本特徵呈現出線性特性時，我們可以用線性迴歸去做預測，但是在樣本特徵很複雜的時候，線性迴歸往往會呈現出欠擬合的狀態，這時就需要多項式迴歸。

先來看一個小例子，給定一條二次曲線y=2x^2 + 2x，生成帶噪聲的100個樣本點，繪製出影象，是我們熟悉的二次方程。

x = np.random.uniform(-3, 3, size = 100)
X = x.reshape(-1, 1)

y = 2 * x**2 + x + 2 + np.random.normal(0, 1, size = 100)

plt.scatter(x, y)
plt.show()

然後我們用線性迴歸來擬合這條曲線，看看會出現什麼情況

from sklearn.linear_model import LinearRegression

lin_reg = LinearRegression()
lin_reg.fit(X, y)

y_predict = lin_reg.predict(X)

plt.scatter(x, y)
plt.plot(x, y_predict, color='r')
plt.show()

很明顯我們的預測函式沒有很好的擬合這些樣本點，當遇到這種情況時，我們不妨在增加一個特徵

X2 = np.hstack([X, X**2])

然後同樣呼叫sciket-learn為我們封裝好線性迴歸構造器，接著繪製出影象

lin_reg2 = LinearRegression()
lin_reg2.fit(X2, y)
y_predict2 = lin_reg2.predict(X2)

plt.scatter(x, y)
plt.plot(np.sort(x), y_predict2[np.argsort(x)], color='r')
plt.show()

這時，便可以看到，擬合程度已經比較好了。

sciket-learn中為我們提供了PolynomialFeatures來確定特徵的維度。

from sklearn.preprocessing import PolynomialFeatures

poly = PolynomialFeatures(degree=2)
poly.fit(X)
X3 = poly.transform(X)

lin_reg3 = LinearRegression()
lin_reg3.fit(X3, y)
y_predict3 = lin_reg3.predict(X3)

plt.scatter(x, y)
plt.plot(np.sort(x), y_predict3[np.argsort(x)], color='r')
plt.show()

可以看出得到的影象和上面的影象是一致的，這裡有興趣的朋友可以改變degree引數的值，看看會發生什麼樣的變化。

完整程式碼

import numpy as np
import matplotlib.pyplot as plt

x = np.random.uniform(-3, 3, size = 100)
X = x.reshape(-1, 1)
y = 2 * x**2 + x + 2 + np.random.normal(0, 1, size = 100)

plt.scatter(x, y)
plt.show()

from sklearn.linear_model import LinearRegression

lin_reg = LinearRegression()
lin_reg.fit(X, y)

y_predict = lin_reg.predict(X)

plt.scatter(x, y)
plt.plot(x, y_predict, color='r')
plt.show()

# 解決方案 新增一個特徵
(X**2).shape
X2 = np.hstack([X, X**2])
X2.shape

plt.scatter(x, y)
plt.plot(np.sort(x), y_predict2[np.argsort(x)], color='r')
plt.show()

lin_reg2.coef_
lin_reg2.intercept_

from sklearn.preprocessing import PolynomialFeatures

poly = PolynomialFeatures(degree=2)
poly.fit(X)
X3 = poly.transform(X)

lin_reg3 = LinearRegression()
lin_reg3.fit(X3, y)
y_predict3 = lin_reg3.predict(X3)

plt.scatter(x, y)
plt.plot(np.sort(x), y_predict3[np.argsort(x)], color='r')
plt.show()

基於sciket-learn實現多項式迴歸

多項式迴歸在思想上和線性迴歸是一致的，都使用一條線去擬合樣本值，進入用得出的模型去進行預測，在樣本特徵呈現出線性特性時，我們可以用線性迴歸去做預測，但是在樣本特徵很複雜的時候，線性迴歸往往會呈現出欠擬合的狀態，這時就需要多項式迴歸。先來看一個小例子，給定一條二次曲線y=2x^2 + 2x，生成

基於sciket-learn實現線性迴歸演算法

線性迴歸演算法主要用來解決迴歸問題，是許多強大的非線性模型的基礎，無論是簡單線性迴歸，還是多元線性迴歸，思想都是一樣的，假設我們找到了最佳擬合方程（對於簡單線性迴歸，多元線性迴歸對應多個特徵作為一組向量）y=ax+b，則對於每一個樣本點xi，根據我們的直線方程，預測值為y^i = axi + b,真

基於sciket-learn實現邏輯迴歸

邏輯迴歸雖然名稱裡有迴歸兩個字，但是邏輯迴歸主要用來解決分類問題，並且只能解決二分類問題。（當然邏輯迴歸也可以解決迴歸問題；同時邏輯迴歸可以通過OvO、OvR等方法實現多分類，但本質還是二分類。）邏輯迴歸與線性迴歸不同的是，線性迴歸得出的是一個具體的預測值，預測房價的模型得出的就是房價，預測成

基於sciket-learn實現SVM與核函式

支撐向量機（SVM）既可以用來解決分類問題，也可以解決迴歸問題，較多應用於解決分類問題，SVM嘗試尋找一個最優的角色邊界，距離兩個類別最近的樣本最遠，擁有較好的泛化能力。下面從程式碼的角度一步步的來理解SVM 先引入常用類庫，匯入鳶尾花資料集，取兩個特徵 import numpy as

【甘道夫】基於scikit-learn實現邏輯迴歸LogisticRegression

>>> print iris {'target_names': array(['setosa', 'versicolor', 'virginica'], dtype='|S10'), 'data': array([[ 5.1, 3.5, 1.4, 0.2],

基於scikit-learn實現k近鄰演算法（kNN）與超引數的除錯

前一篇關於kNN的部落格介紹了演算法的底層實現，這片部落格讓我們一起看一看基於scikit-learn如何快速的實現kNN演算法。 scikit-learn內建了很多資料集，就不用我們自己編造假資料了，下面我們分別選用鳶尾花和手寫數字識別的資料集。首先匯入需要的庫 from sklea

用Skiti-learn和pandas實現嶺迴歸

Ridge迴歸的損失函式： J(θ)=1/2 (Xθ-Y)T (Xθ-Y) +1/2 α||θ||²2 對於演算法的實現，一般先確定模型，然後根據模型確定目標函式。而機器學習的實現基礎是資料，對資料的處理分析必不可少，演算法實現後還需對模型評估對比。設定線性迴歸模型如下： PE=θ0+θ1

scikit-learn : 線性迴歸，多元迴歸，多項式迴歸

匹薩的直徑與價格的資料 %matplotlib inline import matplotlib.pyplot as plt def runplt(): plt.figure() plt.title(u'diameter-cost

【MachineLearning】之邏輯迴歸（scikit-learn 實現）

邏輯迴歸的類及預設引數： LogisticRegression(penalty='l2', dual=False, tol=0.0001, C=1.0, fit_intercept=True, in

基於梯度下降法實現線性迴歸演算法

# coding: utf-8 # In[1]: # 資料校驗 def validate(X, Y): if len(X) != len(Y): raise Exception("引數異常") else: m = len(

多項式迴歸的matlab實現

一次函式的線性迴歸首先我們回顧一下當迴歸函式為一次函式的情況存在訓練樣本矩陣 X ，該矩陣大小為m*n ，其中m為樣本數量，n為特徵數量此時迴歸方程為

XGBoost演算法解析和基於Scikit-learn的GBM演算法實現

1. 概要Gradient Tree Boosting (別名 GBM, GBRT, GBDT, MART)是一類很常用的整合學習演算法，在KDD Cup, Kaggle組織的很多資料探勘競賽中多次表現出在分類和迴歸任務上面最好的performance。同時在

pytorch 深度學習入門程式碼（二）多項式迴歸程式碼實現

"""多項式迴歸程式碼實現""" import torch from torch.autograd import Variable import torch.nn as nn import torch.optim as optim import matplot

Web驗證碼圖片的生成-基於Java的實現

submit esc page resp ioe 代碼 oge cnblogs pro 驗證碼圖片是由程序動態產生的，每次訪問的內容都是隨機的。那麽如何采用程序動態產生圖片，並能夠顯示在客戶端頁面中呢？原理很簡單，對於java而言，我們首先開發一個Servlet，這個Se

基於Cocos2dx + box2d 實現的憤慨的小鳥Demo

space 程序 box nbsp 源碼 source span cocos2 lan 1. Demo初始界面 2. 遊戲界面 3. 精確碰撞檢測 4. 下載壓縮文件文件夾 AngryBird source 憤慨的小鳥Demo源碼，基於C

ionic2 基於ngx-translate實現多語言切換，翻譯

click create -a fault template con 設置切換使用介紹 ngx-translate 是Angular 2+的國際化（i18n）庫，在github的地址是箭頭 https://github.com/ngx-translate/core 將

基於SpringBoot + Mybatis實現 MVC 項目

myba ces find json格式 see framework pro select .info 1.預覽：（1）完整項目結構（2）創建數據庫、數據表：【user.sql】 SET FOREIGN_KEY_CHECKS=0;

基於geohash6編碼實現相鄰4、9、16網格合並

ceiling 分別是代碼 char class ogr city 接下來偏移前面的兩篇文章介紹了geohash的基本原理及c#代碼相關實現，其中geohash 5位編碼單個網格覆蓋面積大約在24平方千米，6位編碼單網格覆蓋面大約在0.73平方千米，相鄰編碼

基於commons-net實現ftp創建文件夾、上傳、下載功能

package use style pen 本地 try cal load 登陸原文：http://www.open-open.com/code/view/1420774470187 package com.demo.ftp; import

基於zookeeper簡單實現分布式鎖

lean bool 思想 common factor exists play nec try 這裏利用zookeeper的EPHEMERAL_SEQUENTIAL類型節點及watcher機制。來簡單實現分布式鎖。主要思想： 1、開啟10個線程。在disLocks節點下

基於sciket-learn實現多項式迴歸

相關推薦