常用的幾種機器學習演算法迴歸模型python程式碼實現

阿新 • • 發佈：2019-01-01

由於在論文實驗過程中一直使用的是python語言完成的論文實驗，所以在論文需要使用機器學習方法時就考慮使用了scikit-learn。

scikit-learn是一款很好的Python機器學習庫，它包含以下的特點：

（1）簡單高效的資料探勘和資料分析工具；

（2）可供大家使用，可在各種環境中重複使用；

（3）建立在NumPy， SciPy和matplotlib上；

（4）開放原始碼，可商業使用；

在本文中將把我在論文實驗過程中使用幾種機器學習方法原始碼貼出來方便呼叫，但每種機器學習方法的原理就不贅述了，可以參考官方給出的文件。這幾種方法使用的測試資料均為如下所示：

一、貝葉斯嶺迴歸

import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
from sklearn.cross_validation import train_test_split
from sklearn import metrics
from sklearn import preprocessing


from sklearn.naive_bayes import GaussianNB
from sklearn import linear_model


from sklearn import metrics


def Bayes(path):
data = pd.read_excel(path)
data.dropna(inplace=True)
array=data.values
X=array[:,1:len(data.columns)-1]
y=array[:,len(data.columns)-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=0)


reg=linear_model.BayesianRidge()
reg_=reg.fit(X_train, y_train)
y_pred = reg.predict(X_test)
return (X_test,y_pred)
x,y=Bayes("./test.xls")
print (x,y)

執行程式碼，可以看到結果如下所示：

二、Logistic迴歸

import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
from sklearn.cross_validation import train_test_split
from sklearn import metrics
from sklearn import preprocessing


from sklearn.linear_model import LogisticRegression
from sklearn.svm import l1_min_c


from sklearn import metrics

def Logist(path):
data = pd.read_excel(path)
data.dropna(inplace=True)
array=data.values
X=array[:,1:len(data.columns)-1]
y=array[:,len(data.columns)-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=0)


cls = LogisticRegression(C=1.0,tol=1e-6)
rbf=cls.fit(X_train, y_train)
y_pred = cls.predict(X_test)


return (X_test,y_pred)

x,y=Logist("./test.xls")
print(x,y)

執行程式碼，可以看到結果如下所示：

三、多層感知器

import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
from sklearn.cross_validation import train_test_split
from sklearn import metrics
from sklearn import preprocessing


from sklearn.linear_model import Perceptron


from sklearn import metrics


def Percep(path):
data = pd.read_excel(path)
data.dropna(inplace=True)
array=data.values
X=array[:,1:len(data.columns)-1]
y=array[:,len(data.columns)-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=0)


per=Perceptron()
rbf=per.fit(X_train, y_train)
y_pred = per.predict(X_test)


return (X_test,y_pred)


#X=preprocessing.scale(X)
#y=preprocessing.scale(y)

x,y=Percep("./test.xls")
print(x,y)

執行程式碼，可以看到結果如下所示：

四、支援向量機迴歸

import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
from sklearn.cross_validation import train_test_split
from sklearn import svm
from sklearn import metrics
from sklearn import preprocessing

def SVM(path):
data = pd.read_excel(path)
data.dropna(inplace=True)
array=data.values
X=array[:,1:len(data.columns)-1]
y=array[:,len(data.columns)-1]
#X=preprocessing.scale(X)
#y=preprocessing.scale(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=0)

rbf_svc = svm.SVR(kernel='rbf')   #此處使用的是徑向基核心
rbf_svc.tol=1
rbf=rbf_svc.fit(X_train, y_train)
y_pred = rbf_svc.predict(X_test)

return (X_test,y_pred)

x,y=SVM("./test.xls")
print(x,y)

執行程式碼，可以看到結果如下所示：

五、決策樹迴歸

import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
from sklearn.cross_validation import train_test_split
from sklearn import metrics
from sklearn import preprocessing


from sklearn import tree


def Tree(path):
data = pd.read_excel(path)
data.dropna(inplace=True)
array=data.values
X=array[:,1:len(data.columns)-1]
y=array[:,len(data.columns)-1]
#X=preprocessing.scale(X)
#y=preprocessing.scale(y)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=0)


clf = tree.DecisionTreeRegressor()
rbf=clf.fit(X_train, y_train)
y_pred = rbf.predict(X_test)


return (X_test,y_pred)



x,y=Tree("./test.xls")
print(x,y)

執行程式碼，可以看到結果如下所示：

六、最近鄰迴歸

import numpy as np
import pandas as pd
from sklearn import datasets, linear_model
from sklearn.cross_validation import train_test_split
from sklearn import metrics
from sklearn import preprocessing


from sklearn import neighbors


from sklearn import metrics
from sklearn.model_selection import cross_val_predict


def KNN(path):
data = pd.read_excel(path)
data.dropna(inplace=True)
array=data.values
X=array[:,1:len(data.columns)-1]
y=array[:,len(data.columns)-1]
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1, random_state=0)


knn = neighbors.KNeighborsRegressor(1, weights="uniform")  //修改第一個引數的值可以變為KNN_N近鄰
knn=knn.fit(X_train, y_train)
y_pred = knn.predict(X_test)


return(X_test,y_pred)

x,y=KNN("./test.xls")
print(x,y)

執行程式碼，可以看到結果如下所示：

常用的幾種機器學習演算法迴歸模型python程式碼實現

由於在論文實驗過程中一直使用的是python語言完成的論文實驗，所以在論文需要使用機器學習方法時就考慮使用了scikit-learn。 scikit-learn是一款很好的Python機器學習庫，它包含以下的特點：（1）簡單高效的資

10種機器學習演算法（附Python程式碼）

sklearn python API from sklearn.linear_model import LinearRegression # 線性迴歸 # module = LinearRegression() module.fit(x

【機器學習】感知機Python程式碼實現

回顧感知機前面我們介紹了感知機，它是一個二分類的線性分類器，輸入為特徵向量，輸出為例項的類別。感知機演算法利用隨機梯度下降法對基於誤分類的損失函式進行最優化求解，得到感知機模型，即求解w,bw,b。感知機演算法簡單易於實現，那麼我們如何通過python程

幾種機器學習平臺的對比和選擇

存儲檢查基於大型容易和平計算機 caff 手寫識別前言選擇什麽樣的深度學習框架一直是開發者非常關心的一個話題，而且深度學習框架之間的「戰爭」也越來越激烈。隨著近幾年AI的火熱，越來越多的出現有關各個機器學習框架的對比文章，且隨著 Pytho

10 種機器學習演算法的要點（附 Python 和 R 程式碼）

1. 監督式學習監督式學習演算法包括一個目標變數（因變數）和用來預測目標變數的預測變數（自變數）。通過這些變數我們可以搭建一個模型，從而對於一個已知的預測變數值，我們可以得到對應的目標變數值。重複訓練這個模型，直到它能在訓練資料集上達到預定的準確度。屬於監

機器學習演算法--線性模型

1.基本形式線性模型：給定一組樣本X=(x1,x2...xd)，其中xi是X在第i個屬性上的取值，通過屬性線性組合來預測函式其中W=(w1,w2...wd)分別為各個屬性xi的權重。 1.1線性迴歸：資料集D={(x1,y1),(x2,y2)...(xm,y

我應該使用哪種機器學習演算法？

我應該使用哪種機器學習演算法？該資源主要面向初學者到中級資料科學家或分析師，他們有興趣識別和應用機器學習演算法來解決他們感興趣的問題。當面對各種各樣的機器學習演算法時，初學者提出的一個典型問題是“我應該使用哪種演算法？” 問題的答案因許多因素而異，包括：

[學習筆記]機器學習——演算法及模型（五）：貝葉斯演算法

傳統演算法（五）貝葉斯演算法一、貝葉斯定理簡介貝葉斯定理是18世紀英國數學家托馬斯·貝葉斯（Thomas Bayes）提出得重要概率論理論；貝葉斯方法源於他生前為解決一個“逆概”問題寫的一篇文章

小姐姐帶你一起學：如何用Python實現7種機器學習演算法（附程式碼）

編譯 | 林椿眄出品 | AI科技大本營（公眾號ID：rgznai100）【AI科技大本營導讀】

機器學習的迴歸模型的一些度量方法

https://scikit-learn.org/stable/modules/classes.html#sklearn-metrics-metrics Regression metrics See the Regression metrics section of the user gui

基於TensorFlow的機器學習(2) -- 迴歸模型

兩種典型的迴歸模型是linear regression 和 logistic regression。以下將分別對兩種迴歸模型進行分析以及基於tensorflow的實現。 Linear Regression(線性迴歸) 線性迴歸基本概念之前基於吳恩達的《

每個人都應該知道的3種機器學習演算法

譯者注：決策樹 & 聚類演算法 & 線性迴歸：應該使用哪種機器學習演算法？使用它的原因是什麼?作者在本文中詳細介紹了這些內容。以下為譯文。假設有一些跟資料相關的難題需要你去解決。之前你已經聽過機器學習演算法的厲害之處了，因此你自己也想借此機會嘗試

機器學習邏輯迴歸模型總結——從原理到sklearn實踐

0x00 基本原理邏輯迴歸演算法，從名字上看似乎是個迴歸問題，但實際上邏輯迴歸是個典型的分類演算法。對於分類問題，一般都是一些離散變數，且y的取值如下： y∈{0,1,2,3,...,n}，顯然不能使用線性迴歸擬合。以二元分類問題開始討論，y的取值

幾種機器學習常見的距離

歐氏距離：最為常見，可以理解為歐式空間裡兩點的直線距離。兩個點 A = (a[1]，a[2]，…，a[n]) 和 B = (b[1]，b[2]，…，b[n]) 之間的距離 ρ(A，B) 定義為下面的公式： ρ(A，B) =√ [ ∑( a[i] - b[i] )^2 ]

機器學習：線性迴歸與Python程式碼實現

前言：本篇博文主要介紹線性迴歸模型（linear regression），首先介紹相關的基礎概念和原理，然後通過Python程式碼實現線性迴歸模型。特別強調，其中大多理論知識來源於《統計學習方法_李航》和斯坦福課程翻譯筆記以及Coursera機器學習課程。 1.線性迴歸

機器學習|線性迴歸三大評價指標實現『MAE, MSE, MAPE』（Python語言描述）

對於迴歸預測結果，通常會有平均絕對誤差、平均絕對百分比誤差、均方誤差等多個指標進行評價。這裡，我們先介紹最常用的3個：平均絕對誤差（MAE）就是絕對誤差的平均值，它的計算公式如下： M

機器學習：邏輯迴歸與Python程式碼實現

前言：本篇博文主要介紹邏輯迴歸（logistic regression），首先介紹相關的基礎概念和原理，然後通過Python程式碼實現邏輯迴歸的二分類問題。特別強調，其中大多理論知識來源於《統計學習方法_李航》和斯坦福課程翻譯筆記以及Coursera機器學習課程。本篇博

【機器學習】：Kmeans均值聚類演算法原理(附帶Python程式碼實現)

這個演算法中文名為k均值聚類演算法，首先我們在二維的特殊條件下討論其實現的過程，方便大家理解。第一步.隨機生成質心由於這是一個無監督學習的演算法，因此我們首先在一個二維的座標軸下隨機給定一堆點，並隨即給定兩個質心，我們這個演算法的目的就是將這一堆點根據它們自身的座標特徵分為兩類，因此選取了兩個質心，什麼時

機器學習--線性迴歸--梯度下降的實現

## 機器學習--線性單元迴歸--單變數梯度下降的實現 ### 【線性迴歸】 ```text 如果要用一句話來解釋線性迴歸是什麼的話，那麼我的理解是這樣子的： **線性迴歸，是從大量的資料中找出最優的線性（y=ax+b）擬合函式,通過資料確定函式中的未知引數，進而進行後續操作（預測） **迴歸的概念是從統

機器學習-*-DBSCAN聚類及程式碼實現

DBSCAN DBSCAN(Density-Based Spatial Clustering of Applications with Noise，具有噪聲的基於密度的聚類方法) 原理首先描述以下幾個概念，假設我們有資料集

常用的幾種機器學習演算法迴歸模型python程式碼實現

相關推薦