Python實現ridge和lasso

阿新 • • 發佈：2019-01-26

# -*- coding: utf-8 -*-
"""
Created on Mon Nov 12 17:07:16 2018

@author: wp:lasso|ridge 
"""
#經典鳶尾花資料集
from sklearn.datasets import load_iris

iris = load_iris()

data_x = iris.data 
data_y = iris.target


#帶入需要的包、庫
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cross_validation import train_test_split
from sklearn.linear_model import Ridge,RidgeCV
from sklearn.linear_model import Lasso,LassoCV
from sklearn.metrics import mean_squared_error

x_tr,x_te,y_tr,y_te = train_test_split(data_x,data_y,train_size = 0.7,random_state =22)
######################ridge########################################
#通過不同的alpha值 生成不同的ridge模型
alphas = 10**np.linspace(-10,10,100)
ridge_cofficients = []

for alpha in alphas:
    ridge = Ridge(alpha = alpha, normalize=True)
    ridge.fit(x_tr, y_tr)
    ridge_cofficients.append(ridge.coef_)
    
 #畫出alpha和迴歸係數的關係   
plt.rcParams['font.sans-serif'] = ['Microsoft YaHei']
plt.rcParams['axes.unicode_minus'] = False
# 設定繪圖風格
plt.style.use('ggplot')
plt.plot(alphas, ridge_cofficients)
plt.xscale('log')
plt.axis('tight')
plt.title(r'alpha係數與嶺迴歸係數的關係')
plt.xlabel('Log Alpha')
plt.ylabel('Cofficients')
plt.show()

#ridge交叉驗證
ridge_cv = RidgeCV(alphas = alphas, normalize=True, scoring='mean_squared_error', cv = 10)
ridge_cv.fit(x_tr, y_tr)
# 取出最佳的lambda值ridge_best_alpha = ridge_cv.alpha_
ridge_best_alpha = ridge_cv.alpha_ #得到最佳lambda值
#基於最佳lambda值建模
ridge = Ridge(alpha = ridge_best_alpha,normalize = True)
ridge.fit(x_tr,y_tr)
ridge_predict = ridge.predict(x_te)
rmse = np.sqrt(mean_squared_error(y_te,ridge_predict))

######################lasso##################################



# LASSO迴歸模型的交叉驗證
lasso_cv = LassoCV(alphas = alphas, normalize=True, cv = 10, max_iter=10000)
lasso_cv.fit(x_tr,y_tr)
# 取出最佳的lambda值
lasso_best_alpha = lasso_cv.alpha_
lasso_best_alpha
#基於最佳lambda值建模
lasso = Lasso(alpha = lasso_best_alpha, normalize=True, max_iter=10000)
lasso.fit(x_tr, y_tr)

lasso_predict = lasso.predict(x_te) #預測

RMSE = np.sqrt(mean_squared_error(y_te,lasso_predict))

Python實現ridge和lasso

# -*- coding: utf-8 -*- """ Created on Mon Nov 12 17:07:16 2018 @author: wp:lasso|ridge """ #經典鳶尾花資料集 from sklearn.datasets import load_

Ridge和lasso迴歸實現的一個小案例

來自於鄒博機器學習第七期第九課中的內容：簡單介紹就是一個產品的銷量sales與TV、radio、newspaper三個投入量之間的關係。直接上程式碼： import numpy as np imp

python實現棧和隊列

隊列 tac class sta python實現 body ret none != class Node:#節點類 next = None#節點指針指向下一個 def __init__(self,data): self.data=data----

python實現城市和省份字典（根據城市判斷屬於哪個省份）

lam ret pandas csv style .data 一份輸出以及首先，在網上拿到一份數據，省份和城市的對應表：第一張圖是省份以及對應的ID 第二張圖是省份和城市，以及分別對應的ID 基本的思路是：實現一個字典，省份作為鍵，省份包含的城市作為

用Python實現stack和queue

棧的實現 class Stack(object): """棧""" def __init__(self): self.__list = [] def push(self, item): """新增一個新的元素item到棧頂"""

Python實現Windows和Linux之間互相傳輸檔案(資料夾)的方法

　　專案中需要從Windows系統傳輸ISO檔案到Linux測試系統，然後再Linux測試系統裡安裝這個ISO檔案。所以就需要實現如何把檔案從Windows系統傳輸到Linux系統中。在專案中使用了pscp.exe這個工具，只要按照pscp.exe的使用說明操作即可。只要進入pscp.exe的安裝位置

python實現lower_bound和upper_bound

由於對於二分法一直都不是很熟悉，這裡就用C++中的lower_bound和upper_bound練練手。這裡用python實現 lower_bound和upper_bound本質上用的就是二分法，lower_bound查詢有序陣列的第一個小於等於目標數的，upper_bound查詢有序陣列第一個大於等於目標

python列表練習-用python實現棧和佇列

1.棧的工作原理：先進後出入棧出棧棧頂元素棧的長度棧是否為空 stack = [] info = """ 棧操作 1.入棧 2.出棧 3.棧頂元素 4.棧的長度 5.棧是否為空 """ while True:

機器學習 of python(嶺迴歸和Lasso迴歸)

注：正則化是用來防止過擬合的方法。在最開始學習機器學習的課程時，只是覺得這個方法就像某種魔法一樣非常神奇的改變了模型的引數。但是一直也無法對其基本原理有一個透徹、直觀的理解。直到最近再次接觸到這個概念，經過一番苦思冥想後終於有了我自己的理解。 0. 正則化（Regu

Python實現RGB和Lab顏色空間互轉

在網上找了一圈，只找到C++版本的，有個python版本的只有RGB轉Lab，只好自己寫了。C++版本傳送門，這裡把原理已經寫的很清楚了，我只是比葫蘆畫瓢的寫個python版本，沒做任何優化。只有一點需要小心，opencv讀取的影象格式是[b,g,r]，剩下的就

python實現插入和氣泡排序

開始學習python，看到函式一章，練習之餘，寫了兩個排序小函式 def select_sort(n): for i in range(len(n)): for j in

Python 實現 BFS 和 DFS

# BFS graph = { "A" : ["B", "C"], "B" : ["A", "C", "D"], "C" : ["A", "B", "D", "E"], "D" : ["B", "C", "E", "F"],

python實現堆疊和佇列

1.python實現堆疊，可先將Stack類寫入檔案stack.py，在其它程式檔案中使用from stack import Stack，然後就可以使用堆疊了。stack.py的程式如下： class Stack(): def __init__(self,size):

python實現select和epoll模型socket網路程式設計

select目前幾乎在所有的平臺上支援，其良好跨平臺支援也是它的一個優點，事實上從現在看來，這也是它所剩不多的優點之一，現在其實更多的人用epoll，在 python下epoll文件有點少，就先講究搞搞select ～ select的一個缺點在於單個程序能夠監視

Python實現im2col和col2im函式

今天來說說im2col和col2im函式，這是MATLAB中兩個內建函式，經常用於數字影象處理中。其中im2col函式在《MATLAB中的im2col函式》一文中已經進行了簡單的介紹。一般來說：如是將影象分割成塊的時候用的im2col引數為'distinct'，那麼用col2im函式時引數也是'dist

python實現棧和佇列

利用python列表的操作，利用選單的形式實現棧和佇列棧： stack=[] def push(): stack.append(input('enter: ').strip()) def

python實現陣列和連結串列的歸併排序

歸併排序是一種穩定的排序，採用分而治之策略，可以用於順序儲存結構，也易於在連結串列上實現。其原理如下圖：演算法時間複雜度為 O（nlogn），空間複雜度為 O（n）。1 在陣列上實現d

python實現冒泡和快排演算法

#!/usr/bin/python # -*- coding:utf-8 -*- def bubble_sort(seq): # 氣泡排序 count = len(seq) for i in range(0, count): for

Logistic回歸模型和Python實現

logistic rip ast 步長 glm 常見 gist nes sel 回歸分析是研究變量之間定量關系的一種統計學方法，具有廣泛的應用。 Logistic回歸模型線性回歸先從線性回歸模型開始，線性回歸是最基本的回歸模型，它使用線性函數描述兩個變量之間的關系，將連

數據庫並行讀取和寫入(Python實現)

ews for rom join() rgs one val connect ssi max_process = 16 #最大進程數 def read_SQL_write(r_host,r_port,r_user,r_passwd,r_db,r_charset,w_host

Python實現ridge和lasso

相關推薦