PLS偏最小二乘迴歸實現

阿新 • • 發佈：2020-09-23

1. PLSRegression引數含義

交叉分解：sklearn.cross_decomposition.PLSRegression

class sklearn.cross_decomposition.PLSRegression(n_components=2, *, scale=True, max_iter=500, tol=1e-06, copy=True)

引數：

n_components：要保留的主成分數，預設為2個。int, (default 2)
scale：boolean, (default True)，是否要將資料進行縮放；
max_iter：an integer, (default 
 500)，NIPALS內迴圈的最大迭代次數（僅當algorithm =“ nipals”時使用）；
tol：non-negative real，Tolerance used in the iterative algorithm default 1e-06.
copy：boolean, default True。Whether the deflation should be done on a copy. Let the default
value to True unless you don’t care about side effect

Attributes：

x_weights_：X block權重向量
y_weights_：Y block權重向量
x_loadings_：array, [p, n_components] X block loadings vectors.
y_loadings_：array, [q, n_components] Y block loadings vectors.
x_scores_：array, [n_samples, n_components] X scores.
y_scores_：array, [n_samples, n_components] Y scores.
x_rotations_：array, [p, n_components] X block to latents rotations.
y_rotations_：array, [q, n_components] Y block to latents rotations.
coef_：array, [p, q] 線性模型中的迴歸係數向量: Y  
= X coef_ + Err

矩陣：

T: x_scores_，從自變數中選擇對因變數解釋力度最高的主成分；
U: y_scores_，通過T得到預測項U，因變數提取出的主成分； 
W: x_weights_，每個提取出的自變數主成分的權重
C: y_weights_，每個提取出的因變數主成分的權重
P: x_loadings_， Q: y_loadings_，Y對應於U的負荷矩陣

2. 案例實現

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
plt.style.use( 
'seaborn')
from sklearn.cross_decomposition import PLSRegression

###
接入大資料hive平臺

from pyhive import hive
conn = hive.Connection(host='172.23.52.11', port=10000, username='cp4d', database='tmp')
cursor = conn.cursor()


###

#匯入資料 datapap = pd.read_excel('/project_data/data_asset/datapap.xlsx') print(datapap.shape) datapap.head(17) #PLS模型 # Read data data =datapap data.columns X = data.drop(['name', 'flag', 'target_y', '時間' ],axis=1).to_numpy()#刪除不需要的自變數，不用於模型中 Y = data['target_y'].to_numpy() # Define the PLS regression object pls = PLSRegression(n_components=4) # Fit data：擬合數據 pls.fit(X, Y) Ypredict = pls.predict(X).flatten() #真實值與預測值的確定係數，越接近於1越好 R2Y = pls.score(X,Y) R2Y def _calculate_vips(model): t = model.x_scores_ w = model.x_weights_ q = model.y_loadings_ p, h = w.shape vips = np.zeros((p,))#np.zeros()表示初始化0向量 s = np.diag(np.matmul(np.matmul(np.matmul(t.T,t),q.T), q)).reshape(h, -1) #np.matmul(a,b)表示兩個矩陣相乘;np.diag()輸出矩陣中對角線上的元素，若矩陣是一維陣列則輸出一個以一維陣列為對角線的矩陣 total_s = np.sum(s) for i in range(p): weight = np.array([ (w[i,j] / np.linalg.norm(w[:,j]))**2 for j in range(h) ]) #np.linarg.norm()表示求範數：矩陣整體元素平方和開根號，不保留矩陣二維特性 vips[i] = np.sqrt(p*(np.matmul(s.T, weight))/total_s) #s.T表示矩陣的轉置 return vips _calculate_vips(pls).shape data.columns[1:] #變數重要性分析，變數對y的影響程度排序，一般認為大於1是有影響的 df_vip = pd.DataFrame() df_vip['X'] = data.drop(['name', 'flag', 'target_y','時間'],axis=1).columns df_vip['vip'] = _calculate_vips(pls) #VIP的視覺化 plt.figure(figsize=(8,8)) vip = df_vip.sort_values(by='vip',ascending= True).tail(30) plt.barh(vip.X,vip.vip,height=0.5) plt.title('VIP') # plt.figure(figsize=(15,8)) length=range(len(Y)) plt.plot(length,Y,marker='o',label='target_y') plt.plot(length,Ypredict,marker='o',label='target_y_predict') plt.legend() # df_vip['coef'] = pls.coef_.flatten() df_vip = df_vip.sort_values(by='vip',ascending=False).round(4).head(15) df_vip pls.coef_.flatten().round(4) x =Y y = Ypredict parameter = np.polyfit(x, y, 1) p = np.poly1d(parameter) plt.xlabel('Variables') plt.ylabel('target_y_predict') plt.scatter(x, y) plt.plot(x, p(x), color='g') plt.title('Actual vs Predict for target_y') # x.corr(y) plt.text(min(x),min(x)+0.1,'R = '+np.corrcoef(x,y)[0,1].round(2).astype(str),fontsize=16) plt.show() x_score = pd.DataFrame(pls.x_scores_,columns=['factor_1','factor_2','factor_3','factor_4']) x_score['name'] =data.name x_score['target_y'] =data['target_y'] # plt.scatter(x_score.factor_1,x_score.factor_2) sns.scatterplot('factor_1','factor_2',data=x_score[x_score['target_y']<4.05]) sns.scatterplot('factor_1','factor_2',data=x_score[x_score['target_y']>4.05])

PLS偏最小二乘迴歸實現

1. PLSRegression引數含義交叉分解：sklearn.cross_decomposition.PLSRegression class sklearn.cross_decomposition.PLSRegression(n_components=2, *, scale=True, max_iter=500, tol=1e-06, copy=True)

主成分迴歸（PCR）和最小二乘迴歸（PLS）

主成分迴歸（principal components regression, PCR） #使用 p1s 庫中的 pcr ()渴數實現主成分迴歸 (PCR)

最小二乘支援向量機分類器（LSSVM）及Python實現

技術標籤：機器學習python最小二乘支援向量機支援向量機LSSVM 最小二乘支援向量機分類器

MATLAB 非線性最小二乘擬合 lsqnonline 和 lsqcurvefit

MATLAB 中進行非線性最小二乘擬合的函式為：lsqnonline 函式和 lsqcurvefit 函式。幫助文件中的解釋為：

MATLAB 最小二乘多項式擬合

最近在分析一些資料，就是資料擬合的一些事情，用到了matlab的polyfit函式，效果不錯。

Scipy中最小二乘函式leastsq()

概述最小二乘法在某種程度上無異於機器學習中基礎中的基礎，且具有相當重要的地位。

線性最小二乘法及最小二乘優化

①前置知識：曲線擬合問題：已知一組二維資料，尋求一個函式（曲線）\\(y=f(x)\\)使\\(f(x)\\)在某種準則下與所有資料點最為接近，即曲線擬合得最好。

最小二乘直線擬合

最小二乘法（英文：least square method)是一種常用的數學優化方法，所謂二乘就是平方的意思。這平方一詞指的是在擬合一個函式的時候，通過最小化誤差的平方來確定最佳的匹配函式，所以最小二乘、最小平方指的就是擬

線性迴歸：最小二乘法實現

目錄一、線性迴歸二、最小二乘法三、最小二乘法（向量表示）四、Python實現

java實現線性迴歸最小二乘法

演算法：最小二乘法，公式如下：實現程式碼： package com.; import org.apache.commons.math3.stat.descriptive.moment.Mean;

最小二乘法及其python實現詳解

最小二乘法Least Square Method，做為分類迴歸演算法的基礎，有著悠久的歷史（由馬裡·勒讓德於1806年提出）。它通過最小化誤差的平方和尋找資料的最佳函式匹配。利用最小二乘法可以簡便地求得未知的資料，並使得這些

C++通過Eigen庫實現最小二乘法的三種方法

C++通過Eigen庫實現最小二乘法的三種方法 1、最小二乘法的數學原理 2、矩陣偽逆的C++實現

C#實現最小二乘法

技術標籤：編碼日記c#技術根據http://zh.wikipedia.org/wiki/%E6%9C%80%E5%B0%8F%E4%BA%8C%E4%B9%98%E6%B3%95裡面的說法：

Halcon、OpenCV、C++ 實現最小二乘法擬合直線

最小二乘法擬合直線概念：最小二乘法多項式直線擬合，根據給定的點，求出它的函式y=f(x)，當然求得準確的函式是不太可能的，但是我們能求出它的近似曲線y=φ(x)

MLS:基於移動最小二乘法的影象變形(python實現)

簡要原理： https://blog.csdn.net/hjimce/article/details/46550001 https://www.cnblogs.com/shushen/p/5887513.html

最小二乘法——線性迴歸

技術標籤：演算法線性代數演算法c++ 最小二乘法——線性迴歸一、模型二、推理步驟

111. 二叉樹的最小深度（java實現）--LeetCode

技術標籤：樹算髮題遞迴算髮題演算法題演算法二叉樹資料結構leetcodejava 文章目錄

最小二乘法多項式曲線擬合原理與實現

最小二乘法多項式曲線擬合原理與實現概念最小二乘法多項式曲線擬合，根據給定的m個點,並不要求這條曲線精確地經過這些點，而是曲線y=f(x)的近似曲線y= φ(x)。

拓端tecdat|R語言計量經濟學：工具變數法(兩階段最小二乘法2SLS)線性模型分析人均食品消費時間序列資料和迴歸診斷

原文連結：http://tecdat.cn/?p=23759 原文出處：拓端資料部落公眾號簡介兩階段最小二乘法（2SLS）迴歸擬合的線性模型是一種常用的工具變數估計方法。

【短道速滑八】圓形半徑的影象最大值和最小值演算法的實現及其實時優化（非二值圖）

在影象處理中，我們可以看到很多函式都是帶有半徑這個引數的，不過99%的情況下這個半徑其實都是矩形的意思，實際的需求中，還有很多場合下需要圓形的最值演算法，我們目前知道的有幾個演算法，比如在Photoshop中，

PLS偏最小二乘迴歸實現

1. PLSRegression引數含義

2. 案例實現

相關推薦