1. 程式人生 > >偏最小二乘迴歸分析例項plsregress命令

偏最小二乘迴歸分析例項plsregress命令

偏最小二乘迴歸分析例項

plsregress命令

  • 步驟
    • 資料標準化
    • 求相關係數矩陣
    • 分別提出自變數組合因變數組的成分
    • 求兩個成分對標準化指標變數和成分變數之間的迴歸方程
    • 求因變數組與自變數組之間的迴歸方程
    • 模型的解釋與檢驗
  • 例項程式碼

    • ab0 = load('data.txt');
      %均值和方差
      mu = mean(ab0);
      sig = std(ab0);
      %標準化以後的自變數和因變數資料
      a = ab(:,[1:end-1]);
      b = ab(:,end);
      [XL YL XS YS BETA PCTVAR MSE status] = plsregress(a,b);
      %求自變數的主成分系數
      xw = a\XS
      ; %求因變數的主成分系數 yw = b\YS; ncomp = input('請根據PCTVAR的值確定提出成分對的個數'); [XL2 YL2 XS2 YS2 BETA2 PCTVAR2 MSE2 status2] = plsregress(a,b,ncomp); %自變數的個數 n = size(a,2); %原始資料迴歸方程的常數項 beta3(1) = mu(end) - mu(1:n)./sig(1:n)*BETA2([2:end]).*sig(end); beta3([2:n+1]) = (1./sig(1:n))'*sig(n+1:end).*BETA2([2:end]); %直方圖 bar(BETA2'
      ,'k'); %y的預測值 yhat = repmat(beta3(1),[size(a,1),1]) + ab0(:,[1:n])*beta3([2:end])'; %預測值的最大值 ymax = max([yhat;ab0(:,end)]);

相關推薦

迴歸分析例項plsregress命令

偏最小二乘迴歸分析例項 plsregress命令 步驟 資料標準化 求相關係數矩陣 分別提出自變數組合因變數組的成分 求兩個成分對標準化指標變數和成分變數之間的迴歸方程 求因變數組與自變

資料科學個人筆記:迴歸+主成分分析+典型相關分析

偏最小二乘迴歸是PCA、CCA和傳統最小二乘模型的結合。 一、PCA主成分分析: 1.我們希望對資料進行有失真壓縮,即將屬於R^n的x投影為屬於R^l的c,有編碼函式f(x)=c,使得損失的資訊儘量少。同時有對應的解碼函式g(c)約等於x。 2.PCA由我們確定的解碼函

迴歸(PLSR)演算法原理

1、問題的提出   在跨媒體檢索領域中,CCA(Canonical correlation analysis,典型關聯分析)是應用最為廣泛的演算法之一。CCA可以把兩種媒體的原始特徵空間對映對映到相關的兩個特徵子空間中,從而實現兩個屬於不同媒體的樣本之間的相似

迴歸(PLSR)- 2 標準演算法(NIPALS)

http://www.cnblogs.com/pegasus/p/3396085.html 1 NIPALS 演算法 Step1:對原始資料X和Y進行中心化,得到X0和Y0。從Y0中選擇一列作為u1,一般選擇方差最大的那一列。 注:這是為了後面計算方便,如計算協

MATLAB——迴歸演算法

設有q個因變數{y1,y2...yq}和p個自變數{x1,x2...xp}。為了研究因變數和自變數的統計關係,觀測n個樣本點,構成了自變數與因變數的資料表X= 和Y= 。部分最小二乘迴歸分別在X和Y中提取成分和,他們分別是x1,...,xp和y1,...,yq的線性組合。提取

迴歸學習演算法---迴歸、PCA降維與理論

1、相關係數的意義與原理   在研究中我們經常要研究多個變數之間的相關性,這些變數可以是自變數與自變數之間、或者是自變數與因變數之間的相關性,為了表示這種相關性,我們引入了相關係數這個概念。這裡使用的

(pls)迴歸分析 matlab

偏最小二乘用於查詢兩個矩陣(X和Y)的基本關係,即一個在這兩個空間對協方差結構建模的隱變數方法。偏最小二乘模型將試圖找到X空間的多維方向來解釋Y空間方差最大的多維方向。偏最小二乘迴歸特別適合當預測矩陣比觀測的有更多變數,以及X的值中有多重共線性的時候。通過投影預測變數和觀測變

迴歸,嶺迴歸,Lasso迴歸,彈性網路

普通最小二乘法 理論:   損失函式:   權重計算:   1、對於普通最小二乘的係數估計問題,其依賴於模型各項的相互獨立性。 2、當各項是相關的,且設計矩陣 X的各列近似線性相關,那麼,設計矩陣會趨向於奇異矩陣,這會導致最小二乘估計對於隨機誤差非常敏感

Partial Least Squares Regression 乘法迴歸

介紹 定義   偏最小二乘迴歸 ≈ 多元線性迴歸分析 + 典型相關分析 + 主成分分析   輸入:n×m的預測矩陣X,n×p的響應矩陣Y   輸出:X和Y的投影(分數)矩陣T,U∈Rn×l   目標:最大化corr(T,U)   X=TPT+E,

迴歸樹Python實現——統計學習方法第五章課後題

李航博士《統計學習方法》第五章第二題,試用平方誤差準則生成一個二叉迴歸樹。 輸入資料為: x     0            1          2         3      

概率統計與機器學習:獨立同分布,極大似然估計,線性迴歸

獨立同分布 獨立性 概念:事件A,B發生互不影響 公式:P(XY)=P(X)P(Y) , 即事件的概率等於各自事件概率的乘積 舉例: 正例:兩個人同時向上拋硬幣,兩個硬幣均為正面的概率 反例:獅子在某地區出現的概率為X,老虎出現概率為Y,同時出現

數值分析 matlab

      1. 已知函式在下列各點的值為   -1 -0.75 -0.5 0 0.25 0.5 0.75  

牛頓法求解問題(線性迴歸

用牛頓法求解代價函式的最小值,這裡是n維向量,是實數。 解  牛頓法(詳細點此)迭代公式為, 這裡,是關於的偏導數向量;是一個n x n被稱作Hessian的矩陣,其元素為。 先求關於的偏導數 上式

線性迴歸 梯度下降 隨機梯度下降

一下午只弄清楚這一個問題了,記錄一下,有點亂: 先從線性迴歸問題說起,為了對樣本點進行擬合求得擬合函式來進行對新的輸入做出預測,便設計了一個衡量擬合函式好壞的標準,其實標準有很多:可以是SUM{|f(Xi) - Yi|} / N; 也可以是SUM{|f(Xi) - Yi|^

邏輯迴歸、線性迴歸、極大似然、梯度下降

轉自 http://www.zhihu.com/question/24900876 機器學習的基本框架大都是模型、目標和演算法! 重要的事情說三遍! 對於一個數據集,首先你要根據資料的特點和目的來選擇合適模型。 就你問的而言,選定的模型是Logistic Regressi

【機器學習詳解】線性迴歸、梯度下降、的幾何和概率解釋

線性迴歸 即線性擬合,給定N個樣本資料(x1,y1),(x2,y2)....(xN,yN)其中xi為輸入向量,yi表示目標值,即想要預測的值。採用曲線擬合方式,找到最佳的函式曲線來逼近原始資料。通過使得代價函式最小來決定函式引數值。 採用斯坦福大學公開課的

python leastsq 函數實現

誤差 實現 是個 ipy plt 筆記 matplot otl code 代碼修改自 http://www.cnblogs.com/NanShan2016/p/5493429.html 網上百度了一下,主要是兩個例子,一個利用了多項式函數,一個就是這個。有些細節沒看懂,

Spark機器學習(10):ALS交替算法

mllib 測試 con 相互 idt color ted 個人 使用 1. Alternating Least Square ALS(Alternating Least Square),交替最小二乘法。在機器學習中,特指使用最小二乘法的一種協同推薦算法。如下圖所示,u表

大似然估計與

現在 最小 bayesian 我不知道 什麽 改變 我不 tps 有關 參考: 最大似然估計,就是利用已知的樣本結果,反推最有可能(最大概率)導致這樣結果的參數值。例如:一個麻袋裏有白球與黑球,但是我不知道它們之間的比例,那我就有放回的抽取10次,結果我發現我抽到了8次黑球

(九)擬合次曲線

.fig pac atp matrix plot .text Coding 運算 提取數據 1 #coding=utf-8 2 from numpy import * 3 import numpy as np 4 import matplotlib.pyplo