模型樹——就是回歸樹的分段常數預測修改為線性回歸對於非線性回歸有較好的預測效果

阿新 • • 發佈：2017-07-26

too 實現 ops ann targe class ast asi 最小

說完了樹回歸，再簡單的提下模型樹，因為樹回歸每個節點是一些特征和特征值，選取的原則是根據特征方差最小。如果把葉子節點換成分段線性函數，那麽就變成了模型樹，如（圖六）所示：

（圖六）

（圖六）中明顯是兩個直線組成，以X坐標（0.0-0.3）和（0.3-1.0）分成的兩個線段。如果我們用兩個葉子節點保存兩個線性回歸模型，就完成了這部分數據的擬合。實現也比較簡單，代碼如下：

[python] view plain copy

def linearSolve(dataSet): #helper function used in two places
m,n = shape(dataSet)

X = mat(ones((m,n))); Y = mat(ones((m,1)))#create a copy of data with 1 in 0th postion
X[:,1:n] = dataSet[:,0:n-1]; Y = dataSet[:,-1]#and strip out Y
xTx = X.T*X
if linalg.det(xTx) == 0.0:
raise NameError(‘This matrix is singular, cannot do inverse,\n\
try increasing the second value of ops‘)
ws = xTx.I * (X.T * Y)
return ws,X,Y
def modelLeaf(dataSet):#create linear model and return coeficients
ws,X,Y = linearSolve(dataSet)
return ws
def modelErr(dataSet):
ws,X,Y = linearSolve(dataSet)
yHat = X * ws
return sum(power(Y - yHat,2))

代碼和樹回歸相似，只不過modelLeaf在返回葉子節點時，要完成一個線性回歸，由linearSolve來完成。最後一個函數modelErr則和回歸樹的regErr函數起著同樣的作用。

謝天謝地，這篇文章一個公式都沒有出現，但同時也希望沒有數學的語言，表述會清楚。

數據ex00.txt：

0.036098 0.155096

xxx

轉載請註明來源：http://blog.csdn.net/cuoqu/article/details/9502711

參考文獻：

[1] machine learning in action.Peter Harrington

模型樹——就是回歸樹的分段常數預測修改為線性回歸對於非線性回歸有較好的預測效果

too 實現 ops ann targe class ast asi 最小說完了樹回歸，再簡單的提下模型樹，因為樹回歸每個節點是一些特征和特征值，選取的原則是根據特征方差最小。如果把葉子節點換成分段線性函數，那麽就變成了模型樹，如（圖六）所示：（圖六）

cart回歸樹算法過程

時間一個訓練技術分享統計學習 http ont 內部 cart 回歸樹：使用平方誤差最小準則訓練集為：D={(x1,y1), (x2,y2), …, (xn,yn)}。輸出Y為連續變量，將輸入劃分為M個區域，分別為R1,R2,…,RM,每個區域的輸出值分別為：c

CART 分類與回歸樹

view ati 發生最小值屬性 ssi 沒有 bsp 獨立 from www.jianshu.com/p/b90a9ce05b28 本文結構： CART算法有兩步回歸樹的生成分類樹的生成剪枝 CART － Classification and Regre

對於分類回歸樹和lightgbm的理解

利用區分 OS 改進假設成了數據 ima size 在分類回歸樹中之所以要先分類後回歸的原因是，對於一般的線性回歸是基於全部的數據集。這種全局的數據建模對於一些復雜的數據來說，其建模的難度會很大。所以我們改進為局部加權線性回歸，其只利用數據點周圍的局部數據進行建模

分類回歸樹什麽時候不能反映數據的真實趨勢

tor mod 參數設置 panda IT 一個輸入 oos red 本質上lightgbm和xgboost都是基於分類回歸樹集成的學習算法，所以他們也會有一些先天缺陷：當訓練數據的特征都集中在一個區間內，而測試數據偏離該區間較大時會出現不能擬合的情況，根本原因是因為分

機器學習實戰第九章回歸樹錯誤

最近一直在學習《機器學習實戰》這本書。感覺寫的挺好，並且在網上能夠輕易的找到python原始碼。對學習機器學習很有幫助。最近學到第九章樹迴歸。發現程式碼中一再出現問題。在網上查了下，一般的網上流行的錯誤有兩處。但是我發現原始碼中的錯誤不止這兩處，還有個錯誤在

R語言用nls做非線性回歸以及函數模型的參數估計

nes 線性 -s legend 最小值 fun des and start 非線性回歸是在對變量的非線性關系有一定認識前提下，對非線性函數的參數進行最優化的過程，最優化後的參數會使得模型的RSS（殘差平方和）達到最小。在R語言中最為常用的非線性回歸建模函數是nls，下面以

為什麽邏輯斯特回歸(logistic regression)是線性模型

softmax bsp 之間 ima 打破 regress 什麽影響線性變換一個典型的logistic regression模型是: 這裏明明用了非線性函數，那為什麽logistic regression還是線性模型呢？首先，這個函數不是f(y,x)=0的函數

二叉樹的前序、中序、後序、層次遍歷的遞歸與非遞歸實現

不為 sta logs 結束 nod 遞歸實現 inorder count site 二叉樹的遍歷有前序遍歷、中序遍歷、後序遍歷、層次遍歷等，筆者在這裏總結一下各種遍歷的實現。一.前序遍歷。前序遍歷訪問節點順序為：根節點->左子節點->右子節點。遞歸實現如

BZOJ 3676 [Apio2014]回文串（回文樹）

代碼 nbsp 一個字符 ast div 題目 cpp sin 【題目鏈接】 http://www.lydsy.com/JudgeOnline/problem.php?id=3676 【題目大意】　　考慮一個只包含小寫拉丁字母的字符串s。　　我們

分類和邏輯回歸(Classification and logistic regression)，廣義線性模型(Generalized Linear Models) ，生成學習算法(Generative Learning algorithms)

line learning nbsp ear 回歸 logs http zdb del 分類和邏輯回歸(Classification and logistic regression) http://www.cnblogs.com/czdbest/p/5768467.html

模型樹——就是回歸樹的分段常數預測修改為線性回歸對於非線性回歸有較好的預測效果

模型樹——就是回歸樹的分段常數預測修改為線性回歸對於非線性回歸有較好的預測效果

cart回歸樹算法過程

CART 分類與回歸樹

對於分類回歸樹和lightgbm的理解

分類回歸樹什麽時候不能反映數據的真實趨勢

機器學習實戰第九章回歸樹錯誤

R語言用nls做非線性回歸以及函數模型的參數估計

為什麽邏輯斯特回歸(logistic regression)是線性模型

二叉樹的前序、中序、後序、層次遍歷的遞歸與非遞歸實現

BZOJ 3676 [Apio2014]回文串（回文樹）

分類和邏輯回歸(Classification and logistic regression)，廣義線性模型(Generalized Linear Models) ，生成學習算法(Generative Learning algorithms)

UVALive-7041(回文樹

Palindromic Tree 回文自動機-回文樹例題+講解

【BZOJ2342】雙倍回文（回文樹）

【SPOJ】NUMOFPAL - Number of Palindromes（Manacher，回文樹）

【CF17E】Palisection（回文樹）

回文樹

回文樹詳解

【HDU5421】Victor and String（回文樹）

CF17E Palisection（回文樹）

模型樹——就是回歸樹的分段常數預測修改為線性回歸 對於非線性回歸有較好的預測效果

相關推薦

模型樹——就是回歸樹的分段常數預測修改為線性回歸對於非線性回歸有較好的預測效果