1. 程式人生 > >衡量回歸模型的效果--R語言實現

衡量回歸模型的效果--R語言實現

    當預測變數是數值型變數時,我們通常會選擇一些準確性的度量方法來評估模型的有效性,接下來我們總結了一些度量標準,並寫出用R語言實現程式碼:

   1、均方根誤差(root mean squared error,RMSE)


   2、均方誤差(mean aquared  error,MSE)


3 、R^2 =r^2 表示資料中包含的資訊中能被模型解釋的比例


    R^2是一種相關性度量,而不是準確性度量標準

4、Spearman 秩相關係數

      建模的目的是對新樣本進行排序時,可用Spearman 秩相關係數 定量度量模型的效果

     Spearman 秩相關係數的計算方法:首先計算觀測值的秩,然後衡量它與預測值的秩的相關係數。

5、方差-偏差的均衡

    假設資料點是統計獨立的,那麼殘差具有理論上的零均值和常數方差σ,那麼

       

       偏差,反映的是模型的函式形式與預測變數、結果變數之間真實關係的接近程度。

       一般而言,複查的模型通常會有很高的方差,這會導致過度擬合;另一方面,簡單的模型如果沒有足夠的靈活性來刻畫真實的變數關係,那麼通常會擬合不足,從而產生較高的偏差。這就是所謂的方差-偏差均衡。

6、計算

> oberved<-c(0.22,0.83,-0.12,0.89,-0.23,-1.3)
> predicted<-c(0.24,0.78,-0.66,0.53,0.70,-0.75)
> residualValues<-oberved-predicted
> summary(residualValues)
    Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
-0.93000 -0.41750  0.01500 -0.09167  0.28250  0.54000 

衡量模型優劣的第一步是將結果視覺化

6.1  畫觀測值與預測值的散點圖

> axisRange<-extendrange(c(oberved,predicted))#將兩組取值放在相同的尺度下
> plot(oberved,predicted,ylim=axisRange,xlim=axisRange)
> abline(0,1,col="red",lty=2)#新增45°角的參考線


6.2  畫殘差與預測值的散點圖

> plot(predicted,residualValues,ylab="residuals")
> abline(h=0,col="blue",lty=2)


6.3  計算RMSE和 R^2

> library(caret)

> postResample(predicted,oberved)
     RMSE  Rsquared 
0.5150243 0.5404190 

6.4 計算 Spearman 秩相關係數

> cor(predicted,oberved,method="spearman")
[1] 0.5428571

相關推薦

衡量模型效果--R語言實現

    當預測變數是數值型變數時,我們通常會選擇一些準確性的度量方法來評估模型的有效性,接下來我們總結了一些度量標準,並寫出用R語言實現程式碼:    1、均方根誤差(root mean squared error,RMSE)    2、均方誤差(mean aquared

模型效果評估系列1-QQ圖

們的 cap plt linspace sci ros 虛線 ati ntile (erbqi)導語 QQ圖全稱 Quantile-Quantile圖,也就是分位數-分位數圖,簡單理解就是把兩個分布相同分位數的值,構成點(x,y)繪圖;如果兩個分布很接近,那個點(x,y)會

模型效果評估系列2-MAE、MSE、RMSE、MAPE(MAPD)

不同 term 指標 tle 相對 差距 view watermark root MAE、MSE、RMSE、MAPE(MAPD)這些都是常見的回歸預測評估指標,重溫下它們的定義和區別以及優缺點吧 MAE(Mean Absolute Error) 平均絕

R語言:EM演算法和高斯混合模型R語言實現

本文我們討論期望最大化理論,應用和評估基於期望最大化的聚類。軟體包install.packages("mclust");require(mclust)## Loading required package: mclust## Package 'mclust' version

Logistic模型和Python實現

logistic rip ast 步長 glm 常見 gist nes sel 回歸分析是研究變量之間定量關系的一種統計學方法,具有廣泛的應用。 Logistic回歸模型 線性回歸 先從線性回歸模型開始,線性回歸是最基本的回歸模型,它使用線性函數描述兩個變量之間的關系,將連

R語言實現LDA主題模型分析知乎話題

 這是一篇關於文字主題分析的應用實踐,主要嘗試聚焦幾個問題,什麼是LDA主題模型?如何使用LDA主題模型進行文字?我們將知乎上面的轉基因話題精華帖下面的提問分成六大主題進行實踐。 轉基因“風雲再起” 2017年5月18日璞谷塘悄然開張,這是小崔線上販賣非轉基因食品的網

R語言實現RMF模型

RMF模型說明 RMF模型是客戶管理中,常被用來衡量客戶價值和客戶創利能力的重要方法。它主要考量三個指標: 最近一次消費-Recency:近期購買的客戶傾向於再度購買 消費頻率-Frequency:經常購買的客戶再次購買概率高 消費金額-Monetary:消費金額較多的客戶

吳裕雄 python 神經網絡——TensorFlow實現模型訓練預測MNIST手寫數據集

rect ros its .com img tensor sce 交互 run import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist =

信用卡評分模型R語言

eric 線圖 樣本 tag 匯總 lines lan 識別 param 信用卡評分 一、數據準備 1、 問題的準備   ? 目標:要完成一個評分卡,通過預測某人在未來兩年內將會經歷財務危機的可能性來提高信用評分的效果,幫助貸款人做出最好的決策。   ? 背景:     –

統計學習方法[6]——邏輯模型

算法 ima 題解 問題 回歸 統計學習 同步 轉換 步長 統計學習方法由三個要素組成:方法=模型+策略+算法 模型是針對具體的問題做的假設空間,是學習算法要求解的參數空間。例如模型可以是線性函數等。 策略是學習算法學習的目標,不同的問題可以有不同的學習目標,例如經驗風險最

的應用C語言實現 斐波那契函數

bsp std 技術 顯示 斐波那契數 cnblogs 分享 pri nbsp #include "stdio.h" int Fbi(int i) /* 斐波那契的遞歸函數 */{ if( i < 2 ) return i == 0 ? 0 : 1;

cart樹及其剪枝的python實現

mat 接下來 更多 split 討論 也有 其中 程序 target 轉自穆晨 閱讀目錄 前言 回歸樹 回歸樹的優化工作 - 剪枝 模型樹 回歸樹 / 模型樹的使用 小結 回到頂部 前言 前文討論的回歸算法都是全局且針對線性問題的回歸,即使是其中的局

學習筆記 | 模型 | 01 介紹

ren 筆記 reg 影響 stand 他在 sid res parent 01 Introduction Regression toward the mean 趨均數回歸 弗朗西斯·高爾頓 他在論及遺傳對個體差異的影響時,首次提到了相關系數的概念。比如他研究了

人工智能 tensorflow框架-->Softmax模型的訓練與評估 09

min 初始化 dict ntop ict port true on() run import tensorflow as tf import numpy as np #mnist數據輸入from tensorflow.examples.tutorials.mnist

Spark 決策樹--模型

pipe sele nal evaluate 回歸 textfile style mode ssi package Spark_MLlib import org.apache.spark.ml.Pipeline import org.apache.spark.ml.ev

基於tensorflow的簡單線性模型

AC turn png cti ret type predict supports on() #!/usr/local/bin/python3 ##ljj [1] ##linear regression model import tensorflow as tf i

邏輯理解及代碼實現

repeat 謝謝 數據 了解 lock isp 容易 推導 最優 github:代碼實現之邏輯回歸 本文算法均使用python3實現 1. 什麽是邏輯回歸 ??《機器學習實戰》一書中提到: 利用邏輯回歸進行分類的主要思想是:根據現有數據對分類邊界線建立回歸公式,以此進

R語言實現兩文件對應行列字符替換

pack nbsp mode none 安裝 lse 規則 改變 2.x 假設存在文件file1.xlsx,其內容如下: 存在文件file2.xlsx,其內容如下: 現在我想從第七列開始,將file2所有的字符替換成file1一樣的,即第七、八、九、十列不需要

機器學習:線性——理論與代碼實現(基於正規方程與梯度下降)

overfit 返回 pen ear 隨機梯度 是否 很大的 建模 回歸 一 線性模型 給定由n個屬性描述的列向量\(f(\mathbf{x})={(x^{(1)};x^{(2)};...;x^{(n)})}\),其中 \(x^{(j)}\)是\(\textbf{x}\)

模型構建

sets 目的 imp The ase scale predict die bsp 回歸模型構建 模塊 函數 算法名稱 簡稱 linear_model LinearRegression 線性回歸 LR svm SVR 支持向量機回歸 SVM neigh