1. 程式人生 > >R中的線性迴歸分析

R中的線性迴歸分析

迴歸分析(regression analysis)

迴歸分析是研究自變數與因變數之間關係形式的分析方法,它主要是通過建立因變數Y與影響它的自變數Xi(i=1,2,3...)之間的迴歸模型,來預測因變數Y的發展趨勢。

簡單線性迴歸模型
Y=a+b*X+e
Y——因變數
X——自變數
a——常數項,是迴歸直線在縱軸上的截距
b——迴歸係數,是迴歸直線的斜率
e——隨機誤差,即隨機因素對因變數所產生的影響
迴歸分析函式
lm(formula)
formula:迴歸表示式y~x+1
lm型別的迴歸結果,一般使用summary函式進行檢視

預測函式
predic(lmModel,predictData,level=置信度)
引數說明:
lmModel:迴歸分析得到的模型
predictData:需要預測的值
level:置信度

返回值:預測結果

data <- read.table('data.csv', header=T, sep=',');

#第一步,根據預測目標,確定自變數和因變數;

#第二步,繪製散點圖,確定迴歸模型型別;
plot(data$廣告費用, data$購買使用者數)

#第三步,估計模型引數,建立迴歸模型;
lmModel <- lm(formula = 購買使用者數 ~ 1 + 廣告費用, data=data)

#第四步,對迴歸模型進行檢測;
summary(lmModel)

#第五步,利用迴歸模型進行預測。
pData <- read.table('newData.csv', header=T, sep=',', fileEncoding = 'utf8');
fix(pData)
predict(lmModel, pData, level=0.95)

多重線性迴歸,是同樣的道理:

#第一步,根據預測目標,確定自變數和因變數;

#第二步,繪製散點圖,確定迴歸模型型別;
plot(data$廣告費用, data$購買使用者數)
plot(data$渠道數, data$購買使用者數)

#第三步,估計模型引數,建立迴歸模型;
lmModel <- lm(formula = 購買使用者數 ~ 1 + 廣告費用 + 渠道數, data=data)

#第四步,對迴歸模型進行檢測;
summary(lmModel)

#第五步,利用迴歸模型進行預測。
pData <- read.table('newData.csv', header=T, sep=',', fileEncoding = 'utf8');

predict(lmModel, pData, level=0.95)