R中的線性迴歸分析
阿新 • • 發佈:2019-02-06
迴歸分析(regression analysis)
迴歸分析是研究自變數與因變數之間關係形式的分析方法,它主要是通過建立因變數Y與影響它的自變數Xi(i=1,2,3...)之間的迴歸模型,來預測因變數Y的發展趨勢。簡單線性迴歸模型
Y=a+b*X+e
Y——因變數
X——自變數
a——常數項,是迴歸直線在縱軸上的截距
b——迴歸係數,是迴歸直線的斜率
e——隨機誤差,即隨機因素對因變數所產生的影響
迴歸分析函式
lm(formula)
formula:迴歸表示式y~x+1
lm型別的迴歸結果,一般使用summary函式進行檢視
預測函式
predic(lmModel,predictData,level=置信度)
引數說明:
lmModel:迴歸分析得到的模型
predictData:需要預測的值
level:置信度
返回值:預測結果
data <- read.table('data.csv', header=T, sep=','); #第一步,根據預測目標,確定自變數和因變數; #第二步,繪製散點圖,確定迴歸模型型別; plot(data$廣告費用, data$購買使用者數) #第三步,估計模型引數,建立迴歸模型; lmModel <- lm(formula = 購買使用者數 ~ 1 + 廣告費用, data=data) #第四步,對迴歸模型進行檢測; summary(lmModel) #第五步,利用迴歸模型進行預測。 pData <- read.table('newData.csv', header=T, sep=',', fileEncoding = 'utf8'); fix(pData) predict(lmModel, pData, level=0.95)
多重線性迴歸,是同樣的道理:
#第一步,根據預測目標,確定自變數和因變數; #第二步,繪製散點圖,確定迴歸模型型別; plot(data$廣告費用, data$購買使用者數) plot(data$渠道數, data$購買使用者數) #第三步,估計模型引數,建立迴歸模型; lmModel <- lm(formula = 購買使用者數 ~ 1 + 廣告費用 + 渠道數, data=data) #第四步,對迴歸模型進行檢測; summary(lmModel) #第五步,利用迴歸模型進行預測。 pData <- read.table('newData.csv', header=T, sep=',', fileEncoding = 'utf8'); predict(lmModel, pData, level=0.95)