1. 程式人生 > >數學建模——統計迴歸模型

數學建模——統計迴歸模型

前言:看完數學建模的統計迴歸模型,更是感到了數學建模的“細膩”之處,對比與機器學習,如果說機器學習像是“打一場仗”,那數學建模更是像“做一場手術”,一個簡單的迴歸問題也可以從中感覺到他“細膩”的美感

迴歸模型是利用統計分析方法建立的最常用的一個模型,下面將通過對軟體得到的結果進行分析,進而改進我們的模型。

下面將用3個例子展示對迴歸模型的優化。

1.牙膏的銷售模型

問題的提出:假設一個公司需要預測不同價格和廣告費用下的牙膏的銷售量,我們需要怎麼建立模型呢?

假設我們拿到的資料如下:
這裡寫圖片描述

我們可以根據資料建立一個基本的模型:
y

x1
x2

模型為:y=β0+β1x1+β2x2+β3x22+ϵ

求解這個模型我們會得到下面的結果:
這裡寫圖片描述

這說明y的90.54%可以由模型確定,x2對因變數y 的影響不太顯著(因為β20)。

這些資料具體到公司的銷售量到底意味著什麼呢?

假設我們把控制價格差x1=0.2,投入廣告費x2=650萬,根據我們的模型可以求出y的值為8.2933(百萬支),銷售量的預測區間為[7.8230,8.7636]。

那麼我們就有95%把握知道銷售量在7.8320百萬支以上。

優化——加入互動項

剛才我們只考慮了每個因素單獨的影響,現在我們考慮他們的影響有互動作用,即我們的模型變為:

y=β0+β1x1+β2x2+β3x22+β4x1x2+ϵ

從而求得的結果為:
這裡寫圖片描述

這是後仍控制價格差x1為0.2,投入廣告費用x2位6.5百萬,我們得到的銷售量為8.3272,可見比原來有所增加,預測區間變為[7.8953,8.7592],預測區間縮短。

下面是模型的比較:
這裡寫圖片描述

那麼加入互動項對模型有什麼影響呢?

由上圖可見加入互動項之後函式的變化更加明顯,我們也可以從中得到一些啟發,比如下圖我們用了不同的價格差,對廣告費(

x2)用和銷售量(y)進行比較:
這裡寫圖片描述

由上圖我們可以容易的總結出以下兩條:

  • 廣告費用小於7左右的時候,價格優勢的作用更加明顯,價格低的銷售量多。

  • 當廣告費大於6百萬的時候,價格差小的,銷售良隨著廣告的增加而增加的速率更快,所以此時應該增加廣告來吸引眼球。

2.軟體開發人員的薪金

建立模型研究薪金與資歷、管理責任、教育程度的關係,從而分析人事策略的合理性,作為新聘用人員薪金的參考

資料為46個開發人員的薪資
這裡寫圖片描述
資歷~ 從事專業工作的年數;管理~ 1=管理人員,0=非管理人員;教育~ 1=中學,2=大學,3=更高程度

建立基本模型
yx1
x2=1x2=0
x3=1x3=0
x4=1x4=0
所以: