1. 程式人生 > 其它 >一元線性迴歸模型及其應用

一元線性迴歸模型及其應用

選擇性必修第三冊同步拔高,難度2顆星!

\({\color{Red}{歡迎到學科網下載資料學習 }}\)
【高分突破系列】2021-2022學年高二數學下學期同步知識點剖析精品講義(人教A版2019)
\({\color{Red}{ 跟貴哥學數學,so \quad easy!}}\)

選擇性必修第三冊同步拔高,難度2顆星!

模組導圖

# 知識剖析

一元線性迴歸模型

\(x\)表示父親身高,\(Y\)表示兒子身高,\(e\)表示隨機誤差,假定隨機誤差\(e\)的均值為\(0\),方差為與父親身高無關的定值\(σ^2\),則它們之間的關係可以表示為
\(\left\{\begin{array}{c} Y=b x+a+e \\ E(e)=0, D(e)=\sigma^{2} \end{array}\right.\)


我們稱它為\(Y\)關於\(x\)的一元線性迴歸模型.

線性迴歸方程

對於變數\(x\)和變數\(y\),設經過隨機抽樣獲得的成對樣本資料為\((x_1 ,y_1 )\) ,\((x_2 ,y_2 )\),… ,\((x_n ,y_n)\),其中\(x_1\) ,\(x_2\),… ,\(x_n\)\(y_1\)\(y_2\),… ,\(y_n\)的均值分別為\(\bar{x}\)\(\bar{y}\),其中
\(\left\{\begin{array}{c} \hat{b}=\dfrac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}=\dfrac{\sum_{i=1}^{n} x_{i} y_{i}-n \bar{x} \bar{y}}{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}} \\ \hat{a}=\bar{y}-b \bar{x} \end{array}\right.\)


我們將\(\hat{y}=\hat{b} x+\hat{a}\)稱為\(Y\)關於\(x\)的經驗迴歸方程,其圖形稱為經驗迴歸直線,這種求經驗迴歸方程的方法叫做最小二乘法.
\({\color{Red}{ PS }}\)線性迴歸直線經過定點\((\bar{x}, \bar{y})\).

殘差分析

通過觀測得到的資料稱為觀測值,通過經驗迴歸方程得到的\(\hat{y}\)稱為預測量,觀測值減去預測值稱為殘差,殘差是隨機誤差的估計結果,通過對殘差的分析可以判斷模型刻畫資料的效果,以及判定原始資料是否存在可疑資料,這方面的工作稱為殘差分析.
通過觀察殘差圖可以直觀判斷模型是否滿足一元線性迴歸模型中對隨機誤差的假設,那殘差應是均值為\(0\)

,方差為\(σ^2\)的隨機變數的觀測值.

比較模型的擬合效果

\((i)\)殘差平方和
殘差平方和\(Q=\sum_{i=1}^{n}\left(y_{i}-\hat{y}\right)^{2}\) 越小,擬合效果越好.
\((ii)\)相關指數\(R^2\)
\(R^{2}=1-\dfrac{\sum_{i=1}^{n}\left(y_{i}-\hat{y}\right)^{2}}{\sum_{i=1}^{n}\left(y_{i}-\bar{y}\right)^{2}}\)
\(R^2\)越大,殘差平方和\(\sum_{i=1}^{n}\left(y_{i}-\hat{y}\right)^{2}\) 越小,模型擬合效果越好.

經典例題

【題型一】一元線性迴歸模型

【典題1】 某服裝品牌市場部門為了研究銷售情況,統計了一段時間內該品牌不同服裝的單價\(x\)(元)和銷售額\(y\)(元)的資料,整理得到下面的散點圖:

已知銷售額\(y=\)單價\(x×\)銷量\(z\),根據散點圖,下面四個迴歸方程型別中最適宜作為服裝銷量\(z\)與單價\(x\)的迴歸方程型別的是(  )
\(A. z=a+b x \quad B. z=a+\dfrac{b}{x} \quad C. z=a+b x^{2} \quad D. z=a+b e^{x}\)
【解析】 由散點圖知,銷售額\(y\)與單價\(x\)呈線性關係,不妨設\(y=m+nx\)
所以\(z=\dfrac{y}{x}=\dfrac{m+n x}{x}=\dfrac{m}{x}+n\),與選項\(B\)中的迴歸方程型別一致.
故選:\(B\)

【典題2】 已知由樣本資料\((x_i ,y_i)(i=1 ,2 ,3 ,… ,8)\)組成的一個樣本,得到迴歸直線方程為\(\hat{y}=2 x-0.4\)\(\bar{x}=2\),去除兩個歧義點\((-2 ,7)\)\((2 ,-7)\)後,得到新的迴歸直線的斜率為\(3\).則下列說法正確的是(  )
A.相關變數\(x ,y\)具有正相關關係
B.去除歧義點後的迴歸直線方程為\(\hat{y}=3 x-3.2\)
C.去除歧義點後,隨\(x\)值增加相關變數\(y\)值增加速度變小
D.去除歧義點後,樣本\((4 ,8.9)\)的殘差為\(0.1\)(附:\(\widehat{e_{1}}=y_{1}-\widehat{y_{i}}\) ̂)
【解析】 對選項\(A、B\)
\(\bar{x}=2\),代入\(\hat{y}=2 x-0.4\),得\(\bar{y}=2 \times 2-0.4=3.6\)
\({\color{Red}{ (樣本中心(\bar{x}, \bar{y})一定線上性迴歸方程\hat{y}=\hat{b} x+\hat{a}上)}}\)
\(∴\)去除兩個歧義點\((-2 ,7)\)\((2 ,-7)\)後,得到新的\(\bar{x}=\dfrac{2 \times 8-2+2}{6}=\dfrac{8}{3}\)\(\bar{y}=\dfrac{3.6 \times 8-7+7}{6}=4.8\)
又得到新的迴歸直線的斜率為\(3\)
\(∴\)新的線性迴歸方程的\(\widehat{a}=4.8-3 \times \dfrac{8}{3}=-3.2\)
則去除兩個歧義點後的線性迴歸方程為\(\hat{y}=3 x-3.2\),故\(B\)正確;
\({\color{Red}{ (求出新的樣本中心 (\bar{x}, \bar{y}) ,再利用其一定線上性迴歸方程\widehat{\boldsymbol{y}}=\widehat{\boldsymbol{b}} x+\widehat{\boldsymbol{a}}上求出\widehat{\boldsymbol{a}} )}}\)
又由斜率\(3>0\),相關變數\(x ,y\)具有正相關關係,故\(A\)正確;
對選項\(C\)
原本回歸直線方程\(\hat{y}=2 x-0.4\)\(x\)增加\(1\)\(y\)增加\(2\),去除歧義點後,迴歸直線方程\(\hat{y}=3 x-3.2\)\(x\)增加\(1\)\(y\)增加\(3\),故去除歧義點後,隨x值增加相關變數\(y\)值增加速度變大,故\(C\)錯誤;
對選項\(D\)
\(x=4\)時,\(\hat{y}=3 \times 4-3.2=8.8\),則去除歧義點後,樣本\((4 ,8.9)\)的殘差為\(8.9-8.8=0.1\),故\(D\)正確.
故選:\(ABD\)

【典題3】 2020年的“金九銀十”變成“銅九鐵十”,全國各地房價“跳水”嚴重,但某地二手房交易卻“逆市”而行.下圖是該地某小區2019年12月至2020年12月間,當月在售二手房均價(單位:萬元/平方米)的散點圖.(圖中月份程式碼1~13分別對應2019年12月~2020年12月)

根據散點圖選擇\(y=a+b \sqrt{x}\)\(y=c+d \ln x\)兩個模型進行擬合,經過資料處理得到的兩個迴歸方程分別為\(\hat{y}=0.9369+0.0285 \sqrt{x}\)\(\hat{y}=0.9554+0.0306 \ln x\),並得到以下一些統計量的值:
\(\begin{array}{|c|c|c|} \hline & \hat{y}=0.9369+0.0285 \sqrt{x} & \hat{y}=0.9554+0.0306 \ln x \\ \hline R^{2} & 0.923 & 0.973 \\ \hline \end{array}\)
注:\(\bar{x}\)是樣本資料中\(x\)的平均數,\(\bar{y}\)是樣本資料中\(y\)的平均數,則下列說法正確的是(  )
A.當月在售二手房均價\(y\)與月份程式碼\(x\)呈負相關關係
B.由\(\hat{y}=0.9369+0.0285 \sqrt{x}\)預測2021年3月在售二手房均價約為1.0509萬元/平方米
C.曲線\(\hat{y}=0.9369+0.0285 \sqrt{x}\)\(\hat{y}=0.9554+0.0306 \ln x\)都經過點\((\bar{x}, \bar{y})\)
D.模型\(\hat{y}=0.9554+0.0306 \ln x\)迴歸曲線的擬合效果比模型\(\hat{y}=0.9369+0.0285 \sqrt{x}\)
【解析】 由散點圖可知,\(y\)\(x\)的增加而增加,故\(A\)錯誤;
2021年3月,相對2019年12月為\(x=1\),此時\(x=16\),代入\(\hat{y}=0.9369+0.0285 \sqrt{x}\),求得\(1.0509\),故\(B\)正確;
\({\color{Red}{ (在實際應用中要注意理解變數x、y 的實際意義) }}\)
曲線\(\hat{y}=0.9369+0.0285 \sqrt{x}\)經過點\((\overline{\sqrt{x}}, \bar{y})\),曲線\(\hat{y}=0.9554+0.0306 \ln x\)經過點\((\overline{\ln x}, \bar{y})\),故C錯誤;
\({\color{Red}{ (樣本中心 (\bar{x}, \bar{y}) 一定線上性迴歸方程\widehat{\boldsymbol{y}}=\widehat{\boldsymbol{b}} x+\widehat{\boldsymbol{a}}上,但題目中的模型y=a+b \sqrt{x} 和y=c+d \ln x不是線性模型,需要進行變換) }}\)
因為\(0.973>0.923\),所以模型\(\hat{y}=0.9554+0.0306 \ln x\)迴歸曲線的擬合效果比模型\(\hat{y}=0.9369+0.0285 \sqrt{x}\)的好,故D正確.
\({\color{Red}{ (R^2越大,擬合效果越好)}}\)
故選:\(BD\)

鞏固練習

1(★) 某校課外學習小組為研究某作物種子的發芽率\(y\)和溫度\(x\)(單位:°C)的關係,由實驗資料得到右面的散點圖.由此散點圖,最適宜作為發芽率\(y\)和溫度\(x\)的迴歸方程型別的是(  )

\(A. y=a+b x \qquad B. y=a+b \ln x \qquad C. y=a+b e^{x} \qquad D. y=a+b x^{2}\)

2(★) 2020年春季,新冠肺炎疫情在全球範圍內相繼爆發,因為政治制度、文化背景等因素的不同,各個國家疫情防控的效果具有明顯差異.如圖是西方某國在60天內感染新冠肺炎的累計病例人數\(y\)(萬人)與時間\(t\)(天)的散點圖,則下列最適宜作為此模型的迴歸方程的型別是(  )

\(A. y=a+b x \qquad B. y=a+b \sqrt{x} \qquad C. y=a+b e^{x} \qquad D. y=a+b \ln x\)

3(★) 對於一組具有線性相關關係的資料\((x_i,y_i)\)\((i=1,2,3,…,n)\),根據最小二乘法求得迴歸直線方程為\(\hat{y}=\hat{b} x+\hat{a}\),則以下說法正確的是(  )
A.預報變數\(y\)的值由解釋變數\(x\)唯一確定
B.在迴歸分析中,\(R^2=0.80\)的模型比\(R^2=0.98\)的模型擬合效果好
C.所有的樣本點均落在迴歸直線\(\hat{y}=\hat{b} x+\hat{a}\)
D.殘差圖中,殘差點分佈水平帶狀區域的寬度越窄,則迴歸方程的預報精確度越高

4(★) 某生物實驗小組設計實驗,得到光照強度\(x\)與某種植物光合作用速率\(y\)的一組資料\((x_i ,y_i)\),經過分析提出了四種迴歸模型,①、②、③、④四種模型的殘差平方和\(\sum_{i=1}^{n}\left(y_{i}-\widehat{y_{i}}\right)^{2}\)的值分別為\(0.48,0.99,0.15,1.23\),則擬合效果最好的是(  )
A.模型① B.模型② C.模型③ D.模型④

5(★) \(A、B\)兩個物理興趣小組在實驗室研究某粒子運動軌跡.共同記錄到粒子的\(13\)個位置的座標資訊如表:
\(\begin{array}{|c|c|c|c|c|c|c|c|c|c|c|c|c|c|} \hline x & -0.93 & -0.82 & -0.77 & -0.61 & -0.55 & -0.33 & -0.27 & 0.10 & 0.42 & 0.58 & 0.64 & 0.67 & 0.76 \\ \hline y & -0.26 & -0.41 & -0.45 & -0.45 & -0.60 & -0.67 & -0.68 & -0.71 & 0.64 & 0.55 & 0.55 & 0.53 & 0.46 \\ \hline \end{array}\)
\(A\)小組根據表中資料,直接對\(y ,x\)作線性迴歸分析,得到:
迴歸方程為\(\hat{y}=0.5993 x+0.005\),相關指數\(R^2=0.4472\)
\(B\)小組先將資料依變換\(u=x^2\) ,\(v=y^2\)進行整理,再對\(v ,u\)作線性迴歸分析,得到:
迴歸方程為\(\hat{v}=-0.5006 u+0.4922\),相關指數\(R^2=0.9375\)
根據統計學知識,下列方程中,最有可能是該粒子運動軌跡方程的是(  )
\(A. 0.5993 x-y+0.005=0 \qquad B. 0.5006 x+y-0.4922=0\)
\(C. \dfrac{0.5006 x^{2}}{0.4922}+\dfrac{y^{2}}{0.4922}=1 \qquad D. \dfrac{x^{2}}{0.4922}+\dfrac{0.5006 y^{2}}{0.4922}=1\)

6(★★) 【多選題】下列說法正確的是(  )
A.在做迴歸分析時,殘差圖中殘差點分佈的帶狀區域的寬度越窄表示迴歸效果越差
B.某地氣象局預報:6月9日本地降水概率為\(90 \%\),結果這天沒下雨,這表明天氣預報並不科學
C.迴歸分析模型中,殘差平方和越小,說明模型的擬合效果越好
D.在迴歸直線方程\(\hat{y}=0.1 x+10\)中,當解釋變數每增加\(1\)個單位時,預報變數多增加\(0.1\)個單位

7(★★) 【多選題】小明同學在做市場調查時得到如下樣本資料
\(\begin{array}{|c|c|c|c|c|} \hline x & 1 & 3 & 6 & 10 \\ \hline y & 8 & a & 4 & 2 \\ \hline \end{array}\)
他由此得到迴歸直線的方程為\(\hat{y}=-2.1 x+15.5\),則下列說法正確的是(  )
A.變數\(x\)\(y\)線性負相關
B.當\(x=2\)時可以估計\(y=11.3\)
C.\(a=6\)
D.變數\(x\)\(y\)之間是函式關係

8(★★) 【多選題】已知由樣本資料點集合\(\{(x_i,y_i)|i=1,2,…,n\}\)求得的線性迴歸方程為\(\hat{y}=1.5 x+0.5\)\(\bar{x}=3\).現發現兩個資料點\((1.8,3.8)\)\((4.2,6.2)\)的誤差較大,去除這兩個資料點後重新求得的迴歸直線l的斜率為\(1.2\),則下列說法中正確的有(  )
A.去除這兩個資料點前,當變數\(x\)每增加\(1\)個單位長度時,變數\(y\)減少\(1.5\)個單位長度
B.去除這兩個資料點後的迴歸直線過點\((3,5)\)
C.去除這兩個資料點後\(y\)的估計值的增長速度變慢
D.去除這兩個資料點後,當\(x=4\)時,\(y\)的估計值為\(6.2\)

9(★) 已知樣本點\((x_i,y_i)\)\((i=1,2,3,…,n)\)的迴歸直線方程為\(\hat{y}=2 x+a\),若樣本點\((r,1)\)\((1,s)\)的殘差相同,則\(s\)\(r\)的關係式為   .(附:對於樣本點\((x_i,y_i)\)的殘差\(\hat{e_{i}}=y_{i}-\hat{y_{i}}\))

10(★★) 下列說法:①分類變數\(A\)\(B\)的隨機變數\(K^2\)越大,說明“\(A\)\(B\)有關係”的可信度越大,②以模型\(y=c e^{k x}\)去擬合一組資料時,為了求出迴歸方程,設\(z=\ln y\),將其變換後得到線性方程\(z=0.3x+4\),則\(c\)\(k\)的值分別是\(e^4\)\(0.3\),③在殘差圖中,殘差點分佈的帶狀區域的寬度越狹窄,其模型擬合的精度越高,④若變數\(x\)\(y\)滿足關係\(y=-0.1x+1\),且變數\(y\)\(z\)正相關,則\(x\)\(z\)也正相關,正確的個數是\(\underline{\quad \quad}\)

答案

1【答案】\(B\)
【解析】 由圖知,散點圖分佈在一個對數函式的圖象附近,因此最適合作為發芽率y和溫度x的迴歸方程型別的是\(y=a+b \ln x\)
故選:\(B\)
2【答案】\(C\)
【解析】 函式影象隨著自變數的變大,函式值增長速度越來越快,屬於指數型函式的特徵,只有選項\(C\)為指數型函式.
故選:\(C\)
3【答案】\(D\)
【解析】 選項\(A\),預報變數由解釋變數進行估計,即選項\(A\)錯誤;
選項\(B\),相關係數\(R^2\)越大,說明擬合效果越好,即選項\(B\)錯誤;
選項\(C\),可能所有的樣本點都不在迴歸直線上,即選項\(C\)錯誤;
選項\(D\),在殘差圖中,殘差點分佈水平帶狀區域的寬度越窄,則迴歸方程的預報精確度越高,即選項\(D\)正確.
故選:\(D\)
4【答案】\(C\)
【解析】 殘差平方和越小,表示該模型的擬合效果越好,比較四種模型的殘差平方和,可知模型③的最小,所以其擬合效果最好.
故選:\(C\)
5【答案】\(C\)
【解析】 由統計學知識可知,\(R^{2}\)越大,擬合效果越好,
\(A\)小組的相關指數\(R^{2}=0.4472\)\(B\)小組的相關指數\(R^{2}=0.9375\)
\(∴B\)組的擬合效果好,則迴歸方程為\(\hat{v}=-0.5006 u+0.4922\)
\(u=x^{2}, \quad v=y^{2}\)\(\therefore y^{2}=-0.5006 x^{2}+0.4922\)
\(\dfrac{0.5006 x^{2}}{0.4922}+\dfrac{y^{2}}{0.4922}=1\)
故選:\(C\)
6【答案】\(CD\)
【解析】 對於\(A\),可用殘差圖判斷模型的擬合效果,殘差點比較均勻地落在水平的帶狀區域中,說明這樣的模型比較合適.帶狀區域的寬度越窄,說明模型的擬合精度越高.故\(A\)錯誤;
對於\(B\),6月9日本地降水概率為\(90 \%\),只是表明下雨的可能性是\(90 \%\),有可能這天不下雨,不能說明天氣預報並不科學,故\(B\)錯誤;
在迴歸分析模型中,殘差平方和越小,說明模型的擬合效果越好,故\(C\)正確;
在迴歸直線方程\(\hat{y}=0.1 x+10\)中,當解釋變數\(x\)每增加\(1\)個單位時,預報變數\(\hat{y}\)增加\(0.1\)個單位,故\(D\)正確.
故選:\(CD\)
7【答案】\(ABC\)
【解析】 由迴歸直線的方程為\(\hat{y}=-2.1 x+15.5\),可知變數\(x\)\(y\)線性負相關,故\(A\)正確;
\(x=2\)時,\(\hat{y}=-2.1 \times 2+15.5=11.3\),故\(B\)正確;
\(\because \bar{x}=\dfrac{1+3+6+10}{4}=5\)\(\bar{y}=\dfrac{8+a+4+2}{4}=\dfrac{14+a}{4}\)
\(∴\)樣本點的中心座標為\(\left(5, \dfrac{14+a}{4}\right)\)
代入\(\hat{y}=-2.1 x+15.5\),得\(\dfrac{14+a}{4}=-2.1 \times 5+15.5\),解得\(a=6\),故\(C\)正確;
變數\(x\)\(y\)之間具有線性負相關關係,不是函式關係,故\(D\)錯誤.
故選:\(ABC\)
8【答案】\(BCD\)
【解析】 去掉兩個資料點\((1.8,3.8)\)\((4.2,6.2)\)之前,\(\hat{y}=1.5 x+0.5\)
所以\(x\)每增加\(1\)個單位,\(y\)增加\(1.5\)個單位,故選項\(A\)錯誤;
去掉兩個資料點\((1.8,3.8)\)\((4.2,6.2)\)之前,
迴歸方程過\((\bar{x}, \bar{y})\),則\(\bar{y}=1.5 \times 3+0.5=5\)
而去掉的\(2\)個點\(\bar{x}=\dfrac{1.8+4.2}{2}=3\)\(\bar{y}=\dfrac{3.8+6.2}{2}=5\)
所以去掉後的\(\bar{x}, \bar{y}\)沒有變化,
故去除這兩個資料點後的迴歸直線過點\((3,5)\),故選項\(B\)正確;
去掉兩個資料點後,迴歸方程的斜率由\(1.5\)變為\(1.2\)
故去除這兩個資料點後\(y\)的估計值的增長速度變慢,故選項\(C\)正確;
去掉兩個資料點後,得到樣本的中心為\((3,5)\),則有\(5=1.2×3+a\),解得\(a=1.4\),故迴歸方程變為\(y=1.2x+1.4\)
\(x=4\)時,\(y=1.2×4+1.4=6.2\),故選項\(D\)正確.
故選:\(BCD\)
9【答案】\(s=3-2r\)
【解析】 \(∵\)迴歸直線方程為\(\hat{y}=2 x+a\),樣本點\((r,1)\)\((1,s)\)的殘差相同,
\(∴1-(2r+a)=s-(2+a)\),即\(s=3-2r\)
故答案為:\(s=3-2r\)
10【答案】\(3\)
【解析】 對於①,根據獨立性原理知,分類變數\(A\)\(B\)的隨機變數\(K^{2}\)越大,說明“\(A\)\(B\)有關係”的可信度越大,①正確;
對於②,根據迴歸模型和對數的運算性質知,以模型\(y=c e^{k x}\)去擬合一組資料時,為了求出迴歸方程,
\(z=\ln y\),將其變換後得到線性方程\(z=0.3x+4\),則\(c\)\(k\)的值分別是\(e^4\)\(0.3\),所以②正確;
對於③,利用殘差分析模型擬合效果時,在殘差圖中,殘差點分佈的帶狀區域的寬度越狹窄,其模型擬合的精度越高,所以③正確;
對於④,若變數\(x\)\(y\)滿足關係\(y=-0.1x+1\),且變數\(y\)\(z\)正相關,則\(x\)\(z\)是負相關,所以④錯誤.
綜上知,正確命題的序號是①②③,共\(3\)個.
故答案為:\(3\)

【題型二】 一元線性迴歸模型的應用

【典題1】 某產品的宣傳費用\(x\)(單位:萬元)與銷售額\(y\)(單位:萬元)的統計資料如表所示:
\(\begin{array}{|c|c|c|c|c|c|} \hline x & 4 & 5 & 6 & 7 & 8 \\ \hline y & 60 & 80 & 90 & 100 & 120 \\ \hline \end{array}\)
根據上表可得迴歸方程\(\hat{y}=14 x+\hat{a}\),則宣傳費用為\(9\)萬元時,銷售額最接近(  )
A.\(123\)萬元 B.\(128\)萬元 C.\(133\)萬元 D.\(138\)萬元
【解析】 \(\bar{x}=\dfrac{1}{5}(4+5+6+7+8)=6\)\(\bar{y}=\dfrac{1}{5}(60+80+90+100+120)=90\)
因為迴歸直線經過樣本中心,所以\(90=14 \times 6+\hat{a}\)\(\hat{a}=6\)
所以迴歸直線方程:\(\hat{y}=14 x+6\)
\(x=9\)時,\(\hat{y}=14 \times 9+6=132\)
故選:\(C\)

【典題2】 一研學實踐活動小組利用課餘時間,對某公司1至5月份銷售某種產品的銷售量及銷售單價進行了調查,月銷售單價\(x\)(單位:元)和月銷售量\(y\)(單位:百件)之間的一組資料如表所示:
\(\begin{array}{|c|c|c|c|c|c|} \hline \text { 月份 } i & 1 & 2 & 3 & 4 & 5 \\ \hline \text { 月銷售單價 } x_{i}(\text { 元 }) & 1.6 & 1.8 & 2 & 2.2 & 2.4 \\ \hline \text { 月銷售量 } y_{i} \text { (百件) } & 10 & 8 & 7 & 6 & 4 \\ \hline \end{array}\)
(1)根據1至5月份的資料,求出\(y\)關於\(x\)的迴歸直線方程;
(2)預計在今後的銷售中,月銷售量與月銷售單價仍然服從(1)中的關係,若該種產品的成本是\(1\)元/件,那麼該產品的月銷售單價應定為多少元,才能獲得最大月利潤?(注:利潤=銷售收入-成本)
附:迴歸直線方程\(\hat{y}=\hat{b} x+\hat{a}\),其中\(\widehat{b}=\dfrac{\sum_{i=1}^{n} x_{i} y_{i}-n \bar{x} \cdot \bar{y}}{\sum_{i=1}^{n} x_{i}^{2}-n \bar{x}^{2}}, \quad \hat{a}=\bar{y}-\hat{b} \bar{x}\)
參考資料:\(\sum_{i=1}^{5} x_{i} y_{i}=67.2, \sum_{i=1}^{5} x_{i}^{2}=20.4\)
【解析】 (1)\(\because \bar{x}=\dfrac{1.6+1.8+2+2.2+2.4}{5}=2\)\(\bar{y}=\dfrac{10+8+7+6+4}{5}=7\)
\(\therefore \hat{b}=\dfrac{\sum_{i=1}^{n} x_{i} y_{i}-n \overline{x y}}{\sum_{i=1}^{n} x_{i}^{2}-n \bar{x}^{2}}=\dfrac{67.2-5 \times 2 \times 7}{20.4-5 \times 4}=-7\)\(\hat{a}=\bar{y}-\hat{b} \bar{x}=7+7 \times 2=21\)
\(∴\)迴歸直線方程為\(\hat{y}=-7 x+21\)
(2)設該產品的月銷售單價為\(x\)元,月利潤為\(z\)百元,則
\(∵z=(x-1)⋅y\)\(\therefore z=(x-1)(-7 x+21)=-7 x^{2}+28 x-21=-7(x-2)^{2}+7\)
\(∴\)\(x=2\)時,\(Z_{\max }=7\)(百元).
\(∴\)該產品的月銷售單價應定為\(2\)元才能獲得最大月利潤為\(7\)百元.

【典題3】 某同學使用某品牌暖水瓶,其內膽規格如圖所示.若水瓶內膽壁厚不計,且內膽如圖分為①②③④四個部分,它們分別為一個半球、一個大圓柱、一個圓臺和一個小圓柱體,若其中圓臺部分的體積為\(52πcm^3\),且水瓶灌滿水後蓋上瓶塞時水溢位\(\dfrac{10 \pi}{3} \mathrm{~cm}^{3}\).記蓋上瓶塞後,水瓶的最大盛水量為\(V\).
(1)求\(V\)
(2)該同學發現:該品牌暖水瓶盛不同體積的熱水時,保溫效果不同.為了研究保溫效果最好時暖水瓶的盛水體積,做以下實驗:把盛有最大盛水量\(V\)的水的暖水瓶倒出不同體積的水,並記錄水瓶內不同體積水在不同時刻的水溫,發現水溫\(y\)(單位:℃)與時刻t滿足線性迴歸方程\(y=ct+d\),通過計算得到如表:
\(\begin{array}{|c|c|c|c|c|c|} \hline \text { 倒出體積 } x c m^{3} & 0 & 30 & 60 & 90 & 120 \\ \hline \text { 擬合結果 } & y=c_{1} t+d & y=c_{2} t+d & y=c_{3} t+d & y=c_{4} t+d & y=c_{5} t+d \\ \hline \text { 倒出體積 } x c m^{3} & 150 & 180 & 210 & \ldots & 450 \\ \hline \text { 擬合結果 } & y=c_{6} t+d & y=c_{7} t+d & y=c_{8} t+d & \ldots & y=c_{16} t+d \\ \hline \end{array}\)
注:表中倒出體積\(x\)(單位:\(cm^3\))是指從最大盛水量中倒出的那部分水的體積.其中:
\(\begin{array}{|c|c|c|c|c|c|c|} \hline C_{1} & C_{2} & C_{3} & C_{4} & C_{5} & C_{6} & C_{7} \\ \hline-1.4 & -1.3 & -1.2 & -1 & -1.1 & -0.9 & -0.8 \\ \hline \end{array}\)
\(w=|c|, w_{i}=\left|c_{i}\right|\)\(x_{i}=30(i-1)\) ,\(i=1 ,2 ,… ,16\).對於資料\((x_i ,w_i)\)\((i=1 ,2 ,… ,7)\),可求得迴歸直線為\(L_1:w=βx+α\),對於資料\((x_i ,w_i)\)\((i=8 ,9 ,… ,16)\),可求得迴歸直線為\(L_2:w=0.0009x+0.7\)
\((i)\)指出\(|c|\)的實際意義,並求出迴歸直線\(L_1\)的方程(參考資料:\(\dfrac{9}{2800} \approx 0.0032\))
\((ii)\)\(L_1\)\(L_2\)的交點橫座標即為最佳倒出體積,請問保溫瓶約盛多少體積水時(盛水體積保留整數,且\(π\)\(3.14\))保溫效果最佳?
附:對於一組資料\((u_1 ,v_1)\) ,\((u_2 ,v_2)\) ,… ,\((u_n ,v_n)\),其迴歸直線\(v=\hat{\beta} u+\hat{\alpha}\)中的斜率和截距的最小二乘估計分別為\(\hat{\beta}=\dfrac{\sum_{i=1}^{n}\left(u_{i}-\bar{u}\right)\left(v_{i}-\bar{v}\right)}{\sum_{i=1}^{n}\left(u_{i}-\bar{u}\right)^{2}}\)\(\hat{\alpha}=\bar{v}-\hat{\beta} \bar{u}\)

【解析】 (1)依題意得,半球的半徑為\(r=5cm\),體積為\(V_{1}=\dfrac{1}{2} \times \dfrac{4}{3} \times 125 \pi=\dfrac{250}{3} \pi \mathrm{cm}^{3}\)
大圓柱體積\(V_2=25π×20=500πcm^3\),小圓柱體積\(V_3=4π×2=8πcm^3\)
\(∴\)蓋上瓶塞後,水瓶的最大盛水量為\(\dfrac{250}{3} \pi+500 \pi+8 \pi+52 \pi-\dfrac{10}{3} \pi=640 \pi c m^{3}\)
(2)(i)\(|c|\)的實際意義為倒出\(xcm^3\)體積水時,暖水瓶內水的降溫速率;
\(|c|\)越小,降溫速率越小,保溫效果越好;\(|c|\)越大,降溫速率越大,保溫效果越差;
\(∵x_i=30(i-1)\) ,\(i=1 ,2 ,… ,7\),對於迴歸直線\(L_1:ω=βx+α\)
\(\because \bar{x}=\dfrac{x_{1}+x_{2}+\cdots+x_{7}}{7}=90\)\(\bar{\omega}=\dfrac{\omega_{1}+\omega_{2}+\cdots+\omega_{7}}{7}=1.1\)
\(\sum_{i=1}^{7}\left(x_{i}-\bar{x}\right)\left(\omega_{i}-\bar{\omega}\right)=-81\)\(\sum_{i=1}^{7}\left(x_{i}-\bar{x}\right)=25200\)
\(\therefore \hat{\beta}=\dfrac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(\omega_{i}-\bar{\omega}\right)}{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}=-\dfrac{81}{25200}=-\dfrac{9}{2800} \approx-0.0032\)
\(\hat{\alpha}=\bar{\omega}-\hat{\beta} \cdot \bar{x}=1.1+0.0032 \times 90=1.388\)
\(∴\)迴歸直線\(L_1\)的方程為\(ω=-0.0032x+1.388\)
\((ii)\)聯立\(\left\{\begin{array}{l} \omega=-0.0032 x+1.388 \\ \omega=0.0009 x+0.7 \end{array}\right.\),得\(x≈167.8\)
\(∴\)保溫瓶最佳倒出體積約為\(167.8cm^3\)
保溫瓶盛水體積約為\(640π-167.8≈640×3.14-167.8=1841.8cm^3\)
\(∴\)保溫瓶盛水體積約為\(1841.8cm^3\)時保溫效果最佳.
【點撥】
① 處理這些實際問題,理解題景與梳理每個變數之間的關係尤為重要.
② 若題中沒給到對應的資料,需要筆算,此時注意資料的對應關係避免用錯資料出現運算失誤,若在草稿紙上能列個表格會清晰很多.

【典題4】 近年來,隨著汽車消費的普及,二手車流通行業得到迅猛發展.某汽車交易市場對2017年成交的二手車的交易前的使用時間(以下簡稱“使用時間”)進行統計,得到如圖1所示的頻率分佈直方圖.在圖1對使用時間的分組中,將使用時間落入各組的頻率視為概率.

(1)若在該交易市場隨機選取\(3\)輛2017年成交的二手車,求恰有\(2\)輛使用年限在\((8 ,16]\)的概率;
(2)根據該汽車交易市場往年的資料,得到圖2所示的散點圖,其中\(x\)(單位:年)表示二手車的使用時間,\(y\)(單位:萬元)表示相應的二手車的平均交易價格.
①由散點圖判斷,可採用\(y=e^{a+b x}\)作為該交易市場二手車平均交易價格\(y\)關於其使用年限\(x\)的迴歸方程,相關資料如下表(表中\(Y_i=\ln y_i\)\(\bar{Y}=\dfrac{1}{10} \sum_{i=1}^{10} Y_{i}\)):
\(\begin{array}{|c|c|c|c|c|c|} \hline \bar{x} & \bar{y} & \bar{Y} & \sum_{i=1}^{10} x_{i} y_{i} & \sum_{i=1}^{10} x_{i} Y_{i} & \sum_{i=1}^{10} x_{i}{ }^{2} \\ \hline 5.5 & 8.7 & 1.9 & 301.4 & 79.75 & 385 \\ \hline \end{array}\)
試選用表中資料,求出\(y\)關於\(x\)的迴歸方程;
②該汽車交易市場擬定兩個收取佣金的方案供選擇.
甲:對每輛二手車統一收取成交價格的\(5\%\)的佣金;
乙:對使用\(8\)年以內(含\(8\)年)的二手車收取成交價格的\(4\%\)的佣金,對使用時間\(8\)年以上(不含\(8\)年)的二手車收取成交價格的\(10\%\)的佣金.
假設採用何種收取佣金的方案不影響該交易市場的成交量,根據迴歸方程和圖表1,並用各時間組的區間中點值代表該組的各個值.判斷該汽車交易市場應選擇哪個方案能獲得更多佣金.
附註:
①對於一組資料\((u_1 ,v_1)\) ,\((u_2 ,v_2)\),… ,\((u_n ,v_n)\),其迴歸直線\(v=α+βu\)的斜率和截距的最小二乘估計分別為\(\hat{\beta}=\dfrac{\sum_{i=1}^{n}\left(u_{i}-\bar{u}\right)\left(v_{i}-\bar{v}\right)}{\sum_{i=1}^{n}\left(u_{i}-\bar{u}\right)^{2}}, \hat{\alpha}=\bar{v}-\hat{\beta} \bar{u}\).
②參考資料:\(e^{2.95} \approx 19.1, e^{1.75} \approx 5.75, e^{0.55} \approx 1.73, e^{-0.65} \approx 0.52, e^{-1.85} \approx 0.16\)
【解析】 (1)由頻率分佈直方圖知,該汽車交易市場2017年成交的二手車使用時間在\((8 ,12]\)的頻率為\(0.07×4=0.28\),使用時間在\((12 ,16]\)的頻率為\(0.03×4=0.12\)
所以在該汽車交易市場2017年成交的二手車隨機選取\(1\)輛,其使用時間在\((8,16]\)的概率為\(0.28+0.12=0.4\)
所以所求的概率為\(P=C_3^2 0.4^2⋅(1-0.4)=0.288\)
(2)①由\(y=e^{a+b x}\)\(\ln y=a+bx\),則\(Y\)關於\(x\)的線性迴歸方程為\(Y=a+bx\)
\({\color{Red}{ (通過兩邊取對數,換元法,把非一元線性迴歸模型變換為一元線性迴歸模型) }}\)
由於\(\hat{b}=\dfrac{\sum_{i=1}^{10}\left(x_{i}-\bar{x}\right)\left(Y_{i}-\bar{Y}\right)}{\sum_{i=1}^{10}\left(x_{i}-\bar{x}\right)^{2}}=\dfrac{\sum_{i=1}^{10} x_{i} Y_{i}-10 \bar{x} \cdot \bar{Y}}{\sum_{i=1}^{10} x_{i}^{2}-10 \bar{x}^{2}}=\dfrac{79.75-10 \times 5.5 \times 1.9}{385-10 \times 5.5^{2}}=-0.3\)
\({\color{Red}{(題中給到的參考資料沒\sum_{i=1}^{10}\left(x_{i}-\bar{x}\right)\left(Y_{i}-\bar{Y}\right) , \sum_{i=1}^{10}\left(x_{i}-\bar{x}\right)^{2}}},\)\({\color{Red}{需要對公式\dfrac{\sum_{i=1}^{10}\left(x_{i}-\bar{x}\right)\left(Y_{i}-\bar{Y}\right)}{\sum_{i=1}^{10}\left(x_{i}-\bar{x}\right)^{2}}=\dfrac{\sum_{i=1}^{10} x_{i} Y_{i}-10 \bar{x} \cdot \bar{Y}}{\sum_{i=1}^{10} x_{i}^{2}-10 \bar{x}^{2}}進行轉化) }}\)
\(\hat{\alpha}=\bar{Y}-\hat{\beta} \cdot \bar{x}=1.9-(-0.3) \times 5.5=3.55\)
\(Y\)關於\(x\)的線性迴歸方程為\(\hat{Y}=3.55-0.3 x\)
所以\(y\)關於\(x\)的迴歸方程為\(\hat{y}=e^{3.55-0.3 x}\)
②根據頻率分佈直方圖和①中的迴歸方程,對成交的二手汽車可預測:
使用時間在(0 ,4]的頻率為\(0.05×4=0.2\)
對應的成交價格的預測值為\(e^{3.55-0.3 \times 2}=e^{2.95} \approx 19.1\)
\({\color{Red}{(取組中值2作為代表該組的值算出預測值,以下類似) }}\)
使用時間在\((4 ,8]\)的頻率為\(0.09×4=0.36\)
對應的成交價格預測值為\(e^{3.55-0.3 \times 6}=e^{1.75} \approx 5.75\)
使用時間在\((8 ,12]\)的頻率為\(0.07×4=0.28\)
對應的成交價格的預測值為\(e^{3.55-0.3 \times 10}=e^{0.55} \approx 1.73\)
使用時間在\((12 ,16]\)的頻率為\(0.03×4=0.12\)
對應的成交價格的預測值為\(e^{3.55-0.3 \times 14}=e^{-0.65} \approx 0.52\)
使用時間在\((16 ,20]\)的頻率為\(0.01×4=0.04\)
對應的成交價格的預測值為\(y e^{3.55-0.3 \times 18}=e^{-1.85} \approx 0.16\)
若採用甲方案,預計該汽車交易市場對於成交的每輛車可獲得的平均佣金為
\((0.2 \times 19.1+0.36 \times 5.75+0.28 \times 1.73+0.12 \times 0.52+0.04 \times 0.16) \times 5 \%\)
\(=0.32166≈0.32\)萬元;
若採用乙方案,預計該汽車交易市場對於成交的每輛車可獲得的平均佣金為
\((0.2 \times 19.1+0.36 \times 5.75) \times 4 \%+(0.28 \times 1.73+0.12 \times 0.52+0.04 \times 0.16) \times 10 \%\)
\(=0.29092≈0.29\)(萬元);
因為\(0.32>0.29\),所以採用甲方案能獲得更多佣金.
【點撥】
① 熟悉非一元線性迴歸模型變換為一元線性迴歸模型的基本套路;
② 對題中給予的資料,要認真梳理清楚,明確每個變數的實際意義,有些資料是“攪亂視聽”的,比如題中的\(\bar{y}=8.7\).

鞏固練習

1(★) 設一個線性迴歸方程\(\hat{y}=3+1.2 x\),當變數x每增加一個單位時,則\(y\)的變化情況正確的是(  )
A.\(y\)平均增加約\(1.2\)個單位
B.\(y\)平均增加約\(3\)個單位
C.\(y\)平均減少約\(1.2\)個單位
D.\(y\)平均減少約\(3\)個單位

2(★) 某運動製衣品牌為了成衣尺寸更精準,現選擇\(15\)名志願者,對其身高和臂展進行測量(單位:釐米),左圖為選取的\(15\)名志願者身高與臂展的折線圖,右圖為身高與臂展所對應的散點圖,並求得其迴歸方程為\(\hat{y}=1.16 x-30.75\),以下結論中不正確的為(  )

A.\(15\)名志願者身高的極差小於臂展的極差
B.\(15\)名志願者身高和臂展成正相關關係
C.可估計身高為\(190\)釐米的人臂展大約為\(189.65\)釐米
D.身高相差\(10\)釐米的兩人臂展都相差\(11.6\)釐米

3(★★) 【多選題】 5G技術的運營不僅提高了網路傳輸速度,更拓寬了網路資源的服務範圍.目前,我國加速了5G技術的融合與創新,前景美好!某手機商城統計了5個月的5G手機銷量,如表所示:
\(\begin{array}{|c|c|c|c|c|c|} \hline \text { 月份 } & 2020 \text { 年 } 6 \text { 月 } & 2020 \text { 年 } 7 \text { 月 } & 2020 \text { 年 } 8 \text { 月 } & 2020 \text { 年 } 9 \text { 月 } & 2020 \text { 年 } 10 \text { 月 } \\ \hline \text { 月份編號 } x & 1 & 2 & 3 & 4 & 5 \\ \hline \text { 銷量 } y / \text { 部 } & 52 & 95 & a & 185 & 227 \\ \hline \end{array}\)
\(y\)\(x\)線性相關,由上表資料求得線性迴歸方程為\(\hat{y}=44 x+10\),則下列說法正確的是(  )
A.5G手機的銷量逐月增加,平均每個月增加約\(10\)
B.\(a=151\)
C.\(y\)\(x\)正相關
D.預計12月份該手機商城的5G手機銷量約為\(318\)

4(★★) 已知某品牌的新能源汽車的使用年限\(x\)(單位:年)與維護費用\(y\)(單位:千元)之間有如下資料:
\(\begin{array}{|c|c|c|c|c|c|} \hline \text { 使用年限 } x \text { 單位:年) } & 2 & 4 & 5 & 6 & 8 \\ \hline \text { 維護費用 } y \text { (單位:千元) } & 3 & 4.5 & 6.5 & 7.5 & 9 \\ \hline \end{array}\)
\(x\)\(y\)之間具有線性相關關係,且\(y\)關於\(x\)的線性迴歸方程為\(\hat{y}=1.05 x+\hat{a}\).據此估計,當使用年限為\(7\)年時,維護費用約為 千元.
附:線性迴歸方程\(\hat{y}=\hat{b} x+\hat{a}\)中的係數,\(\hat{b}=\dfrac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}\) ,\(\hat{a}=\bar{y}-\hat{b} \bar{x}\)

5(★★) 科研人員在研製新冠肺炎疫苗過程中,利用小白鼠進行接種試驗,現收集了小白鼠接種時的用藥量\(x\)(單位:毫克)和有效度\(y\)的7組資料,得到如下散點圖及其統計量的值:
\(\begin{array}{|c|c|c|c|c|c|} \hline \bar{x} & \bar{y} & \bar{\omega} & \sum_{i=1}^{7}\left(x_{i}-\bar{x}\right)^{2} & \sum_{i=1}^{7}\left(\omega_{i}-\bar{\omega}\right)^{2} & \sum_{i=1}^{7}\left(\omega_{i}-\bar{\omega}\right)\left(y_{i}-\bar{y}\right) \\ \hline 2.7 & 13.4 & 10.5 & 182 & 54 & 86.4 \\ \hline \end{array}\)
其中\(ω_i=x_i^2\)\(\bar{\omega}=\dfrac{1}{7} \sum_{i=1}^{7} \omega_{i}\)
(Ⅰ)根據散點圖判斷,\(y=a+bx\)\(y=c+dx^2\)哪一個更適合作為有效度\(y\)與用藥量\(x\)的迴歸方程型別?(給出判斷即可,不必說明理由)
(Ⅱ)根據(Ⅰ)的判斷結果及表中資料建立\(y\)關於\(x\)的迴歸方程.
(Ⅲ)若要使有效度達到\(75\),則用藥量至少為多少毫克?

6(★★★) 網上購物就是通過網際網路檢索商品資訊,並通過電子訂購單發出購物請求,廠商通過郵購的方式發貨或通過快遞公司送貨上門,貨到後通過銀行轉賬、微信或支付寶支付等方式線上匯款.根據2019年中國消費者資訊研究,超過\(40\%\)的消費者更加頻繁地使用網上購物,使得網上購物和送貨上門的需求量激增,越來越多的消費者也首次通過第三方APP、品牌官方網站和微信社群等平臺進行購物.某天貓專營店統計了2020年8月5日至9日這5天到該專營店購物的人數\(y\)和時間第\(x\),天間的資料,列表如表:
\(\begin{array}{|c|c|c|c|c|c|} \hline x_{i} & 1 & 2 & 3 & 4 & 5 \\ \hline y_{i} & 75 & 84 & 93 & 98 & 100 \\ \hline \end{array}\)
(1)由表中給出的資料是否可用線性迴歸模型擬合人數\(y\)與時間\(x\)之間的關係?若可用,估計8月10日到該專營店購物的人數(人數用四捨五入法取整數;若\(|r|>0.75\),則線性相關程度很高,可用線性迴歸模型擬合,計算r時精確到\(0.01\)).
參考資料:\(\sqrt{4340} \approx 65.88\)
附:相關係數\(r=\dfrac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sqrt{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2} \sum_{i=1}^{n}\left(y_{i}-\bar{y}\right)^{2}}}\)
迴歸直線方程的斜率:\(\hat{b}=\dfrac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}\)\(\hat{a}=\bar{y}-\hat{b} \bar{x}\)
(2)運用分層抽樣的方法從第1天和第5天到該專營店購物的人中隨機抽取\(7\)人,再從這\(7\)人中任取\(3\)人進行獎勵,求這\(3\)人取自不同天的概率;
(3)該專營店為了吸引顧客,推出兩種促銷方案:
方案一,購物金額每滿\(100\)元可減\(10\)元;
方案二,一次性購物金額超過\(800\)元可抽獎三次,每次中獎的概率均為\(\dfrac{1}{3}\),且每次抽獎互不影響,中獎一次打\(9\)折,中獎兩次打\(8\)折,中獎三次打\(6\)折.
某顧客計劃在此專營店購買\(1000\)元的商品,請從實際付款金額的數學期望的角度分析選哪種方案更優惠.

7(★★★) 中國茶文化博大精深,茶水的口感與茶葉型別以及水溫有關.經驗表明,若某種綠茶用85℃的水泡製,等到茶水溫度降至60℃時飲用,則口感最佳.某研究小組通過測量(室溫恆為20℃),到下面的表格及散點圖:
\(\begin{array}{|c|c|c|c|c|c|} \hline \text { 泡製時間 } x / \min & 0 & 1 & 2 & 3 & 4 \\ \hline \text { 水溫 } y /{ }^{\circ} \mathrm{C} & 85 & 79 & 74 & 71 & 65 \\ \hline \end{array}\)
(1)小組成員根據散點圖並考慮茶水溫度降到室溫(即20℃)就不能再降的事實,決定選擇函式模型\(y=kc^x+20(x≥0)\)來表示\(x\)\(y\)的關係.
①令\(z=\ln (y-20)\),求出\(z\)關於\(x\)的線性迴歸方程;
②利用①的結論,求出\(y=kc^x+20(x≥0)\)中的\(k\)\(c\)的值.
(2)你認為該品種綠茶用85℃的水泡製多久後飲用,口感最佳?
參考資料:\(\ln65≈4.2\)\(\ln59≈4.1\)\(\ln54≈4.0\)\(\ln51≈3.9\)\(ln45≈3.8\)\(\log 0.90 .6 \approx 4.8\)\(e^{-0.1} \approx 0.9\)\(e^{4.2} \approx 66.7, \dfrac{400}{667} \approx 0.6\)
參考公式:線性迴歸方程\(\hat{y}=\hat{b} x+\hat{a}\)中,\(\widehat{b}=\dfrac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}\)\(\hat{a}=\bar{y}-\hat{b} \bar{x}\)

答案

1【答案】\(A\)
【解析】 \(∵\)直線迴歸方程為\(\hat{y}=3+1.2 x\)
\(∴\)變數\(x\)增加一個單位時,函式值要平均增加\(1.2\)個單位,
故選:\(A\)
2【答案】\(D\)
【解析】 對於\(A\),身高極差大約是\(25\),臂展極差大於等於\(30\),故\(A\)正確;
對於\(B\),很明顯根據散點圖以及迴歸方程得到,身高矮展臂就會短一些,身高高一些,
展臂就會長一些,故\(B\)正確;
對於\(C\),身高為\(190\)釐米,代入迴歸方程可得展臂等於\(189.65\)釐米,但不是準確值,故\(C\)正確;
對於\(D\),身高相差\(10\)釐米的兩人展臂的估計值相差\(11.6\)釐米,但不是準確值,
迴歸方程上的點並不都是準確的樣本點,故\(D\)錯誤;
故選:\(D\)
3【答案】\(BCD\)
【解析】 線性迴歸方程為\(\hat{y}=44 x+10\),5G手機的銷量逐月增加,平均每個月增加約\(44\)臺,所以\(A\)不正確;
根據表中資料,可得\(\bar{x}=\dfrac{1+2+3+4+5}{5}=3\)\(\therefore \bar{y}=44 \times 3+10=142\)
於是,\(52+95+a+185+227=142×5=710\),即\(a=151\),故\(B\)正確;
由迴歸方程中\(x\)的係數大於\(0\),可知\(y\)\(x\)正相關,且相關係數\(r>0\),故\(C\)正確;
12月份時,\(x=7\)\(\hat{y}=44 \times 7+5=318\)部,故\(D\)正確.
故選:\(BCD\)
4【答案】\(8.2\)
【解析】 由題意,\(\bar{x}=\dfrac{2+4+5+6+8}{5}=5\)\(\bar{y}=\dfrac{3+4.5+6.5+7.5+9}{5}=\dfrac{30.5}{5}=6.1\)
因為迴歸直線經過樣本中心,所以\(6.1=1.05 \times 5+\hat{a}\),解得\(\hat{a}=0.85\)
\(\hat{y}= 1.05 x+0.85\)
當使用年限為\(7\)年時,維護費用約為\(1.05×7+0.85=8.2\)千元.
5【答案】\((1) y=c+d x^{2} \qquad (2) y=-3.4+1.6 x^{2} \qquad (3) 7\)
【解析】 (Ⅰ)\(y=c+d x^{2}\)更適合作為有效度\(y\)與用藥量\(x\)的迴歸方程型別.
(Ⅱ)令\(\omega_{i}=x_{i}^{2}\),則\(y=c+d \omega\)
\(\therefore \hat{d}=\dfrac{\sum_{i=1}^{7}\left(\omega_{i}-\bar{\omega}\right)\left(y_{i}-\bar{y}\right)}{\sum_{i=1}^{7}\left(\omega_{i}-\bar{\omega}\right)^{2}}=\dfrac{86.4}{54}=1.6\)\(\hat{c}=\bar{y}-d \bar{\omega}=13.4-1.6 \times 10.5=-3.4\)
\(\therefore \hat{y}=-3.4+1.6 \omega\)
\(y\)關於\(x\)的迴歸方程為\(\hat{y}=-3.4+1.6 x^{2}\)
(Ⅲ)當\(\hat{y}=75\)時,有\(75=-3.4+1.6x^2\),解得\(x=7\)
故要使有效度達到\(75\),則用藥量至少為\(7\)毫克.
6【答案】\((1)109\) \((2)\dfrac{6}{7}\) \((3)\)選項方案二更划算
【解析】 (1)由表中的資料可得,\(\bar{x}=3\)\(\bar{y}=90\)
\(\sum_{i=1}^{5}\left(x_{i}-\bar{x}\right)^{2}=10\)\(\sum_{i=1}^{5}\left(y_{i}-\bar{y}\right)=434\)\(\sum_{i=1}^{5}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)=64\)
\(r=\dfrac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sqrt{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2} \sum_{i=1}^{n}\left(y_{i}-\bar{y}\right)^{2}}}=\dfrac{64}{\sqrt{4340}} \approx 0.97>0.75\)
所以變數\(y\)\(x\)具有很強的線性相關性,
故可以用線性迴歸模型擬合人數\(y\)與天數\(x\)之間的關係,
所以\(\hat{b}=\dfrac{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)\left(y_{i}-\bar{y}\right)}{\sum_{i=1}^{n}\left(x_{i}-\bar{x}\right)^{2}}=\dfrac{64}{10}=6.4\)\(\hat{a}=\bar{y}-\hat{b} \bar{x}=90-6.4 \times 3=70.8\)
所以\(\hat{y}=6.4 x+70.8\)
\(x=6\),則有\(\hat{y}=109.2\)
故8月10日到該專營店購物的人數為\(109\)人;
(2)因為\(75:100=3:4\)
所以第1天和第5天取的人數分別為\(3\)人和\(4\)人,
3人取自不同天的種數為\(C_{3}^{1} C_{4}^{2}+C_{3}^{2} C_{4}^{1}\)
故概率為\(P=\dfrac{C_{3}^{1} C_{4}^{2}+C_{3}^{2} C_{4}^{1}}{C_{7}^{3}}=\dfrac{6}{7}\)
(3)若選方案一,則需付款\(1000-100=900\)元,
若選方案二,設需付款\(X\)元,則\(X\)的可能取值為\(600,800,900,1000\)
相應的概率為\(P(X=600)=C_{3}^{3}\left(\dfrac{1}{3}\right)^{3}=\dfrac{1}{27}\)\(P(X=800)=C_{3}^{2} \times\left(\dfrac{1}{3}\right)^{2} \times \dfrac{2}{3}=\dfrac{6}{27}\)
\(P(X=900)=C_{3}^{1} \times \dfrac{1}{3} \times\left(\dfrac{2}{3}\right)^{2}=\dfrac{12}{27}\)\(P(X=1000)=C_{3}^{0} \times\left(\dfrac{2}{3}\right)^{3}=\dfrac{8}{27}\)
所以\(E(X)=600 \times \dfrac{1}{27}+800 \times \dfrac{6}{27}+900 \times \dfrac{12}{27}+1000 \times \dfrac{8}{27}=\dfrac{24200}{27}<900\)
故選項方案二更划算.
7【答案】\(\begin{array}{lll} (1) ①\hat{z}=-0.1 x+4.2 \quad ② c=0.9, k=66.7 & \text { (2) } 4.8 \min \end{array}\)
【解析】 (1)①由已知得出\(x\)\(z\)的關係,如下表:
\(\begin{array}{|c|c|c|c|c|c|} \hline \text { 泡製時間 } x / \min & 0 & 1 & 2 & 3 & 4 \\ \hline Z & 4.2 & 4.1 & 4.0 & 3.9 & 3.8 \\ \hline \end{array}\)
設線性迴歸方程\(\hat{z}=\hat{b} x+\hat{a}\)
由題意,得\(\bar{x}=2, \quad \bar{z}=4\)
\(\therefore \sum_{i=1}^{5}\left(x_{i}-\bar{x}\right)\left(z_{i}-\bar{z}\right)=(-2) \times 0.2+(-1) \times 0.1+1 \times(-0.1)+2 \times(-0.2)=-1\)
\(\sum_{i=1}^{5}\left(x_{i}-\bar{x}\right)^{2}=(-2)^{2}+(-1)^{2}+1^{2}+2^{2}=10\)
\(\hat{b}=\dfrac{\sum_{i=1}^{5}\left(x_{i}-\bar{x}\right)\left(z_{i}-\bar{z}\right)}{\sum_{i=1}^{5}\left(x_{i}-\bar{x}\right)^{2}}=\dfrac{-1}{10}=-0.1\)
\(\hat{a}=\bar{z}-\hat{b} \bar{x}= 4+0.1 \times 2=4.2\)
\(z\)關於\(x\)的線性迴歸方程為\(\hat{z}=-0.1 x+4.2\)
②由\(y=k c^{x}+20(x \geq 0)\),得\(y-20=k c^{x}(x \geq 0)\)
兩邊取對數得,\(\ln (y-20)=\ln k+x \ln c\)
利用①的結論得:\(\ln c=-0.1, \quad \ln k=4.2\)
\(\therefore c=e^{-0.1} \approx 0.9, \quad k=e^{4.2} \approx 66.7\)
(2)由(1)得,\(y=66.7 \times 0.9^{x}+20(x \geq 0)\)
\(y=60\),得\(x \approx \log _{0.9} 0.6 \approx 4.8\)
\(∴\)該品種綠茶用85℃的水泡製\(4.8min\)後飲用,口感最佳.

作者:ZhaoGui,廣東湛江,微信mathszhg,歡迎交流

出處:貴哥講高中數學

宣告:本部落格版權歸[貴哥講高中數學]所有