一元線性回歸模型課件高二下學期數學人教A版選擇性_第1頁
一元線性回歸模型課件高二下學期數學人教A版選擇性_第2頁
一元線性回歸模型課件高二下學期數學人教A版選擇性_第3頁
一元線性回歸模型課件高二下學期數學人教A版選擇性_第4頁
一元線性回歸模型課件高二下學期數學人教A版選擇性_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

8.2.1一元線性回歸模型通過前面的學習我們已經了解到,根據成對樣本數據的散點圖和樣本相關系數,可以推斷兩個變量是否存在相關關系、是正相關還是負相關,以及線性相關程度的強弱等.進一步地,如果能像建立函數模型刻畫兩個變量之間的確定性關系那樣,通過建立適當的統(tǒng)計模型刻畫兩個隨機變量的相關關系,那么我們就可以利用這個模型研究兩個變量之間的隨機關系,并通過模型進行預測.下面我們研究當兩個變量線性相關時,如何利用成對樣本數據建立統(tǒng)計模型,并利用模型進行預測的問題.創(chuàng)設情境問題1:生活經驗告訴我們,兒子的身高與父親的身高不僅線性相關,而且還是正相關,即父親的身高較高時,兒子的身高通常也較高.為了進一步研究兩者之間的關系,有人調查了14名男大學生的身高及其父親的身高,得到的數據如下表所示.編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182探究:一元線性回歸模型思考1:根據表中的數據,兒子身高和父親身高這兩個變量之間的關系可以用函數模型刻畫嗎?…172…父親身高…176174…兒子身高兒子身高不是父親身高的函數61721768172174編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182思考1:根據表中的數據,兒子身高和父親身高這兩個變量之間的關系可以用函數模型刻畫嗎?61721768172174…170…兒子身高…173169…父親身高父親身高不是兒子身高的函數31731709169170利用前面表示數據的方法,以橫軸表示父親身高、縱軸表示兒子身高建立直角坐標系,再將表中的成對樣本數據表示為散點圖,如右圖所示.思考2:經過剛才的分析,你覺得兒子身高與父親身高的關系是怎樣的?兒子身高與父親身高不是函數關系,而是相關關系.兒子身高與父親身高不是函數關系,而是相關關系.追問:兒子身高與父親身高的關系是正相關還是負相關?是線性相關還是曲線相關?隨著父親身高的增加,兒子身高呈增加的趨勢,所以是正相關.兒子身高與父親身高呈正線性相關關系.思考3:你能否進一步驗證剛才的結論?

樣本相關系數為:表明兒子身高和父親身高正線性相關,且相關程度較高.思考4:除父親身高外,還有哪些因素影響兒子的身高?隨機誤差e母親身高生活環(huán)境飲食習慣體育鍛煉

……追問:如何理解隨機誤差e對兒子身高的影響?假設沒有隨機誤差,則兒子身高Y只受父親身高x影響,則事實上,相關系數,故也可以記作思考5:隨機誤差e有哪些特征?隨機誤差e是一個隨機變量①可取正或取負②有些無法測量③不可事先設定因為誤差是隨機的,即取各種正負誤差的可能性一樣,所以它們均值的理想狀態(tài)應該為0.追問:為什么要假設E(e)=0,而不假設其為某個不為0的常數?思考6:你能否考慮到上述隨機因素的作用,用類似于函數的表達式,表達兒子身高與父親身高的關系嗎?若用x表示父親身高,Y表示兒子身高,e表示隨機誤差.假定隨機誤差e的均值為0,方差為與父親身高無關的定值σ2,則它們之間的關系可以表示為我們稱(1)式為Y關于x的一元線性回歸模型.其中,Y稱為因變量或響應變量,x稱為自變量或解釋變量;a和b為模型的未知參數,a稱為截距參數,b稱為斜率參數;e是Y與bx+a之間的隨機誤差.模型中的Y也是隨機變量,其值雖不能由變量x的值確定,但卻能表示為bx+a與e的和,前一部分由x所確定,后一部分是隨機的.如果e=0,那么Y與x之間的關系就可用一元線性函數模型來描述.函數模型與回歸模型有什么區(qū)別?追問1:你能結合父親與兒子身高的實例,說明回歸模型(1)的意義?

追問2:對于父親身高為xi的某一名男大學生,他的身高yi一定是bxi+a嗎?

思考7:你能結合具體實例解釋產生模型(1)中隨機誤差項的原因嗎?在研究兒子身高與父親身高的關系時,產生隨機誤差e的原因有:(1)除父親身高外,其他可能影響兒子身高的因素,比如母親身高、生活環(huán)境、飲食習慣和鍛煉時間等;(2)在測量兒子身高時,由于測量工具、測量精度所產生的測量誤差;(3)實際問題中,我們不知道兒子身高和父親身高的相關關系是什么,可以利用一元線性回歸模型來近似這種關系,這種近似也是產生隨機誤差e的原因.在一元線性回歸模型y=bx+a+e中,隨機誤差e產生的原因有:(1)所用的確定性函數不恰當引起的誤差;(2)忽略了某些因素的影響;(3)存在觀測誤差.歸納總結課本107頁說明函數模型與回歸模型的區(qū)別,并分別舉出兩個應用函數模型和回歸模型的例子.解:函數模型刻畫的是變量之間具有的函數關系,是一種確定性的關系.回歸模型刻畫的是變量之間具有的相關關系,不是一種確定性的關系,即回歸模型刻畫的是兩個變量之間的隨機關系.例如,路程與速度的關系、正方體體積與邊長的關系可以應用函數模型刻畫;體重與身高的關系、冷飲銷量與氣溫的關系可以應用回歸模型刻畫.練習2.在一元線性回歸模型(1)中,參數b的含義是什么?解:參數b的含義可以解釋為解釋變量x對響應變量Y的均值的影響,變量x每增加1個單位,響應變量Y的均值將增加b個單位.例如,教科書中父親身高為175cm的兒子身高的均值比父親身高為174cm的兒子身高的均值高出0.839cm.注意:因為響應變量Y最終取值,除了受變量x的影響,還要受隨機誤差e的影響,所以不能解釋成解釋變量x每增加一個單位,響應變量Y增加b個單位.課本107頁例:若某地財政收入x與支出y滿足一元線性回歸模型y=bx+a+e(單元:億元),其中b=0.7,a=3,|e|≤0.5,如果今年該地區(qū)財政收入10億元,年支出預計不會超過多少?解:因為財政收入x與支出y滿足一元線性回歸模型y=bx+a+e,其中b=0.7,a=3,所以得到

y=0.7x+3+e,當x=10時,得y=0.7×10+3+e=10+e,而|e|≤0.5,即-0.5≤e≤0.5,所以9.5≤y≤10.5,所以年支出預計不會超過10.5億元.例題隨堂檢測1.在線性回歸模型y=bx+a+e中,下列說法正確的是(

)A.y=bx+a+e是一次函數B.因變量y是由自變量x唯一確定的C.因變量y除了受自變量x的影響外,可能還受到其它因素的影響,這些因素會導致隨機誤差e的產生D.隨機誤差e是由于計算不準確造成的,可通過精確計算避免隨機誤差e的產生解析:選項A,在線性回歸模型y=bx+a+e中,方程表示的不是函數關系,因此不是一次函數,故A錯誤;選項B,因變量y不是由自變量x唯一確定的,故B錯誤;選項D,隨機誤差是不能避免的,只能將誤差縮小,但是不能沒有誤差,故D錯誤,只有選項C成立.2.判斷下列變量間哪些能用函數模型刻畫,哪些能用回歸模型刻畫?(1)某公司的銷售收入和廣告支出;(2)某城市寫字樓的出租率和每平米月租金;(3)航空公司的顧客投訴次數和航班正點率;(4)某地區(qū)的人均消費水平和人均國內生產總值(GDP);(5)學生期末考試成績和考前用于復習的時間;(6)一輛汽車在某段路程中的行駛速度和行駛時間;(7)正方形的面積與周長.解:(1)(2)(3)(4)(5)回歸模型,(6)(7)函數模型.時間x(s)5101520304050607090120深度Y(μm)581013161719232529462.建立一元線性回歸模型的步驟1.一元線性回歸模型(1)與函數模型的區(qū)別(2)隨機誤差產生的原因及分布定性分析定量分析函數關系或相關關系或沒有關系課堂小結其中,Y稱為因變量或響應變量,x稱為自變量或解釋變量;a和b為模型的未知參數,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論