8.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第1頁
8.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第2頁
8.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第3頁
8.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第4頁
8.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì)課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

8.2一元線性回歸模型及其應(yīng)用8.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì)復(fù)習(xí)回顧1、經(jīng)驗(yàn)回歸方程:

我們將稱為Y關(guān)于x的經(jīng)驗(yàn)回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)回歸直線.

這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法.2、最小二乘估計(jì):經(jīng)驗(yàn)回歸方程中的參數(shù)

計(jì)算公式為:例題解析1、經(jīng)驗(yàn)表明,對(duì)于同一樹種,一般樹的胸徑(樹的主干在地面以上1.3m處的直徑)越大,樹就越高.由于測(cè)量樹高比測(cè)量胸徑困難,因此研究人員希望由胸徑預(yù)測(cè)樹高.在研究樹高與胸徑之間的關(guān)系時(shí),某林場(chǎng)收集了某種樹的一些數(shù)據(jù)如下表所示,試根據(jù)這些數(shù)據(jù)建立樹高關(guān)于胸徑的經(jīng)驗(yàn)回歸方程.編號(hào)123456789101112胸徑/cm18.120.122.224.426.028.329.632.433.735.738.340.2樹高/m18.819.221.021.022.122.122.422.623.024.323.924.7解:以胸徑為橫坐標(biāo),樹高為縱坐標(biāo)作散點(diǎn)圖

在右圖中,散點(diǎn)大致分布在一條從左下角到右上角的直線附近,表明兩個(gè)變量線性相關(guān),并且是正相關(guān),因此可以用一元線性回歸模型刻畫樹高與胸徑之間的關(guān)系.一元線性回歸模型的應(yīng)用例題解析1、經(jīng)驗(yàn)表明,對(duì)于同一樹種,一般樹的胸徑(樹的主干在地面以上1.3m處的直徑)越大,樹就越高.由于測(cè)量樹高比測(cè)量胸徑困難,因此研究人員希望由胸徑預(yù)測(cè)樹高.在研究樹高與胸徑之間的關(guān)系時(shí),某林場(chǎng)收集了某種樹的一些數(shù)據(jù)如下表所示,試根據(jù)這些數(shù)據(jù)建立樹高關(guān)于胸徑的經(jīng)驗(yàn)回歸方程.編號(hào)123456789101112胸徑/cm18.120.122.224.426.028.329.632.433.735.738.340.2樹高/m18.819.221.021.022.122.122.422.623.024.323.924.7解:用d表示胸徑,h表示樹高,根據(jù)據(jù)最小二乘法,計(jì)算可得經(jīng)驗(yàn)回歸方程為:相應(yīng)的經(jīng)驗(yàn)回歸直線如圖所示.一元線性回歸模型的應(yīng)用例題解析殘差分析:根據(jù)經(jīng)驗(yàn)回歸方程,由胸徑的數(shù)據(jù)可以計(jì)算出樹高的預(yù)測(cè)值(精確到0.1)以及相應(yīng)的殘差,如下表所示.一元線性回歸模型的應(yīng)用編號(hào)胸徑/cm樹高觀測(cè)值/m樹高預(yù)測(cè)值/m殘差/m118.118.819.4-0.6220.119.219.9-0.7322.221.020.40.6424.421.020.90.1526.022.121.30.8628.322.121.90.2729.622.422.20.2832.422.622.9-0.3933.723.023.2-0.21035.724.323.70.61138.323.924.4-0.51240.224.724.9-0.2例題解析以胸徑為橫坐標(biāo),殘差為縱坐標(biāo),作殘差圖,得到下圖.一元線性回歸模型的應(yīng)用30252015-1.0-0.50.00.51.0·······殘差/m·····354045胸徑/cm觀察殘差表和殘差圖,可以看到殘差的絕對(duì)值最大是0.8,所有殘差分布在以橫軸為對(duì)稱軸、寬度小于2的帶狀區(qū)域內(nèi).可見經(jīng)驗(yàn)回歸方程較好地刻畫了樹高與胸徑的關(guān)系,我們可以根據(jù)經(jīng)驗(yàn)回歸方程由胸徑預(yù)測(cè)樹高.例題解析2、人們常將男子短跑100m的高水平運(yùn)動(dòng)員稱為“百米飛人”.下表給出了1968年之前男子短跑100m世界紀(jì)錄產(chǎn)生的年份和世界紀(jì)錄的數(shù)據(jù).試依據(jù)這些成對(duì)數(shù)據(jù),建立男子短跑100m世界紀(jì)錄關(guān)于紀(jì)錄產(chǎn)生年份的經(jīng)驗(yàn)回歸方程一元線性回歸模型的應(yīng)用編號(hào)12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.95解:以成對(duì)數(shù)據(jù)中的世界紀(jì)錄產(chǎn)生年份為橫坐標(biāo),世界紀(jì)錄為縱坐標(biāo)作散點(diǎn)圖,得到下圖

在左圖中,散點(diǎn)看上去大致分布在一條直線附近,似乎可用一元線性回歸模型建立經(jīng)驗(yàn)回歸方程.例題解析2、人們常將男子短跑100m的高水平運(yùn)動(dòng)員稱為“百米飛人”.下表給出了1968年之前男子短跑100m世界紀(jì)錄產(chǎn)生的年份和世界紀(jì)錄的數(shù)據(jù).試依據(jù)這些成對(duì)數(shù)據(jù),建立男子短跑100m世界紀(jì)錄關(guān)于紀(jì)錄產(chǎn)生年份的經(jīng)驗(yàn)回歸方程一元線性回歸模型的應(yīng)用編號(hào)12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.95解:用Y表示男子短跑100m的世界紀(jì)錄,t表示紀(jì)錄產(chǎn)生的年份,利用一元線性回歸模型來刻畫世界紀(jì)錄和世界紀(jì)錄產(chǎn)生年份之間的關(guān)系.根據(jù)最小二乘法,由表中的數(shù)據(jù)得到經(jīng)驗(yàn)回歸方程為:

將經(jīng)驗(yàn)回歸直線疊加到散點(diǎn)圖,得到下圖:從圖中可以看到,經(jīng)驗(yàn)回歸方程較好地刻畫了散點(diǎn)的變化趨勢(shì),請(qǐng)?jiān)僮屑?xì)觀察圖形,你能看出其中存在的問題嗎自主探究思考1:從圖中可以看到,經(jīng)驗(yàn)回歸方程較好地刻畫了散點(diǎn)的變化趨勢(shì),請(qǐng)?jiān)僮屑?xì)觀察圖形,你能看出其中存在的問題嗎

第一個(gè)世界紀(jì)錄所對(duì)應(yīng)的散點(diǎn)遠(yuǎn)離經(jīng)驗(yàn)回歸直線,并且前后兩時(shí)間段中的散點(diǎn)都在經(jīng)驗(yàn)回歸直線的上方,中間時(shí)間段的散點(diǎn)都在經(jīng)驗(yàn)回歸直線的下方.

這說明散點(diǎn)并不是隨機(jī)分布在經(jīng)驗(yàn)回歸直線的周圍,而是圍繞著經(jīng)驗(yàn)回歸直線有一定的變化規(guī)律,即成對(duì)樣本數(shù)據(jù)呈現(xiàn)出明顯的非線性相關(guān)的特征.自主探究思考2:你能對(duì)模型進(jìn)行修改,以使其更好地反映散點(diǎn)的分布特征嗎?仔細(xì)觀察右圖,可以發(fā)現(xiàn)散點(diǎn)更趨向于落在中間下凸且遞減的某條曲線附近.回顧已有的函數(shù)知識(shí),可以發(fā)現(xiàn)函數(shù)y=-lnx的圖象具有類似的形狀特征

注意到100m短跑的第一個(gè)世界紀(jì)錄產(chǎn)生于1896年,因此可以認(rèn)為散點(diǎn)是集中在曲線y=f(t)=c1+c2ln(t-1895)的周圍,其中c1、c2為未知參數(shù),且c2<0.自主探究思考3:這是一個(gè)非線性經(jīng)驗(yàn)回歸函數(shù),如何利用成對(duì)數(shù)據(jù)估計(jì)參數(shù)c1、c2y=f(t)=c1+c2ln(t-1895)為了利用一元線性回歸模型估計(jì)參數(shù)參數(shù)c1、c2,引進(jìn)一個(gè)中間變量x,令x=ln(t-1895),則Y=c2x+c1.編號(hào)12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29記錄/s11.8010.6010.4010.3010.2010.1010.009.95通過x=ln(t-1895),將年份變量數(shù)據(jù)進(jìn)行變換,得到新的成對(duì)數(shù)據(jù),如下表.自主探究得到散點(diǎn)圖如下:編號(hào)12345678x0.002.833.263.563.714.114.174.29記錄/s11.8010.6010.4010.3010.2010.1010.009.95由表中的數(shù)據(jù)得到經(jīng)驗(yàn)回歸方程為:在上圖中畫出經(jīng)驗(yàn)回歸直線,如圖所示.上圖表明,經(jīng)驗(yàn)回歸方程對(duì)于成對(duì)數(shù)據(jù)具有非常好的擬合精度.將x=ln(t-1895)代入:自主探究思考4:對(duì)于通過創(chuàng)紀(jì)錄時(shí)間預(yù)報(bào)世界紀(jì)錄的問題,我們建立了兩個(gè)回歸模型,得到了兩個(gè)回歸方程,你能判斷哪個(gè)回歸方程擬合的精度更好嗎?(1)直接觀察法:在同一坐標(biāo)系中畫出成對(duì)數(shù)據(jù)散點(diǎn)圖、非線性經(jīng)驗(yàn)回歸方程②的圖象(藍(lán)色)以及經(jīng)驗(yàn)回歸方程①的圖象(紅色).我們發(fā)現(xiàn),散點(diǎn)圖中各散點(diǎn)都非??拷诘膱D象,表明非線性經(jīng)驗(yàn)回歸方程②對(duì)于原始數(shù)據(jù)的擬合效果遠(yuǎn)遠(yuǎn)好于經(jīng)驗(yàn)回歸方程①.自主探究思考4:對(duì)于通過創(chuàng)紀(jì)錄時(shí)間預(yù)報(bào)世界紀(jì)錄的問題,我們建立了兩個(gè)回歸模型,得到了兩個(gè)回歸方程,你能判斷哪個(gè)回歸方程擬合的精度更好嗎?(2)殘差分析:殘差平方和越小,模型擬合效果越好.殘差平方和:Q2明顯小于Q1,說明非線性回歸方程的擬合效果要優(yōu)于線性回歸方程.自主探究思考4:對(duì)于通過創(chuàng)紀(jì)錄時(shí)間預(yù)報(bào)世界紀(jì)錄的問題,我們建立了兩個(gè)回歸模型,得到了兩個(gè)回歸方程,你能判斷哪個(gè)回歸方程擬合的精度更好嗎?(3)利用決定系數(shù)R2刻畫回歸效果..R2越大,表示殘差平方和越小,即模型的擬合效果越好R2越小,表示殘差平方和越大,即模型的擬合效果越差.①和②的R2分別為0.7325和0.9983顯然0≤R2≤1,R2越接近1,則線性回歸刻畫的效果越好.在一元線性回歸模型中R2=r2,即決定系數(shù)R2等于響應(yīng)變量與解釋變量的樣本相關(guān)系數(shù)r的平方.概念講解分析模型的回歸效果方法:(2)殘差平方和(1)殘差分析好的回歸方程對(duì)應(yīng)的殘差散點(diǎn)圖應(yīng)是均勻地分布在橫軸兩側(cè)的帶狀區(qū)域內(nèi).且?guī)顓^(qū)域越窄,說明模型擬合效果越好.列殘差表畫殘差圖(3)決定系數(shù)R2法殘差平方和越小,說明模型擬合效果越好.R2越大,說明模型擬合效果越好.概念講解建立線性回歸模型的基本步驟(1)確定研究對(duì)象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是響應(yīng)變量.(2)畫出解釋變量與響應(yīng)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等).(3)由經(jīng)驗(yàn)確定回歸方程的類型.(4)按一定規(guī)則(如最小二乘法)估計(jì)經(jīng)驗(yàn)回歸方程中的參數(shù).(5)得出結(jié)果后需進(jìn)行線性回歸分析.①殘差平方和越小,模型的擬合效果越好.②決定系數(shù)R2取值越大,說明模型的擬合效果越好.注意:若題中給出了檢驗(yàn)回歸方程是否理想的條件,則根據(jù)題意進(jìn)行分析檢驗(yàn)即可.概念講解解決非線性回歸問題的方法及步驟(1)確定變量:確定解釋變量為x,響應(yīng)變量為y;(2)畫散點(diǎn)圖:通過觀察散點(diǎn)圖并與學(xué)過的函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對(duì)數(shù)函數(shù)、二次函數(shù)、反比例函數(shù)等)作比較,選取擬合效果好的函數(shù)模型;(3)變量置換:通過變量置換把非線性回歸問題轉(zhuǎn)化為線性回歸問題;(4)分析擬合效果:通過計(jì)算決定系數(shù)來判斷擬合效果;(5)寫出非線性經(jīng)驗(yàn)回歸方程.隨堂練習(xí)1、一只藥用昆蟲的產(chǎn)卵數(shù)y與一定范圍內(nèi)的溫度x有關(guān),現(xiàn)收集了6組觀測(cè)數(shù)據(jù)列于表中:溫度x/℃212324272932產(chǎn)卵數(shù)y/個(gè)61120275777經(jīng)計(jì)算得:線性回歸殘差的平方和:其中xi、yi分別為觀測(cè)數(shù)據(jù)中的溫度和產(chǎn)卵數(shù),i=1,2,3,4,5,6.e8.0605≈3167(1)若用線性回歸模型擬合,求y關(guān)于x的回歸方程

(精確到0.1);(2)若用非線性回歸模型擬合,求得y關(guān)于x回歸方程為

,且決定系數(shù)R2=0.9522.②用擬合效果好的模型預(yù)測(cè)溫度為35℃時(shí)該種藥用昆蟲的產(chǎn)卵數(shù).(結(jié)果取整數(shù)).①試與(1)中的線性回歸模型相比較,用R2說明哪種模型的擬合效果更好隨堂練習(xí)解:(1)由題意得,n=6,所以y關(guān)于x的經(jīng)驗(yàn)回歸方程為(2)①對(duì)于線性回歸模型,相關(guān)系數(shù)∵0.9398<0.9522∴非線性回歸模型的回歸方程比線性回歸方程為

擬合的擬合效果更好

隨堂練習(xí)(2)②由①知擬合效果好的模型為所以當(dāng)x=35時(shí),所以預(yù)測(cè)溫度為35℃時(shí)該種藥用昆蟲的產(chǎn)卵數(shù)為190個(gè).概念講解在使用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè)時(shí),需注意以下問題1、回歸方程只適用于我們所研究的樣本的總體;2、我們所建立的回歸方程一般都有時(shí)效性;3、解釋變量的取值范圍不能離開樣本數(shù)據(jù)的范圍太遠(yuǎn).樣本采集的范圍會(huì)影響回歸方程的適用范圍;4、不能期望回歸方程得到的預(yù)報(bào)值就是預(yù)報(bào)變量的精確值.事實(shí)上,它是預(yù)報(bào)變量的可取值的平均值.課堂小結(jié)1、殘差平方和:2、最小二乘法將稱為Y關(guān)于x的經(jīng)驗(yàn)回歸方程.3、判斷模型擬合的效果:①殘差分析②決定系數(shù)R2法R2越大,表示

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論