一元線性回歸模型參數(shù)的最小二乘估計(jì)高二下數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第1頁
一元線性回歸模型參數(shù)的最小二乘估計(jì)高二下數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第2頁
一元線性回歸模型參數(shù)的最小二乘估計(jì)高二下數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第3頁
一元線性回歸模型參數(shù)的最小二乘估計(jì)高二下數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第4頁
一元線性回歸模型參數(shù)的最小二乘估計(jì)高二下數(shù)學(xué)人教A版(2019)選擇性必修第三冊(cè)_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

8.2.2

非線性關(guān)系的回歸模型(3)第八章成對(duì)數(shù)據(jù)的統(tǒng)計(jì)分析2024/7/18.2一元線性回歸模型及其應(yīng)用---思想:變換為線性回歸模型一.求一元線性回歸方程的步驟:(1)以成對(duì)樣本數(shù)據(jù)描出散點(diǎn)圖,通過散點(diǎn)圖觀察成對(duì)樣本數(shù)據(jù)是否線性相關(guān)(2)判斷兩個(gè)變量之間的線性相關(guān)關(guān)系

(4)殘差分析:殘差表、殘差圖對(duì)回歸模型的擬合效果進(jìn)行評(píng)估。復(fù)習(xí)引入其中:例1

人們常將男子短跑100m的高水平運(yùn)動(dòng)員稱為“百米飛人”.下表給出了1968年之前男子短跑100m世界紀(jì)錄產(chǎn)生的年份和世界紀(jì)錄的數(shù)據(jù).試依據(jù)這些成對(duì)數(shù)據(jù),建立男子短跑100m世界紀(jì)錄關(guān)于紀(jì)錄產(chǎn)生年份的經(jīng)驗(yàn)回歸方程.編號(hào)12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.951.畫散點(diǎn)圖

以成對(duì)數(shù)據(jù)中的世界紀(jì)錄產(chǎn)生年份為橫坐標(biāo),世界紀(jì)錄為縱坐標(biāo)作散點(diǎn)圖,得到右圖在左圖中,散點(diǎn)看上去大致分布在一條直線附近,似乎可用一元線性回歸模型建立經(jīng)驗(yàn)回歸方程.探究新知2.求經(jīng)驗(yàn)回歸方程將經(jīng)驗(yàn)回歸直線疊加到散點(diǎn)圖,得到下圖:

用Y表示男子短跑100m的世界紀(jì)錄,t表示紀(jì)錄產(chǎn)生的年份,利用一元線性回歸模型來刻畫世界紀(jì)錄和世界紀(jì)錄產(chǎn)生年份之間的關(guān)系.根據(jù)最小二乘法,由表中的數(shù)據(jù)得到經(jīng)驗(yàn)回歸方程為①探究新知問題1

從圖中可以看到,經(jīng)驗(yàn)回歸方程較好地刻畫了散點(diǎn)的變化趨,請(qǐng)?jiān)僮屑?xì)觀察圖形,你能看出其中存在的問題嗎?例如,第一個(gè)世界紀(jì)錄所對(duì)應(yīng)的散點(diǎn)遠(yuǎn)離經(jīng)驗(yàn)回歸直線,并且前后兩時(shí)間段中的散點(diǎn)都在經(jīng)驗(yàn)回歸直線的上方,中間時(shí)間段的散點(diǎn)都在經(jīng)驗(yàn)回歸直線的下方.散點(diǎn)并不是隨機(jī)分布在經(jīng)驗(yàn)回歸直線的周圍,而是圍繞著經(jīng)驗(yàn)回歸直線有一定的變化規(guī)律,即成對(duì)樣本數(shù)據(jù)呈現(xiàn)出明顯的非線性相關(guān)的特征.探究新知問題2你能對(duì)模型進(jìn)行修改,以使其更好地反映散點(diǎn)的分布特征嗎?3.修改模型仔細(xì)觀察右圖,可以發(fā)現(xiàn)散點(diǎn)更趨向于落在中間下凸且遞減的某條曲線附近.函數(shù)y=-lnx的圖象具有類似的形狀特征.

注意到100m短跑的第一個(gè)世界紀(jì)錄產(chǎn)生于1896年,因此可設(shè)非線性回歸方程為:

y=f(t)=c1+c2ln(t-1895)

(其中c1、c2為未知參數(shù),且c2<0).追問

如何利用成對(duì)數(shù)據(jù)估計(jì)參數(shù)c1和c2?

探究新知為了利用一元線性回歸模型估計(jì)參數(shù)c1和c2,我們引進(jìn)一個(gè)中間變量x,令x=ln(t-1895),,則Y=c2x+c1通過x=ln(t-1895),將年份變量數(shù)據(jù)進(jìn)行變換,得到新的成對(duì)數(shù)據(jù),如下表.編號(hào)12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29記錄/s11.8010.6010.4010.3010.2010.1010.009.95如果上表對(duì)應(yīng)的散點(diǎn)圖呈現(xiàn)出很強(qiáng)的線性相關(guān)特征,我們就可以借助一元線性回歸模型和新的成對(duì)數(shù)據(jù),對(duì)參數(shù)c1和c2作出估計(jì),進(jìn)而可以得到Y(jié)關(guān)于t的非線性經(jīng)驗(yàn)回歸方程.畫出上表中成對(duì)數(shù)據(jù)的散點(diǎn)圖,由散點(diǎn)圖可知,現(xiàn)在散點(diǎn)的分布呈現(xiàn)出很強(qiáng)的線性相關(guān)特征,故可以一元線性回歸模型建立經(jīng)驗(yàn)回歸方程.探究新知根據(jù)最小二乘法,并利用表中數(shù)據(jù)可得新的經(jīng)驗(yàn)回歸方程為將經(jīng)驗(yàn)回歸直線疊加到散點(diǎn)圖,如圖所示:將x=ln(t-1895)代入

得到由創(chuàng)紀(jì)錄年份預(yù)報(bào)世界紀(jì)錄的經(jīng)驗(yàn)非線性回歸方程:②探究新知問題3

對(duì)于通過創(chuàng)紀(jì)錄時(shí)間預(yù)報(bào)世界紀(jì)錄的問題,我們建立了兩個(gè)回歸模型,得到了兩個(gè)回歸方程,你能判斷哪個(gè)回歸方程擬合的精度更好嗎?②

(1)直接觀察法.在同一坐標(biāo)系中畫出成對(duì)數(shù)據(jù)散點(diǎn)圖、經(jīng)驗(yàn)回歸方程①的圖象(紅色)以及非線性經(jīng)驗(yàn)回歸方程②的圖象(藍(lán)色).我們發(fā)現(xiàn),散點(diǎn)圖中各散點(diǎn)都非常靠近②的圖像,表明非線性經(jīng)驗(yàn)回歸方程②對(duì)于原始數(shù)據(jù)的擬合效果遠(yuǎn)遠(yuǎn)好于經(jīng)驗(yàn)回歸方程①.探究新知①(2)殘差分析:

殘差平方和越小,模型擬合效果越好.用ti表示編號(hào)為i的年份數(shù)據(jù),用yi表示編號(hào)為i的紀(jì)錄數(shù)據(jù),則經(jīng)驗(yàn)回歸方程①和②的殘差計(jì)算公式分別為兩個(gè)經(jīng)驗(yàn)回歸方程的殘差(精確到0.001)如下表所示.編號(hào)12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022觀察各項(xiàng)殘差的絕對(duì)值,發(fā)現(xiàn)經(jīng)驗(yàn)回歸方程②遠(yuǎn)遠(yuǎn)小于①,即經(jīng)驗(yàn)回歸方程②的擬合效果要遠(yuǎn)遠(yuǎn)好于①.探究新知(2)殘差分析:

殘差平方和越小,模型擬合效果越好.編號(hào)12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022在一般情況下,直接比較兩個(gè)模型的殘差比較困難,因?yàn)樵谀承┥Ⅻc(diǎn)上一個(gè)模型的殘差的絕對(duì)值比另一個(gè)模型小,而另一些散點(diǎn)的情況則相反.可以通過比較殘差的平方和來比較兩個(gè)模型的效果.由可知Q2小于Q1.因此在殘差平方和最小的標(biāo)準(zhǔn)下,非線性回歸模型的擬合效果要優(yōu)于一元線性回歸模型的擬合效果.探究新知(3)用決定系數(shù)R2來比較這兩個(gè)模型的擬合效果通過前面的討論我們知道,當(dāng)殘差的平方和越小,經(jīng)驗(yàn)回歸模型的擬合效果就越好,故我們可以用決定系數(shù)R2來驗(yàn)證模型的擬合效果.決定系數(shù)R2的計(jì)算公式為殘差平方和偏差平方和(與經(jīng)驗(yàn)回歸方程有關(guān))(與經(jīng)驗(yàn)回歸方程無關(guān))R2越大,表示殘差平方和越小,即模型的擬合效果越好R2越小,表示殘差平方和越大,即模型的擬合效果越差.顯然0≤R2≤1,R2越接近1,則線性回歸刻畫的效果越好.探究新知編號(hào)12345678t189619121921193019361956196019680.591-0.284-0.301-0.218-0.1960.1110.0920.205-0.0010.007-0.0120.015-0.0180.052-0.021-0.022(3)用決定系數(shù)R2來比較這兩個(gè)模型的擬合效果由上述殘差表可算出經(jīng)驗(yàn)回歸方程①和②的決定系數(shù)R2分別為由于因此經(jīng)驗(yàn)回歸方程②的刻畫效果比經(jīng)驗(yàn)回歸方程①的好很多.探究新知

另外,我們還可以用新的觀測(cè)數(shù)據(jù)來檢驗(yàn)?zāi)P偷臄M合效果.事實(shí)上,我們還有1968年之后的男子短跑100m世界紀(jì)錄數(shù)據(jù),如下表所示.編號(hào)91011121314151617181920t198319881991199119941996199920052007200820082009Y/s9.939.929.909.869.859.849.799.779.749.729.699.58

在散點(diǎn)圖中繼續(xù)繪制上表中的散點(diǎn)(綠色),再添加經(jīng)驗(yàn)回歸方程①所對(duì)應(yīng)的經(jīng)驗(yàn)回歸直線,以及經(jīng)驗(yàn)回歸方程②所對(duì)應(yīng)的經(jīng)驗(yàn)回歸曲線,得到下圖.

顯然綠色散點(diǎn)分布在藍(lán)色經(jīng)驗(yàn)回歸曲線的附近,遠(yuǎn)離紅色經(jīng)驗(yàn)回歸直線,表明經(jīng)驗(yàn)回歸方程②對(duì)于新數(shù)據(jù)的預(yù)報(bào)效果遠(yuǎn)遠(yuǎn)好于①.探究新知問題3

在上述問題情境中,男子短跑100m世界紀(jì)錄和紀(jì)錄產(chǎn)生年份之間呈現(xiàn)出對(duì)數(shù)關(guān)系,能借助樣本相關(guān)系數(shù)刻畫這種關(guān)系的強(qiáng)弱嗎?在使用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測(cè)時(shí),需注意以下問題1.回歸方程只適用于我們所研究的樣本的總體;2.我們所建立的回歸方程一般都有時(shí)間性;3.樣本采集的范圍會(huì)影響回歸方程的適用范圍;4.不能期望回歸方程得到的預(yù)報(bào)值就是預(yù)報(bào)變量的精確值.事實(shí)上,它是預(yù)報(bào)變量的可能取值的平均值.探究新知問題4本節(jié)我們學(xué)習(xí)了哪些分析模型的回歸效果方法?(2)殘差平方和(1)殘差分析好的回歸方程對(duì)應(yīng)的殘差散點(diǎn)圖應(yīng)是均勻地分布在橫軸兩側(cè)的帶狀區(qū)域內(nèi).且?guī)顓^(qū)域越窄,說明模型擬合效果越好.列殘差表畫殘差圖(3)決定系數(shù)R2法殘差平方和越小,說明模型擬合效果越好.R2越大,說明模型擬合效果越好.探究新知建立非線性經(jīng)驗(yàn)回歸模型的基本步驟:1.確定研究對(duì)象,明確哪個(gè)是解釋變量,哪個(gè)是響應(yīng)變量;2.由經(jīng)驗(yàn)確定非線性經(jīng)驗(yàn)回歸方程的模型;3.通過變換,將非線性經(jīng)驗(yàn)回歸模型轉(zhuǎn)化為線性經(jīng)驗(yàn)回歸模型;4.按照公式計(jì)算經(jīng)驗(yàn)回歸方程中的參數(shù),得到經(jīng)驗(yàn)回歸方程;5.消去新元,得到非線性經(jīng)驗(yàn)回歸方程;6.得出結(jié)果后分析殘差圖是否有異常.探究新知非線性回歸分析(1)指數(shù)型函數(shù)y=ebx+a類①函數(shù)y=ebx+a

的圖象,如圖所示線性回歸分析②兩邊取對(duì)數(shù)得lny=lnebx+a,即

lny=bx+a令z=lny,把原始數(shù)據(jù)(x,y)轉(zhuǎn)化為(x,z),再根據(jù)求解線性回歸模型的方法求出a,b.(2)對(duì)數(shù)型函數(shù)y=blnx+a

類①函數(shù)y=blnx+a的圖象,如圖所示②設(shè)u=lnx,原方程可轉(zhuǎn)化為

y=bu+a把原始數(shù)據(jù)(x,y)轉(zhuǎn)化為(u,y),再根據(jù)求解線性回歸模型的方法求出a,b.探究新知[2020全國卷I-5]某校一個(gè)課外學(xué)習(xí)小組為研究某作物種子的發(fā)芽率y和溫度x(單位:°C)的關(guān)系,在20個(gè)不同的溫度條件下進(jìn)行種子發(fā)芽實(shí)驗(yàn),由實(shí)驗(yàn)數(shù)據(jù)(xi,yi)得到下面的散點(diǎn)圖:由此散點(diǎn)圖,在10°C至40°C之間,下面四個(gè)回歸方程類型中最適宜作為發(fā)芽率y和溫度x的回歸方程類型的是()課堂練習(xí)

x2023252730z22.4334.6對(duì)數(shù)變換z=lny練習(xí)2.2020年初,新型冠狀病毒(COVID-19)引起的肺炎疫情爆發(fā)以來,各地醫(yī)療機(jī)構(gòu)采取了各種針對(duì)性的治療方法,取得了不錯(cuò)的成效,某地開始使用中西醫(yī)結(jié)合方法后,每周治愈的患者人數(shù)如下表所示:由表格可得y

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論