8.2一元線性回歸模型及其應(yīng)用課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第1頁
8.2一元線性回歸模型及其應(yīng)用課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第2頁
8.2一元線性回歸模型及其應(yīng)用課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第3頁
8.2一元線性回歸模型及其應(yīng)用課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第4頁
8.2一元線性回歸模型及其應(yīng)用課件高二下學(xué)期數(shù)學(xué)人教A版選擇性_第5頁
已閱讀5頁,還剩49頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

8.2一元線性回歸模型及其應(yīng)用8.2.1一元線性回歸模型1.樣本相關(guān)系數(shù):2.相關(guān)系數(shù)的性質(zhì):①當(dāng)r>0時(shí),稱成對樣本數(shù)據(jù)正相關(guān);當(dāng)r<0時(shí),稱成對樣本數(shù)據(jù)負(fù)相關(guān).②|r|≤1;③當(dāng)|r|越接近1時(shí),成對數(shù)據(jù)的線性相關(guān)程度越強(qiáng);當(dāng)|r|越接近0時(shí),成對數(shù)據(jù)的線性相關(guān)程度越弱;特別地,當(dāng)|r|=0時(shí),成對數(shù)據(jù)的沒有線性相關(guān)關(guān)系;當(dāng)|r|=1時(shí),成對數(shù)據(jù)都落在一條直線上.復(fù)習(xí)回顧通過前面的學(xué)習(xí)我們已經(jīng)了解到,根據(jù)成對樣本數(shù)據(jù)的散點(diǎn)圖和樣本相關(guān)系數(shù),可以推斷兩個(gè)變量是否存在相關(guān)關(guān)系、是正相關(guān)還是負(fù)相關(guān),以及線性相關(guān)程度的強(qiáng)弱等.進(jìn)一步地,如果能像建立函數(shù)模型刻畫兩個(gè)變量之間的確定性關(guān)系那樣,通過建立適當(dāng)?shù)慕y(tǒng)計(jì)模型刻畫兩個(gè)隨機(jī)變量的相關(guān)關(guān)系,那么我們就可以利用這個(gè)模型研究兩個(gè)變量之間的隨機(jī)關(guān)系,并通過模型進(jìn)行預(yù)測.下面我們研究當(dāng)兩個(gè)變量線性相關(guān)時(shí),如何利用成對樣本數(shù)據(jù)建立統(tǒng)計(jì)模型,并利用模型進(jìn)行預(yù)測的問題.新課引入問題1:生活經(jīng)驗(yàn)告訴我們,兒子的身高與父親的身高相關(guān).一般來說,父親的身高較高時(shí),兒子的身高通常也較高.為了進(jìn)一步研究兩者之間的關(guān)系,有人調(diào)查了14名男大學(xué)生的身高及其父親的身高,得到的數(shù)據(jù)如表1所示.編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182可以發(fā)現(xiàn),散點(diǎn)大致分布在一條從左下角到右上角的直線附近,表明兒子身高和父親身高線性相關(guān).利用統(tǒng)計(jì)軟件,求得樣本相關(guān)系數(shù)為r≈0.886,表明兒子身高和父親身高正線性相關(guān),且相關(guān)程度較高。問題2:根據(jù)表中的數(shù)據(jù),兒子身高和父親身高這兩個(gè)變量之間的關(guān)系可以用函數(shù)模型刻畫嗎?列表法是函數(shù)的一種表示方法,但并不是所有列表表示的數(shù)據(jù)都是函數(shù)關(guān)系,要成為函數(shù)關(guān)系必須滿足函數(shù)的定義,即應(yīng)滿足“集合A中的任意一個(gè)數(shù),在集合B中都存在唯一的數(shù)與它對應(yīng)”.編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182表中的數(shù)據(jù),存在父親身高相同而兒子身高不同的情況.例如,第6個(gè)和第8個(gè)觀測父親的身高均為172cm,而對應(yīng)的兒子的身高為176cm和174cm;同樣在第3,4個(gè)觀測中,兒子的身高都是170cm,而父親的身高分別為173cm,169cm.可見兒子的身高不是父親身高的函數(shù)同樣父親的身高也不是兒子身高的函數(shù),所以不能用函數(shù)模型來刻畫.編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182問題3:從成對樣本數(shù)據(jù)的散點(diǎn)圖和樣本相關(guān)系數(shù)可以發(fā)現(xiàn),散點(diǎn)大致分布在一條直線附近表明兒子身高和父親身高有較強(qiáng)的線性關(guān)系.我們可以這樣理解,由于有其他因素的存在,使兒子身高和父親身高有關(guān)系但不是函數(shù)關(guān)系.那么影響兒子身高的其他因素是什么?影響兒子身高的因素除父親的身外,還有母親的身高、生活的環(huán)境、飲食習(xí)慣、營養(yǎng)水平、體育鍛煉等隨機(jī)的因素,兒子身高是父親身高的函數(shù)的原因是存在這些隨機(jī)的因素.問題4:由問題3我們知道,正是因?yàn)榇嬖谶@些隨機(jī)的因素,使得兒子的身高呈現(xiàn)出隨機(jī)性各種隨機(jī)因素都是獨(dú)立的,有些因素又無法量化.你能否考慮到這些隨機(jī)因素的作用,用類似于函數(shù)的表達(dá)式,表示兒子身高與父親身高的關(guān)系嗎?如果用x表示父親身高,Y表示兒子的身高,用e表示各種其他隨機(jī)因素影響之和,稱e為隨機(jī)誤差,由于兒子身高與父親身高線性相關(guān),所以Y=bx+a.Y=bx+a+e.

追問:為什么要假設(shè)E(e)=0,而不假設(shè)其為某個(gè)不為0的常數(shù)?因?yàn)檎`差是隨機(jī)的,即取各種正負(fù)誤差的可能性一樣,所以它們均值的理想狀態(tài)應(yīng)該為0.

若用x表示父親身高,Y表示兒子身高,e表示隨機(jī)誤差.假定隨機(jī)誤差e的均值為0,方差為與父親身高無關(guān)的定值σ2,則它們之間的關(guān)系可以表示為我們稱(1)式為

Y

關(guān)于

x

的一元線性回歸模型.其中,Y

稱為因變量或響應(yīng)變量,x稱為自變量或解釋變量;a和b為模型的未知參數(shù),a

稱為截距參數(shù),b

稱為斜率參數(shù);e

Y

bx+a

之間的隨機(jī)誤差.模型中的

Y

也是隨機(jī)變量,其值雖不能由變量x的值確定,但卻能表示為

bx+a

e

的和,前一部分由

x

所確定,后一部分是隨機(jī)的.如果

e=0

,那么

Y

x

之間的關(guān)系就可用一元線性函數(shù)模型來描述.一元線性回歸模型你能結(jié)合父親與兒子身高的實(shí)例,說明回歸模型(1)的意義?

對于父親身高為xi的某一名男大學(xué)生,他的身高yi一定是bxi+a嗎?模型理解解:不能.一是父親的身高與兒子的身高之間是隨機(jī)關(guān)系,不是函數(shù)關(guān)系;二是這組數(shù)據(jù)僅是總體的一個(gè)樣本,不一定能很好地描述兩個(gè)變量之間的關(guān)系.3.將圖8.2-1中的點(diǎn)按父親身高的大小次序用折線連起來,所得到的圖象是一個(gè)折線圖,可以用這條折線表示兒子身高和父親身高之間的關(guān)系嗎?課堂練習(xí)課本P1078.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì)在一元線性回歸模型中,表達(dá)式Y(jié)=bx+a+e刻畫的是變量Y與變量x之間的線性相關(guān)關(guān)系,其中參數(shù)a和b未知,需要根據(jù)成對樣本數(shù)據(jù)進(jìn)行估計(jì).由模型的建立過程可知,參數(shù)a和b刻畫了變量Y與變量x的線性關(guān)系,因此通過成對樣本數(shù)據(jù)估計(jì)這兩個(gè)參數(shù),相當(dāng)于尋找一條適當(dāng)?shù)闹本€,使表示成對樣本數(shù)據(jù)的這些散點(diǎn)在整體上與這條直線最接近.探究利用散點(diǎn)圖找出一條直線,使各散點(diǎn)在整體上與此直線盡可能接近.方法一:采用測量的方法,先畫出一條直線,測量出各點(diǎn)與它的距離,然后移動(dòng)直線,到達(dá)一個(gè)使距離的和最小的位置.然后測量出此時(shí)的斜率和截距,就可得到一條直線,如圖(1)所示.方法二:在圖中選擇這樣的兩點(diǎn)畫直線,使得直線兩側(cè)的點(diǎn)的個(gè)數(shù)基本相同,把這條直線作為所求直線,如圖(2)所示.方法三:在散點(diǎn)圖中多取幾對點(diǎn),確定出幾條直線的方程,再分別求出這些直線的斜率、截距的平均數(shù),將這兩個(gè)平均數(shù)作為所求直線的斜率和截距,如圖(3)所示.上面這些方法雖然有一定的道理,但比較難操作,我們需要另辟蹊徑.先進(jìn)一步明確我們面臨的任務(wù):從成對樣本數(shù)據(jù)出發(fā),用數(shù)學(xué)的方法刻畫“從整體上看,各散點(diǎn)與直線最接近”.通常,我們會(huì)想到利用點(diǎn)到直線y=bx+a的“距離”來刻畫散點(diǎn)與該直線的接近程度,然后用所有“距離”之和刻畫所有樣本觀測數(shù)據(jù)與該直線的接近程度.設(shè)滿足一元線性回歸模型的兩個(gè)變量的n對樣本數(shù)據(jù)為(x1,

y1),(x2,

y2),???,(xn,

yn),由yi=bxi+a+ei(i=1,2,???,n),得顯然|ei|越小,表示點(diǎn)(xi,

yi)與點(diǎn)(xi,

bxi+a)的“距離”越小,即樣本數(shù)據(jù)點(diǎn)離直線y=bx+a的豎直距離越小,如右圖所示.特別地,當(dāng)ei=0時(shí),表示點(diǎn)(xi,

yi)在這條直線上.因此,可以用這n個(gè)豎直距離之和來刻畫各樣本觀測數(shù)據(jù)與直線y=bx+a的“整體接近程度”.在實(shí)際應(yīng)用中,因?yàn)榻^對值使得計(jì)算不方便,所以人們通常用各散點(diǎn)到直線的豎直距離的平方之和來刻畫“整體接近程度”.求a,b的值,使Q(a,b)最小殘差平方和:殘差:實(shí)際值與估計(jì)值之間的差值,即新知講解思考:如何求a,b的值,使

最???記新知講解注意到所以當(dāng)取最小值時(shí),取最小值0,即.此時(shí)新知講解上式是關(guān)于b的二次函數(shù),因此要使Q取得最小值,當(dāng)且僅當(dāng)b的取值為綜上,當(dāng)a,b的取值為

時(shí),Q達(dá)到最小.新知講解易得:(1)經(jīng)驗(yàn)回歸直線必過樣本中心;(2)與相關(guān)系數(shù)r符號相同.我們將稱為Y關(guān)于x的經(jīng)驗(yàn)回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)回歸直線,這種求經(jīng)驗(yàn)回歸方程的方法叫最小二乘法,求得的,叫做b,a的最小二乘估計(jì).經(jīng)驗(yàn)回歸方程與最小二乘估計(jì):編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182對于上表中的數(shù)據(jù),利用公式(2)可以計(jì)算出

得到兒子身高Y關(guān)于父親身高x的經(jīng)驗(yàn)回歸方程為

相應(yīng)的經(jīng)驗(yàn)回歸直線如下圖所示.商店名稱ABCDE銷售額x/千萬元35679利潤額y/百萬元23345例1

某連鎖經(jīng)營公司所屬5個(gè)零售店某月的銷售額和利潤額資料如下表:(1)畫出銷售額和利潤額的散點(diǎn)圖;(2)計(jì)算利潤額y對銷售額x的經(jīng)驗(yàn)回歸直線方程.解:(1)散點(diǎn)圖如下:例題∴所求經(jīng)驗(yàn)回歸方程為解1:(2)商店名稱ABCDE銷售額x/千萬元35679利潤額y/百萬元23345∴所求經(jīng)驗(yàn)回歸方程為解2:(2)商店名稱ABCDE銷售額x/千萬元35679利潤額y/百萬元23345求經(jīng)驗(yàn)回歸方程的步驟:∴估計(jì)女兒的身高為168cm左右.2.假如女兒身高y(單位:cm)關(guān)于父親身高x(單位:cm)的經(jīng)驗(yàn)回歸方程為

已知父親身高為175cm,請估計(jì)女兒的身高.解:課堂練習(xí)課本P113課堂小結(jié)1.經(jīng)驗(yàn)回歸方程:我們將

稱為Y關(guān)于x的經(jīng)驗(yàn)回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)回歸直線.這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法.2.最小二乘估計(jì):經(jīng)驗(yàn)回歸方程中的參數(shù)計(jì)算公式為:

思考1:已知兒子身高關(guān)于父親身高x的經(jīng)驗(yàn)回歸方程為

如果一位父親的身高為176cm,他兒子長大成人后的身高一定是177cm嗎?為什么?顯然不一定,因?yàn)檫€有其他影響兒子身高的因素,父親身高不能完全決定兒子身高.不過,我們可以作出推測,當(dāng)父親身高為176cm時(shí),兒子身高一般在177cm左右.實(shí)際上,如果把這所學(xué)校父親身高為176cm的所有兒子身高作為一個(gè)子總體,那么177cm是這個(gè)子總體的均值的估計(jì)值.這里的經(jīng)驗(yàn)回歸方程其斜率可以解釋為父親身高每增加1cm,其兒子身高平均增加0.839cm.分析模型還可以發(fā)現(xiàn),高個(gè)子父親有生高個(gè)子兒子的趨勢,但一群高個(gè)子父親的兒子們的平均身高要低于父親們的平均身高,例如x=185(cm),則

=184.172(cm).矮個(gè)子父親有生矮個(gè)子兒子的趨勢,但一群矮個(gè)子父親的兒子們的平均身高要高于父親們的平均身高,例如x=170(cm),則

=171.587(cm).殘差分析對于響應(yīng)變量Y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗(yàn)回歸方程得到的)稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差.殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.例如,對于下表中的第6個(gè)觀測,父親身高為172cm,其兒子身高的觀測值為y6=176(cm),預(yù)測值為殘差為176-173.265=2.735(cm).編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182類似地,我們還可以得到其他的殘差,如下表所示.殘差分析編號父親身高/cm兒子身高觀測值/cm兒子身高預(yù)測值/cm殘差/cm1174176174.9431.0572170176171.5874.4133173170174.104-4.1044169170170.748-0.7485182185181.6553.3456172176173.2652.7357180178179.977-1.9778172174173.2650.7359168170169.9090.09110166168168.231-0.23111182178181.655-3.65512173172174.104-2.1041316416566.553-1.55314180182179.9772.023為了使數(shù)據(jù)更加直觀,用父親身高作為橫坐標(biāo),殘差作為縱坐標(biāo),可以畫出殘差圖,如圖下所示.殘差圖:012345-1-2-3-4-5160165170175180185殘差/cm父親身高/cm??????????????觀察殘差的散點(diǎn)圖可以發(fā)現(xiàn),殘差比較均勻地分布在橫軸的兩邊.說明殘差比較符合一元線性回歸模型的假定,是均值為0、方差為σ2的隨機(jī)變量的觀測值.可見,通過觀察殘差圖可以直觀判斷模型是否滿足一元線性回歸模型的假設(shè).思考2:觀察下列四幅殘差圖,你認(rèn)為哪一個(gè)殘差滿足一元線性回歸模型中對隨機(jī)誤差的假定?通過觀察發(fā)現(xiàn),圖(4)的殘差比較均勻地分布在以取值為0的橫軸為對稱軸的水平帶狀區(qū)域內(nèi).所以在四幅殘差圖中,只有圖(4)滿足一元線性回歸模型對隨機(jī)誤差的假設(shè).例

經(jīng)驗(yàn)表明,一般樹的胸徑(樹的主干在地面以上1.3m處的直徑)越大,

樹就越高.由于測量樹高比測量胸徑困難,因此研究人員希望由胸徑預(yù)測樹高.在研究樹高與胸徑之間的關(guān)系時(shí),某林場收集了某種樹的一些數(shù)據(jù)如下表,試根據(jù)這些數(shù)據(jù)建立樹高關(guān)于胸徑的經(jīng)驗(yàn)回歸方程.編號123456胸徑/cm18.120.122.224.426.028.3樹高/m18.819.221.021.022.122.1編號789101112胸徑/cm29.632.433.735.738.340.2樹高/m22.422.623.024.323.924.7例題講解

解:以胸徑為橫坐標(biāo),樹高為縱坐標(biāo)作散點(diǎn)圖如下:

在右圖中,散點(diǎn)大致分布在一條從左下角到右上角的直線附近,表明兩個(gè)變量線性相關(guān),并且是正相關(guān),因此可以用一元線性回歸模型刻畫樹高與胸徑之間的關(guān)系.用d表示胸徑,h表示樹高,根據(jù)據(jù)最小二乘法,計(jì)算可得經(jīng)驗(yàn)回歸方程為相應(yīng)的經(jīng)驗(yàn)回歸直線如圖所示.根據(jù)經(jīng)驗(yàn)回歸方程,由胸徑的數(shù)據(jù)可以計(jì)算出樹高的預(yù)測值(精確到0.1)以及相應(yīng)的殘差,如下表所示.以胸徑為橫坐標(biāo),殘差為縱坐標(biāo),作殘差圖,得到下圖.觀察殘差表和殘差圖,可以看到,殘差的絕對值最大是0.8,所有殘差分布在以橫軸為對稱軸、寬度小于2的帶狀區(qū)域內(nèi).可見經(jīng)驗(yàn)回歸方程較好地刻畫了樹高與胸徑的關(guān)系,我們可以根據(jù)經(jīng)驗(yàn)回歸方程由胸徑預(yù)測樹高.決定系數(shù)決定系數(shù)R2常用來比較兩個(gè)模型的擬合效果R2越大,表示殘差平方和越小,即模型的擬合效果越好;R2越小,表示殘差平方和越大,即模型擬合效果越差.殘差平方和確定的數(shù)即在實(shí)際應(yīng)用中應(yīng)該盡量選擇R2大的回歸模型.在使用經(jīng)驗(yàn)回歸方程進(jìn)行預(yù)測時(shí),需注意以下問題:1.回歸方程只適用于我們所研究的樣本的總體.例如,根據(jù)我國父親身高與兒子身高數(shù)據(jù)建立的經(jīng)驗(yàn)回歸方程,不能用來描述美國父親身高與兒子身高之間關(guān)系.同樣,根據(jù)生長在南方多雨地區(qū)的樹高與胸徑的數(shù)據(jù)建立的經(jīng)驗(yàn)回歸方程,不能用來描述北方干旱地區(qū)的樹高與胸徑之間的關(guān)系.3.解釋變量的取值不能離樣本數(shù)據(jù)的范圍太遠(yuǎn).一般解釋變量的取值在樣本范圍內(nèi),經(jīng)驗(yàn)回歸方程的預(yù)報(bào)效果會(huì)比較好,超出這個(gè)范圍越遠(yuǎn),預(yù)報(bào)效果越差.4.不能期望經(jīng)驗(yàn)回歸方程得到的預(yù)報(bào)值就是響應(yīng)變量的精確值.事實(shí)上,它是響應(yīng)變量的可取值的平均值.2.經(jīng)驗(yàn)回歸回歸方程一般都有時(shí)間性.

例如,根據(jù)20世紀(jì)80年代父親身高與兒子身高數(shù)據(jù)建立的經(jīng)驗(yàn)回歸方程,不能用來描述現(xiàn)在的父親身高與兒子身高之間關(guān)系.一般地,建立回歸模型的基本步驟為:(1)確定研究對象,明確哪個(gè)變量是解釋變量,哪個(gè)變量是預(yù)報(bào)變量.(2)畫出解釋變量和預(yù)報(bào)變量的散點(diǎn)圖,觀察它們之間的關(guān)系(如是否存在線性關(guān)系等).(3)由經(jīng)驗(yàn)確定回歸方程的類型(如我們觀察到數(shù)據(jù)呈線性關(guān)系,則選用線性回歸方程).(4)按一定規(guī)則(如最小二乘法)估計(jì)回歸方程中的參數(shù).(5)得出結(jié)果后分析殘差圖是否有異常(如個(gè)別數(shù)據(jù)對應(yīng)殘差過大,殘差呈現(xiàn)不隨機(jī)的規(guī)律性等).若存在異常,則檢查數(shù)據(jù)是否有誤,或模型是否合適等.編號12345678年份18961912192119301936195619601968記錄/s11.8010.6010.4010.3010.2010.1010.009.95問題人們常將男子短跑100m的高水平運(yùn)動(dòng)員稱為百米飛人.下表給出了1968年之前男子短跑100m世界紀(jì)錄產(chǎn)生的年份和世界紀(jì)錄的數(shù)據(jù).試依據(jù)這些成對數(shù)據(jù),建立男子短跑100m世界紀(jì)錄關(guān)于紀(jì)錄產(chǎn)生年份的經(jīng)驗(yàn)回歸方程.

以成對數(shù)據(jù)中的世界紀(jì)錄產(chǎn)生年份為橫坐標(biāo),世界紀(jì)錄為縱坐標(biāo)作散點(diǎn)圖,得到下圖.非線性回歸問題在上圖中,散點(diǎn)看上去大致分布在一條直線附近,似乎可用一元線性回歸模型建立經(jīng)驗(yàn)回歸方程.用Y表示男子短跑100m的世界紀(jì)錄,t表示紀(jì)錄產(chǎn)生的年份,利用一元線性回歸模型來刻畫世界紀(jì)錄和世界紀(jì)錄產(chǎn)生年份之間的關(guān)系.根據(jù)最小二乘法,由表中的數(shù)據(jù)得到經(jīng)驗(yàn)回歸方程為:將經(jīng)驗(yàn)回歸直線疊加到散點(diǎn)圖,得到下圖:例如,第一個(gè)世界紀(jì)錄所對應(yīng)的散點(diǎn)遠(yuǎn)離經(jīng)驗(yàn)回歸直線,并且前后兩時(shí)間段中的散點(diǎn)都在經(jīng)驗(yàn)回歸直線的上方,中間時(shí)間段的散點(diǎn)都在經(jīng)驗(yàn)回歸直線的下方.這說明散點(diǎn)并不是隨機(jī)分布在經(jīng)驗(yàn)回歸直線的周圍,而是圍繞著經(jīng)驗(yàn)回歸直線有一定的變化規(guī)律,即成對樣本數(shù)據(jù)呈現(xiàn)出明顯的非線性相關(guān)的特征.觀察:從圖中可以看到,經(jīng)驗(yàn)回歸方程較好地刻畫了散點(diǎn)的變化趨勢,請?jiān)僮屑?xì)觀察圖形,你能看出其中存在的問題嗎?思考:

你能對模型進(jìn)行修改,以使其更好地反映散點(diǎn)的分布特征嗎?仔細(xì)觀察右圖,可以發(fā)現(xiàn)散點(diǎn)更趨向于落在中間下凸且遞減的某條曲線附近.回顧已有的函數(shù)知識,可以發(fā)現(xiàn)函數(shù)y=-lnx的圖象具有類似的形狀特征.

注意到100m短跑的第一個(gè)世界紀(jì)錄產(chǎn)生于1896年,因此可以認(rèn)為散點(diǎn)是集中在曲線y=f(t)=c1+c2ln(t-1895)的周圍,其中c1、c2為未知參數(shù),且c2<0.散點(diǎn)集中在曲線y=f(t)=c1+c2ln(t-1895)的周圍,其中c1、c2為未知參數(shù),且c2<0.用上述函數(shù)刻畫數(shù)據(jù)變化的趨勢,這是一個(gè)非線性經(jīng)驗(yàn)回歸函數(shù),其中c1,c2是待定的參數(shù)

,現(xiàn)在問題轉(zhuǎn)化為如何利用成對數(shù)據(jù)估計(jì)參數(shù)c1和c2.為了利用一元線性回歸模型估計(jì)參數(shù)c1和c2,我們引進(jìn)一個(gè)中間變量x,令x=ln(t-1895),通過x=ln(t-1895),將年份變量數(shù)據(jù)進(jìn)行變換,得到新的成對數(shù)據(jù),如下表.編號12345678年份/t18961912192119301936195619601968x0.002.833.263.563.714.114.174.29記錄/s11.8010.6010.4010.3010.2010.1010.009.95令x=ln(t

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論