




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
8.2.2一元線性回歸模型參數(shù)的最小二乘估計(jì)
(第一課時(shí))利用最小二乘法和成對樣本數(shù)據(jù)估計(jì)一元線性回歸模型Y=bx+a+e中的參數(shù)a和b;了解最小二乘法的原理,能利用該原理推導(dǎo)參數(shù)估計(jì)值的計(jì)算公式.提出問題確定研究變量收集數(shù)據(jù)畫散點(diǎn)圖建立回歸模型做出預(yù)報(bào)(一元線性回歸模型)定相關(guān)關(guān)系計(jì)算r求解回歸直線方程y=bx+a(估計(jì)參數(shù)a,b)思考1:如何從散點(diǎn)圖中尋找到一條適當(dāng)?shù)闹本€,使得這些散點(diǎn)在整體上與這條直線最接近方案1:先畫出一條直線,測量出各點(diǎn)與直線的距離,然后移動(dòng)直線,到達(dá)一個(gè)使距離的和最小的位置.測量出此時(shí)的斜率和截距,就可得到一條直線,如圖.方案2:在圖中選擇兩點(diǎn)畫直線,使得直線兩側(cè)的點(diǎn)的個(gè)數(shù)基本相同,把這條直線作為所求直線,如圖.方案3:在散點(diǎn)圖中多取幾對點(diǎn),確定出幾條直線的方程,再分別求出這些直線的斜率、截距的平均數(shù),將這兩個(gè)平均數(shù)作為所求直線的斜率和截距.上面這些方法雖然有一定的道理,但比較難操作,我們需要另辟蹊徑.先進(jìn)一步明確我們面臨的任務(wù):從成對樣本數(shù)據(jù)出發(fā),用數(shù)學(xué)的方法刻畫“從整體上看,各散點(diǎn)與直線最接近”.通常,我們會(huì)想到利用點(diǎn)到直線y=bx+a的“距離”來刻畫散點(diǎn)與該直線的接近程度,然后用所有“距離”之和刻畫所有樣本觀測數(shù)據(jù)與該直線的接近程度.思考2:如何利用成對樣本數(shù)據(jù),用數(shù)學(xué)方法刻畫“從整體上看,各散點(diǎn)與直線最接近”析:可令n個(gè)樣本點(diǎn)與直線的豎直距離之和最小y=bx+a問題分析——利用樣本數(shù)據(jù)尋找一條適當(dāng)?shù)闹本€最小二乘法設(shè)滿足一元線性回歸模型的兩個(gè)變量的n對樣本數(shù)據(jù)為(x1,
y1),(x2,
y2),???,(xn,
yn),由yi=bxi+a+ei(i=1,2,???,n),得顯然|ei|越小,表示點(diǎn)(xi,
yi)與點(diǎn)(xi,
bxi+a)的“距離”越小,即樣本數(shù)據(jù)點(diǎn)離直線y=bx+a的豎直距離越小,如右圖所示.特別地,當(dāng)ei=0時(shí),表示點(diǎn)(xi,
yi)在這條直線上.因此,可以用這n個(gè)豎直距離之和來刻畫各樣本觀測數(shù)據(jù)與直線y=bx+a的“整體接近程度”.在實(shí)際應(yīng)用中,因?yàn)榻^對值使得計(jì)算不方便,所以人們通常用各散點(diǎn)到直線的豎直距離的平方之和來刻畫“整體接近程度”.所以我們可以取使Q達(dá)到最小的a和b的值作為截距和斜率的估計(jì)值.綜上,當(dāng)a,b的取值為時(shí),Q達(dá)到最小.經(jīng)驗(yàn)回歸方程與最小二乘估計(jì):我們將
稱為Y關(guān)于x的經(jīng)驗(yàn)回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)回歸直線.
這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,利用公式(2)求得的
叫做b,a的最小二乘估計(jì).這里的“二乘”是平方的意思.問題解決——最小二乘法求經(jīng)驗(yàn)回歸方程圖形推導(dǎo)編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182
含義2:父親身高為176cm的所有兒子身高的均值的估計(jì)值為177cm.
斜率可以解釋為父親身高每增加1cm,其兒子身高平均增加0.839cm.含義1:由方程作出推測,當(dāng)父親身高為176cm時(shí),兒子身高一般在177cm左右.高個(gè)子父親有生高個(gè)子兒子的趨勢,矮個(gè)子父親有生矮個(gè)子兒子的趨勢,思考5:分析案例中的經(jīng)驗(yàn)回歸方程可得到什么結(jié)論?
兒子身高有向平均身高回歸的趨勢英國統(tǒng)計(jì)學(xué)家高爾頓把這種后代身高向中間值靠近的趨勢稱為“回歸現(xiàn)象”(自閱課本P122-123了解“回歸的含義”)商店名稱ABCDE銷售額x/千萬元35679利潤額y/百萬元23345例1某連鎖經(jīng)營公司所屬5個(gè)零售店某月的銷售額和利潤額資料如下表:(1)畫出銷售額和利潤額的散點(diǎn)圖;(2)計(jì)算利潤額y對銷售額x的經(jīng)驗(yàn)回歸直線方程.解:(1)散點(diǎn)圖如下:∴所求經(jīng)驗(yàn)回歸方程為解1:(2)商店名稱ABCDE銷售額x/千萬元35679利潤額y/百萬元23345∴所求經(jīng)驗(yàn)回歸方程為解2:(2)商店名稱ABCDE銷售額x/千萬元35679利潤額y/百萬元23345x(s)5101520304050607090120y(μm)610101316171923252946
例2在某種產(chǎn)品表面進(jìn)行腐蝕刻線試驗(yàn),得到腐蝕深度y(μm)與腐蝕時(shí)間x(s)之間的一組觀察值如表.(1)畫出散點(diǎn)圖;(2)求y關(guān)于x的經(jīng)驗(yàn)回歸方程;(3)利用經(jīng)驗(yàn)回歸方程預(yù)測時(shí)間為100s時(shí)腐蝕深度為多少.解:(1)散點(diǎn)圖如圖所示,x(s)5101520304050607090120y(μm)610101316171923252946∴y關(guān)于x的經(jīng)驗(yàn)回歸方程為解:(3)根據(jù)(2)求得的經(jīng)驗(yàn)回歸方程,當(dāng)腐蝕時(shí)間為100s時(shí),即腐蝕時(shí)間為100s時(shí)腐蝕深度為約35.76μm.x123456y021334練1
已知x與y之間的幾組數(shù)據(jù)如下表:則y對x的經(jīng)驗(yàn)回歸直線必過點(diǎn)__________.父親身高x/cm174176176176178兒子身高y/cm175175176177177C練2為了解兒子身高與其父親身高的關(guān)系,隨機(jī)抽取5對身高數(shù)據(jù)如下:則y對x的經(jīng)驗(yàn)回歸直線方程為().年份x20162017201820192020儲(chǔ)蓄存款額y/千億元567810
練習(xí)3
某地隨著經(jīng)濟(jì)的發(fā)展,居民收入逐年增長,該地一銀行連續(xù)五年年底的儲(chǔ)蓄存款情況如下表所示.為了計(jì)算方便,工作人員將上表的數(shù)據(jù)進(jìn)行了處理,令t=x-2015,z=y(tǒng)-5,得到下表.t12345z01235(1)求z關(guān)于t的經(jīng)驗(yàn)回歸方程;(2)通過(1)中的方程,求出y關(guān)于x的經(jīng)驗(yàn)回歸方程;(3)用所求經(jīng)驗(yàn)回歸方程預(yù)測到2022年年底,該地此銀行儲(chǔ)蓄存款額可達(dá)到多少?(1)求z關(guān)于t的經(jīng)驗(yàn)回歸方程;(2)通過(1)中的方程,求出y關(guān)于x的經(jīng)驗(yàn)回歸方程;(3)用所求經(jīng)驗(yàn)回歸方程預(yù)測到2022年年底,該地此銀行儲(chǔ)蓄存款額可達(dá)到多少?t12345z01235解:∴z關(guān)于t的經(jīng)驗(yàn)回歸方程為∴y關(guān)于x的經(jīng)驗(yàn)回歸方程為∴預(yù)測到2022年年底,該地此銀行儲(chǔ)蓄存款額可達(dá)到12千億元.求經(jīng)驗(yàn)回歸方程的步驟:殘差=觀測值-預(yù)報(bào)值對于響應(yīng)變量Y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗(yàn)回歸方程得到的)稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差.殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.殘差分析:例如,對于下表中的第6個(gè)觀測,父親身高為172cm,其兒子身高的觀測值為y6=176(cm),預(yù)測值為殘差為176-173.265=2.735(cm).編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182類似地,我們還可以得到其他的殘差,如下表所示.父親身高x174170173169182172180172168166182173164180兒子身高觀測值yi176176170170185176178174170168178172165182174.943171.587174.104170.748181.655173.265179.977173.265169.909168.231181.655174.104166.553179.9771.0574.413-4.104-0.7483.3452.735-1.9770.7350.091-0.231-3.655-2.104-1.5532.023為了使數(shù)據(jù)更加直觀,用父親身高作為橫坐標(biāo),殘差作為縱坐標(biāo),可以畫出殘差圖,如圖下所示.殘差圖:012345-1-2-3-4-5160165170175180185殘差/cm父親身高/cm??????????????觀判斷模型是否滿足一元線性回歸模型的假設(shè).
一般地,建立經(jīng)驗(yàn)回歸方程后,通常需要對模型刻畫數(shù)據(jù)的效果進(jìn)行分析.借助殘差分析還可以對模型進(jìn)行改進(jìn),使我們能根據(jù)改進(jìn)模型作出更符合實(shí)際的預(yù)測與決策.觀察殘差的散點(diǎn)圖可以發(fā)現(xiàn),殘差比較均勻地分布在橫軸的兩邊.說明殘差比較符合一元線性回歸模型的假定,是均值為0、方差為σ2的隨機(jī)變量的觀測值.可見,通過觀察殘差圖可以直2.殘差的作用:判斷回歸模型刻畫數(shù)據(jù)的效果;發(fā)現(xiàn)原始數(shù)據(jù)中是否存在可疑數(shù)據(jù),對模型進(jìn)行改進(jìn),使我們能根據(jù)改進(jìn)模型作出更符合實(shí)際的預(yù)測與決策.1.殘差分析途徑:列殘差表、作殘差圖.以殘差為縱坐標(biāo),以樣本編號(或x)為橫坐標(biāo).若存在某幾個(gè)樣本點(diǎn)的殘差絕對值較大,則為可以數(shù)據(jù),需予以糾正或剔除,再重新建立回歸模型.殘差圖:殘差有正有負(fù),比較均勻地分布在橫軸的兩邊,說明殘差比較符合一元線性回歸模型中對于隨機(jī)誤差的假定帶狀區(qū)域?qū)挾仍秸?,殘差絕對值越小,且較均勻地落在橫軸附近,說明回歸方程預(yù)報(bào)的精度越高.
殘差與觀測時(shí)間有線性關(guān)系,應(yīng)將時(shí)間變量納入模型殘差與觀測時(shí)間有非線性關(guān)系,應(yīng)在模型中加入時(shí)間的非線性函數(shù)部分殘差的方差不是一個(gè)常數(shù),隨觀測時(shí)間的變大而變大殘差比較均勻地分布在以取值為0的橫軸為對稱軸的水平帶狀區(qū)域內(nèi),滿足一元線性回歸模型對隨機(jī)誤差的假設(shè).練習(xí)1.已知兩個(gè)線性相關(guān)變量與的統(tǒng)計(jì)數(shù)據(jù)如下表:x3456y2.534m
殘差的概念回歸直線過樣本點(diǎn)中心B練習(xí)2.2020年初,新型冠狀病毒引起的肺炎疫情爆發(fā)以來,各地醫(yī)療機(jī)構(gòu)采取了各種針對性的治療方法,取得了不錯(cuò)的成效,某醫(yī)療機(jī)構(gòu)開始使用中西醫(yī)結(jié)合方法后,每周治愈的患者人數(shù)如下表所示:第x周12345治愈人數(shù)y(單位:十人)38101415
BP113-例.經(jīng)驗(yàn)表明,一般樹的胸徑(樹的主干在地面以上1.3m處的直徑)越大,樹就越高.由于測量樹高比測量胸徑困難,因此研究人員希望由胸徑預(yù)測樹高.在研究樹高與胸徑之間的關(guān)系時(shí),某林場收集了某種樹的一些數(shù)據(jù)(如下表),試根據(jù)這些數(shù)據(jù)建立樹高關(guān)于胸徑的經(jīng)驗(yàn)回歸方程.編號123456789101112胸徑d/cm18.120.122.224.426.028.329.632.433.735.738.340.2樹高h(yuǎn)/m18.819.22
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中職高考數(shù)學(xué)二輪復(fù)習(xí)專項(xiàng)突破練習(xí)專題44 綜合練習(xí)9(含答案)
- 鐘表、眼鏡零售企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報(bào)告
- 行李包裹托運(yùn)服務(wù)企業(yè)ESG實(shí)踐與創(chuàng)新戰(zhàn)略研究報(bào)告
- 白板筆批發(fā)企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報(bào)告
- 臺歷批發(fā)企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報(bào)告
- 硝酸稀土企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報(bào)告
- 智能照明臺燈行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 音響設(shè)備家電專門零售企業(yè)縣域市場拓展與下沉戰(zhàn)略研究報(bào)告
- 涼茶飲料企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報(bào)告
- 鋁電水壺企業(yè)數(shù)字化轉(zhuǎn)型與智慧升級戰(zhàn)略研究報(bào)告
- 2024年中北大學(xué)招考聘用博士研究生(高頻重點(diǎn)復(fù)習(xí)提升訓(xùn)練)共500題附帶答案詳解
- 村衛(wèi)生室靜脈輸液規(guī)范和安全管理制度
- 供應(yīng)商大會(huì)總結(jié)報(bào)告
- JGJ127-2000 看守所建筑設(shè)計(jì)規(guī)范
- 名著閱讀(解析版)-2024年中考語文真題(江蘇專用)
- (高清版)JTG 6310-2022 收費(fèi)公路聯(lián)網(wǎng)收費(fèi)技術(shù)標(biāo)準(zhǔn)
- DZ∕T 0203-2020 礦產(chǎn)地質(zhì)勘查規(guī)范 稀有金屬類(正式版)
- 會(huì)議新聞寫作要求與技巧
- 聽評課方法與策略
- (正式版)QBT 8018-2024 熟制與生干核桃和仁
- 農(nóng)村商業(yè)銀行合規(guī)培訓(xùn)
評論
0/150
提交評論