版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
8.2.2一元線性回歸模型參數(shù)的最小二乘估計
(第一課時)利用最小二乘法和成對樣本數(shù)據(jù)估計一元線性回歸模型Y=bx+a+e中的參數(shù)a和b;了解最小二乘法的原理,能利用該原理推導參數(shù)估計值的計算公式.提出問題確定研究變量收集數(shù)據(jù)畫散點圖建立回歸模型做出預(yù)報(一元線性回歸模型)定相關(guān)關(guān)系計算r求解回歸直線方程y=bx+a(估計參數(shù)a,b)思考1:如何從散點圖中尋找到一條適當?shù)闹本€,使得這些散點在整體上與這條直線最接近方案1:先畫出一條直線,測量出各點與直線的距離,然后移動直線,到達一個使距離的和最小的位置.測量出此時的斜率和截距,就可得到一條直線,如圖.方案2:在圖中選擇兩點畫直線,使得直線兩側(cè)的點的個數(shù)基本相同,把這條直線作為所求直線,如圖.方案3:在散點圖中多取幾對點,確定出幾條直線的方程,再分別求出這些直線的斜率、截距的平均數(shù),將這兩個平均數(shù)作為所求直線的斜率和截距.上面這些方法雖然有一定的道理,但比較難操作,我們需要另辟蹊徑.先進一步明確我們面臨的任務(wù):從成對樣本數(shù)據(jù)出發(fā),用數(shù)學的方法刻畫“從整體上看,各散點與直線最接近”.通常,我們會想到利用點到直線y=bx+a的“距離”來刻畫散點與該直線的接近程度,然后用所有“距離”之和刻畫所有樣本觀測數(shù)據(jù)與該直線的接近程度.思考2:如何利用成對樣本數(shù)據(jù),用數(shù)學方法刻畫“從整體上看,各散點與直線最接近”析:可令n個樣本點與直線的豎直距離之和最小y=bx+a問題分析——利用樣本數(shù)據(jù)尋找一條適當?shù)闹本€最小二乘法設(shè)滿足一元線性回歸模型的兩個變量的n對樣本數(shù)據(jù)為(x1,
y1),(x2,
y2),???,(xn,
yn),由yi=bxi+a+ei(i=1,2,???,n),得顯然|ei|越小,表示點(xi,
yi)與點(xi,
bxi+a)的“距離”越小,即樣本數(shù)據(jù)點離直線y=bx+a的豎直距離越小,如右圖所示.特別地,當ei=0時,表示點(xi,
yi)在這條直線上.因此,可以用這n個豎直距離之和來刻畫各樣本觀測數(shù)據(jù)與直線y=bx+a的“整體接近程度”.在實際應(yīng)用中,因為絕對值使得計算不方便,所以人們通常用各散點到直線的豎直距離的平方之和來刻畫“整體接近程度”.所以我們可以取使Q達到最小的a和b的值作為截距和斜率的估計值.綜上,當a,b的取值為時,Q達到最小.經(jīng)驗回歸方程與最小二乘估計:我們將
稱為Y關(guān)于x的經(jīng)驗回歸方程,也稱經(jīng)驗回歸函數(shù)或經(jīng)驗回歸公式,其圖形稱為經(jīng)驗回歸直線.
這種求經(jīng)驗回歸方程的方法叫做最小二乘法,利用公式(2)求得的
叫做b,a的最小二乘估計.這里的“二乘”是平方的意思.問題解決——最小二乘法求經(jīng)驗回歸方程圖形推導編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182
含義2:父親身高為176cm的所有兒子身高的均值的估計值為177cm.
斜率可以解釋為父親身高每增加1cm,其兒子身高平均增加0.839cm.含義1:由方程作出推測,當父親身高為176cm時,兒子身高一般在177cm左右.高個子父親有生高個子兒子的趨勢,矮個子父親有生矮個子兒子的趨勢,思考5:分析案例中的經(jīng)驗回歸方程可得到什么結(jié)論?
兒子身高有向平均身高回歸的趨勢英國統(tǒng)計學家高爾頓把這種后代身高向中間值靠近的趨勢稱為“回歸現(xiàn)象”(自閱課本P122-123了解“回歸的含義”)商店名稱ABCDE銷售額x/千萬元35679利潤額y/百萬元23345例1某連鎖經(jīng)營公司所屬5個零售店某月的銷售額和利潤額資料如下表:(1)畫出銷售額和利潤額的散點圖;(2)計算利潤額y對銷售額x的經(jīng)驗回歸直線方程.解:(1)散點圖如下:∴所求經(jīng)驗回歸方程為解1:(2)商店名稱ABCDE銷售額x/千萬元35679利潤額y/百萬元23345∴所求經(jīng)驗回歸方程為解2:(2)商店名稱ABCDE銷售額x/千萬元35679利潤額y/百萬元23345x(s)5101520304050607090120y(μm)610101316171923252946
例2在某種產(chǎn)品表面進行腐蝕刻線試驗,得到腐蝕深度y(μm)與腐蝕時間x(s)之間的一組觀察值如表.(1)畫出散點圖;(2)求y關(guān)于x的經(jīng)驗回歸方程;(3)利用經(jīng)驗回歸方程預(yù)測時間為100s時腐蝕深度為多少.解:(1)散點圖如圖所示,x(s)5101520304050607090120y(μm)610101316171923252946∴y關(guān)于x的經(jīng)驗回歸方程為解:(3)根據(jù)(2)求得的經(jīng)驗回歸方程,當腐蝕時間為100s時,即腐蝕時間為100s時腐蝕深度為約35.76μm.x123456y021334練1
已知x與y之間的幾組數(shù)據(jù)如下表:則y對x的經(jīng)驗回歸直線必過點__________.父親身高x/cm174176176176178兒子身高y/cm175175176177177C練2為了解兒子身高與其父親身高的關(guān)系,隨機抽取5對身高數(shù)據(jù)如下:則y對x的經(jīng)驗回歸直線方程為().年份x20162017201820192020儲蓄存款額y/千億元567810
練習3
某地隨著經(jīng)濟的發(fā)展,居民收入逐年增長,該地一銀行連續(xù)五年年底的儲蓄存款情況如下表所示.為了計算方便,工作人員將上表的數(shù)據(jù)進行了處理,令t=x-2015,z=y(tǒng)-5,得到下表.t12345z01235(1)求z關(guān)于t的經(jīng)驗回歸方程;(2)通過(1)中的方程,求出y關(guān)于x的經(jīng)驗回歸方程;(3)用所求經(jīng)驗回歸方程預(yù)測到2022年年底,該地此銀行儲蓄存款額可達到多少?(1)求z關(guān)于t的經(jīng)驗回歸方程;(2)通過(1)中的方程,求出y關(guān)于x的經(jīng)驗回歸方程;(3)用所求經(jīng)驗回歸方程預(yù)測到2022年年底,該地此銀行儲蓄存款額可達到多少?t12345z01235解:∴z關(guān)于t的經(jīng)驗回歸方程為∴y關(guān)于x的經(jīng)驗回歸方程為∴預(yù)測到2022年年底,該地此銀行儲蓄存款額可達到12千億元.求經(jīng)驗回歸方程的步驟:殘差=觀測值-預(yù)報值對于響應(yīng)變量Y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗回歸方程得到的)稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差.殘差是隨機誤差的估計結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.殘差分析:例如,對于下表中的第6個觀測,父親身高為172cm,其兒子身高的觀測值為y6=176(cm),預(yù)測值為殘差為176-173.265=2.735(cm).編號1234567891011121314父親身高/cm174170173169182172180172168166182173164180兒子身高/cm176176170170185176178174170168178172165182類似地,我們還可以得到其他的殘差,如下表所示.父親身高x174170173169182172180172168166182173164180兒子身高觀測值yi176176170170185176178174170168178172165182174.943171.587174.104170.748181.655173.265179.977173.265169.909168.231181.655174.104166.553179.9771.0574.413-4.104-0.7483.3452.735-1.9770.7350.091-0.231-3.655-2.104-1.5532.023為了使數(shù)據(jù)更加直觀,用父親身高作為橫坐標,殘差作為縱坐標,可以畫出殘差圖,如圖下所示.殘差圖:012345-1-2-3-4-5160165170175180185殘差/cm父親身高/cm??????????????觀判斷模型是否滿足一元線性回歸模型的假設(shè).
一般地,建立經(jīng)驗回歸方程后,通常需要對模型刻畫數(shù)據(jù)的效果進行分析.借助殘差分析還可以對模型進行改進,使我們能根據(jù)改進模型作出更符合實際的預(yù)測與決策.觀察殘差的散點圖可以發(fā)現(xiàn),殘差比較均勻地分布在橫軸的兩邊.說明殘差比較符合一元線性回歸模型的假定,是均值為0、方差為σ2的隨機變量的觀測值.可見,通過觀察殘差圖可以直2.殘差的作用:判斷回歸模型刻畫數(shù)據(jù)的效果;發(fā)現(xiàn)原始數(shù)據(jù)中是否存在可疑數(shù)據(jù),對模型進行改進,使我們能根據(jù)改進模型作出更符合實際的預(yù)測與決策.1.殘差分析途徑:列殘差表、作殘差圖.以殘差為縱坐標,以樣本編號(或x)為橫坐標.若存在某幾個樣本點的殘差絕對值較大,則為可以數(shù)據(jù),需予以糾正或剔除,再重新建立回歸模型.殘差圖:殘差有正有負,比較均勻地分布在橫軸的兩邊,說明殘差比較符合一元線性回歸模型中對于隨機誤差的假定帶狀區(qū)域?qū)挾仍秸?,殘差絕對值越小,且較均勻地落在橫軸附近,說明回歸方程預(yù)報的精度越高.
殘差與觀測時間有線性關(guān)系,應(yīng)將時間變量納入模型殘差與觀測時間有非線性關(guān)系,應(yīng)在模型中加入時間的非線性函數(shù)部分殘差的方差不是一個常數(shù),隨觀測時間的變大而變大殘差比較均勻地分布在以取值為0的橫軸為對稱軸的水平帶狀區(qū)域內(nèi),滿足一元線性回歸模型對隨機誤差的假設(shè).練習1.已知兩個線性相關(guān)變量與的統(tǒng)計數(shù)據(jù)如下表:x3456y2.534m
殘差的概念回歸直線過樣本點中心B練習2.2020年初,新型冠狀病毒引起的肺炎疫情爆發(fā)以來,各地醫(yī)療機構(gòu)采取了各種針對性的治療方法,取得了不錯的成效,某醫(yī)療機構(gòu)開始使用中西醫(yī)結(jié)合方法后,每周治愈的患者人數(shù)如下表所示:第x周12345治愈人數(shù)y(單位:十人)38101415
BP113-例.經(jīng)驗表明,一般樹的胸徑(樹的主干在地面以上1.3m處的直徑)越大,樹就越高.由于測量樹高比測量胸徑困難,因此研究人員希望由胸徑預(yù)測樹高.在研究樹高與胸徑之間的關(guān)系時,某林場收集了某種樹的一些數(shù)據(jù)(如下表),試根據(jù)這些數(shù)據(jù)建立樹高關(guān)于胸徑的經(jīng)驗回歸方程.編號123456789101112胸徑d/cm18.120.122.224.426.028.329.632.433.735.738.340.2樹高h/m18.819.22
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024版企業(yè)財務(wù)數(shù)據(jù)保密合作合同版B版
- 2024版影視作品制作與發(fā)行協(xié)議
- 2024自然人互貸現(xiàn)金協(xié)議樣式大全版B版
- 2024門店勞動法執(zhí)行標準勞動合同范本解析3篇
- 二零二五年度鋼筋班組勞務(wù)分包安全生產(chǎn)責任合同3篇
- 專業(yè)測量員招聘協(xié)議樣本2024
- 二零二五版保險資金股權(quán)質(zhì)押反擔保貸款合同3篇
- 二零二五年度床上用品原材料進口與加工合同3篇
- 二零二五版人工智能應(yīng)用第三方履約擔保協(xié)議3篇
- 沈陽化工大學《審計學A》2023-2024學年第一學期期末試卷
- 2024-2030年中國連續(xù)性腎臟替代治療(CRRT)行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略分析報告
- 場地委托授權(quán)
- 腦血管疾病三級預(yù)防
- HSK標準教程5上-課件-L1
- 人教版五年級下冊數(shù)學預(yù)習單、學習單、檢測單
- JC-T 746-2023 混凝土瓦標準規(guī)范
- 如何落實管業(yè)務(wù)必須管安全
- 四年級上冊三位數(shù)乘除兩位數(shù)計算題
- 《水電工程招標設(shè)計報告編制規(guī)程》
- 2023年甘肅蘭州中考道德與法治試題及答案
- 生產(chǎn)工廠管理手冊
評論
0/150
提交評論