




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、求回歸直線方程的步驟:(3)代入公式(4)寫出直線方程為y=bx+a,即為所求的回歸直線方程。^(1)畫散點圖第1頁/共21頁1、求回歸直線方程的步驟:(3)代入公式(4)寫出直線方程為1例1從某大學中隨機選取8名女大學生,其身高和體重數(shù)據如表1-1所示。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359求根據一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為172cm的女大學生的體重。3、從散點圖還看到,樣本點散布在某一條直線的附近,而不是在一條直線上,所以不能用一次函數(shù)y=bx+a描述它們關系。思考產生隨機誤差項e的原因是什么?
我們可以用下面的線性回歸模型來表示:y=bx+a+e,其中a和b為模型的未知參數(shù),e稱為隨機誤差。第2頁/共21頁例1從某大學中隨機選取8名女大學生,其身高和體重數(shù)據如表12思考產生隨機誤差項e的原因是什么?隨機誤差e的來源(可以推廣到一般):1、其它因素的影響:影響身高y的因素不只是體重x,可能還包括遺傳基因、飲食習慣、生長環(huán)境等因素;2、用線性回歸模型近似真實模型所引起的誤差;3、身高y的觀測誤差。第3頁/共21頁思考隨機誤差e的來源(可以推廣到一般):第3頁/共21頁35943616454505748體重/kg170155165175170157165165身高/cm87654321編號
假設隨機誤差對體重沒有影響,也就是說,體重僅受身高的影響,那么散點圖中所有的點將完全落在回歸直線上。但是,在圖中,數(shù)據點并沒有完全落在回歸直線上。這些點散布在回歸直線附近,所以一定是隨機誤差把這些點從回歸直線上“推”開了。在例1中,殘差平方和約為128.361。
因此,數(shù)據點和它在回歸直線上相應位置的差異是隨機誤差的效應,稱為殘差。例如,編號為6的女大學生,計算殘差為:對每名女大學生計算這個差異,然后分別將所得的值平方后加起來,用數(shù)學符號稱為殘差平方和,表示為:類似于方差的定義第4頁/共21頁5943616454505748體重/kg1701551654表1-4列出了女大學生身高和體重的原始數(shù)據以及相應的殘差數(shù)據。
在研究兩個變量間的關系時,首先要根據散點圖來粗略判斷它們是否線性相關,是否可以用回歸模型來擬合數(shù)據。殘差分析與殘差圖的定義:
然后,我們可以通過殘差來判斷模型擬合的效果,判斷原始數(shù)據中是否存在可疑數(shù)據,這方面的分析工作稱為殘差分析。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382
我們可以利用圖形來分析殘差特性,作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數(shù)據,或體重估計值等,這樣作出的圖形稱為殘差圖。第5頁/共21頁表1-4列出了女大學生身高和體重的原始數(shù)據以及相應的殘差數(shù)據5殘差圖的制作及作用。坐標縱軸為殘差變量,橫軸可以有不同的選擇;若模型選擇的正確,殘差圖中的點應該分布在以橫軸為心的帶形區(qū)域;對于遠離橫軸的點,要特別注意。身高與體重殘差圖異常點
錯誤數(shù)據模型問題
幾點說明:第一個樣本點和第6個樣本點的殘差比較大,需要確認在采集過程中是否有人為的錯誤。如果數(shù)據采集有錯誤,就予以糾正,然后再重新利用線性回歸模型擬合數(shù)據;如果數(shù)據采集沒有錯誤,則需要尋找其他的原因。另外,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型計較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預報精度越高。第6頁/共21頁殘差圖的制作及作用。身高與體重殘差圖異常點錯誤數(shù)據6我們可以用相關指數(shù)R2來刻畫回歸的效果,其計算公式是R2越接近1,表示回歸的效果越好(因為R2越接近1,表示解析變量和預報變量的線性相關性越強)。
如果某組數(shù)據可能采取幾種不同回歸方程進行回歸分析,則可以通過比較R2的值來做出選擇,即選取R2較大的模型作為這組數(shù)據的模型。總的來說:相關指數(shù)R2是度量模型擬合效果的一種指標。在線性模型中,它代表自變量刻畫預報變量的能力。第7頁/共21頁我們可以用相關指數(shù)R2來刻畫回歸的效果,其計算公式是7例關于x與y有如下數(shù)據:
有如下的兩個線性模型:(1);(2)試比較哪一個擬合效果更好。x24568y3040605070第一個好第8頁/共21頁例關于x與y有如下數(shù)據:x24568y30406050708一般地,建立回歸模型的基本步驟為:(1)確定研究對象,明確哪個變量是解析變量,哪個變量是預報變量。(2)畫出確定好的解析變量和預報變量的散點圖,觀察它們之間的關系(如是否存在線性關系等)。(3)由經驗確定回歸方程的類型(如我們觀察到數(shù)據呈線性關系,則選用線性回歸方程y=bx+a).(4)按一定規(guī)則估計回歸方程中的參數(shù)(如最小二乘法)。(5)得出結果后分析殘差圖是否有異常(個別數(shù)據對應殘差過大,或殘差呈現(xiàn)不隨機的規(guī)律性,等等),過存在異常,則檢查數(shù)據是否有誤,或模型是否合適等。第9頁/共21頁一般地,建立回歸模型的基本步驟為:(1)確定研究對象,明確哪9案例2
一只紅鈴蟲的產卵數(shù)y和溫度x有關?,F(xiàn)收集了7組觀測數(shù)據列于表中:(1)試建立產卵數(shù)y與溫度x之間的回歸方程;并預測溫度為28oC時產卵數(shù)目。(2)你所建立的模型中溫度在多大程度上解釋了產卵數(shù)的變化?溫度xoC21232527293235產卵數(shù)y/個711212466115325第10頁/共21頁案例2一只紅鈴蟲的產卵數(shù)y和溫度x有關?,F(xiàn)收集了7組觀10選變量
解:選取氣溫為解析變量x,產卵數(shù)為預報變量y。畫散點圖假設線性回歸方程為:?=bx+a選模型分析和預測當x=28時,y=19.87×28-463.73≈93估計參數(shù)由計算器得:線性回歸方程為y=19.87x-463.73
相關指數(shù)R2=r2≈0.8642=0.7464所以,一次函數(shù)模型中溫度解釋了74.64%的產卵數(shù)變化。探索新知050100150200250300350036912151821242730333639方案1當x=28時,y=19.87×28-463.73≈93線性模型第11頁/共21頁選變量解:選取氣溫為解析變量x,產卵數(shù)畫散點圖假設線11奇怪?93>66?模型不好?第12頁/共21頁奇怪?93>66?第12頁/共21頁12
y=bx2+a變換y=bt+a非線性關系線性關系方案2問題1選用y=bx2+a
,還是y=bx2+cx+a
?問題3
產卵數(shù)氣溫問題2如何求a、b
?合作探究
t=x2二次函數(shù)模型第13頁/共21頁y=bx2+a變13方案2解答平方變換:令t=x2,產卵數(shù)y和溫度x之間二次函數(shù)模型y=bx2+a就轉化為產卵數(shù)y和溫度的平方t之間線性回歸模型y=bt+a溫度21232527293235溫度的平方t44152962572984110241225產卵數(shù)y/個711212466115325作散點圖,并由計算器得:y和t之間的線性回歸方程為y=0.367t-202.54,相關指數(shù)R2=r2≈0.8962=0.802將t=x2代入線性回歸方程得:
y=0.367x2-202.54當x=28時,y=0.367×282-202.54≈85,且R2=0.802,所以,二次函數(shù)模型中溫度解釋了80.2%的產卵數(shù)變化。t第14頁/共21頁方案2解答平方變換:令t=x2,產卵數(shù)y和溫度x之間二次函數(shù)14問題2
變換y=bx+a非線性關系線性關系問題1如何選取指數(shù)函數(shù)的底?產卵數(shù)氣溫指數(shù)函數(shù)模型方案3合作探究對數(shù)第15頁/共21頁問題215方案3解答溫度xoC21232527293235z=lgy0.851.041.321.381.822.062.51產卵數(shù)y/個711212466115325xz當x=28oC時,y≈44,指數(shù)回歸模型中溫度解釋了98.5%的產卵數(shù)的變化由計算器得:z關于x的線性回歸方程為z=0.118x-1.665,相關指數(shù)R2=r2≈0.99252=0.985
對數(shù)變換:在中兩邊取常用對數(shù)得令,則就轉換為z=bx+a第16頁/共21頁方案3解答溫度xoC21232527293235z=lgy016最好的模型是哪個?
產卵數(shù)氣溫產卵數(shù)氣溫線性模型二次函數(shù)模型指數(shù)函數(shù)模型第17頁/共21頁最好的模型是哪個?產卵數(shù)氣溫產卵數(shù)氣溫線性模型二次17比一比函數(shù)模型相關指數(shù)R2線性回歸模型0.7464二次函數(shù)模型0.802指數(shù)函數(shù)模型0.985最好的模型是哪個?第18頁/共21頁比一比函數(shù)模型相關指數(shù)R2線性回歸模型0.7464二次函數(shù)模18總結
對于給定的樣本點兩個含有未知參數(shù)的模型:其中a和b都是未知參數(shù)。擬合效果比較的步驟為:(1)分別建立對應于兩個模型的回歸方程與其中和分別是參數(shù)a和b的估計值;(2)分別計算兩個回歸方程的相關指數(shù)與(3)若則的效果比較好;反之,的效果比較好。第19頁/共21頁總結對于給定的樣本點其中a和b都是未知參19作業(yè):《導航》P63Ex1~4P66Ex1~4第20頁/共21頁作業(yè):第20頁/共21頁20感謝您的欣賞第21頁/共21頁感謝您的欣賞第21頁/共21頁211、求回歸直線方程的步驟:(3)代入公式(4)寫出直線方程為y=bx+a,即為所求的回歸直線方程。^(1)畫散點圖第1頁/共21頁1、求回歸直線方程的步驟:(3)代入公式(4)寫出直線方程為22例1從某大學中隨機選取8名女大學生,其身高和體重數(shù)據如表1-1所示。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359求根據一名女大學生的身高預報她的體重的回歸方程,并預報一名身高為172cm的女大學生的體重。3、從散點圖還看到,樣本點散布在某一條直線的附近,而不是在一條直線上,所以不能用一次函數(shù)y=bx+a描述它們關系。思考產生隨機誤差項e的原因是什么?
我們可以用下面的線性回歸模型來表示:y=bx+a+e,其中a和b為模型的未知參數(shù),e稱為隨機誤差。第2頁/共21頁例1從某大學中隨機選取8名女大學生,其身高和體重數(shù)據如表123思考產生隨機誤差項e的原因是什么?隨機誤差e的來源(可以推廣到一般):1、其它因素的影響:影響身高y的因素不只是體重x,可能還包括遺傳基因、飲食習慣、生長環(huán)境等因素;2、用線性回歸模型近似真實模型所引起的誤差;3、身高y的觀測誤差。第3頁/共21頁思考隨機誤差e的來源(可以推廣到一般):第3頁/共21頁245943616454505748體重/kg170155165175170157165165身高/cm87654321編號
假設隨機誤差對體重沒有影響,也就是說,體重僅受身高的影響,那么散點圖中所有的點將完全落在回歸直線上。但是,在圖中,數(shù)據點并沒有完全落在回歸直線上。這些點散布在回歸直線附近,所以一定是隨機誤差把這些點從回歸直線上“推”開了。在例1中,殘差平方和約為128.361。
因此,數(shù)據點和它在回歸直線上相應位置的差異是隨機誤差的效應,稱為殘差。例如,編號為6的女大學生,計算殘差為:對每名女大學生計算這個差異,然后分別將所得的值平方后加起來,用數(shù)學符號稱為殘差平方和,表示為:類似于方差的定義第4頁/共21頁5943616454505748體重/k1-4列出了女大學生身高和體重的原始數(shù)據以及相應的殘差數(shù)據。
在研究兩個變量間的關系時,首先要根據散點圖來粗略判斷它們是否線性相關,是否可以用回歸模型來擬合數(shù)據。殘差分析與殘差圖的定義:
然后,我們可以通過殘差來判斷模型擬合的效果,判斷原始數(shù)據中是否存在可疑數(shù)據,這方面的分析工作稱為殘差分析。編號12345678身高/cm165165157170175165155170體重/kg4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382
我們可以利用圖形來分析殘差特性,作圖時縱坐標為殘差,橫坐標可以選為樣本編號,或身高數(shù)據,或體重估計值等,這樣作出的圖形稱為殘差圖。第5頁/共21頁表1-4列出了女大學生身高和體重的原始數(shù)據以及相應的殘差數(shù)據26殘差圖的制作及作用。坐標縱軸為殘差變量,橫軸可以有不同的選擇;若模型選擇的正確,殘差圖中的點應該分布在以橫軸為心的帶形區(qū)域;對于遠離橫軸的點,要特別注意。身高與體重殘差圖異常點
錯誤數(shù)據模型問題
幾點說明:第一個樣本點和第6個樣本點的殘差比較大,需要確認在采集過程中是否有人為的錯誤。如果數(shù)據采集有錯誤,就予以糾正,然后再重新利用線性回歸模型擬合數(shù)據;如果數(shù)據采集沒有錯誤,則需要尋找其他的原因。另外,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型計較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預報精度越高。第6頁/共21頁殘差圖的制作及作用。身高與體重殘差圖異常點錯誤數(shù)據27我們可以用相關指數(shù)R2來刻畫回歸的效果,其計算公式是R2越接近1,表示回歸的效果越好(因為R2越接近1,表示解析變量和預報變量的線性相關性越強)。
如果某組數(shù)據可能采取幾種不同回歸方程進行回歸分析,則可以通過比較R2的值來做出選擇,即選取R2較大的模型作為這組數(shù)據的模型。總的來說:相關指數(shù)R2是度量模型擬合效果的一種指標。在線性模型中,它代表自變量刻畫預報變量的能力。第7頁/共21頁我們可以用相關指數(shù)R2來刻畫回歸的效果,其計算公式是28例關于x與y有如下數(shù)據:
有如下的兩個線性模型:(1);(2)試比較哪一個擬合效果更好。x24568y3040605070第一個好第8頁/共21頁例關于x與y有如下數(shù)據:x24568y304060507029一般地,建立回歸模型的基本步驟為:(1)確定研究對象,明確哪個變量是解析變量,哪個變量是預報變量。(2)畫出確定好的解析變量和預報變量的散點圖,觀察它們之間的關系(如是否存在線性關系等)。(3)由經驗確定回歸方程的類型(如我們觀察到數(shù)據呈線性關系,則選用線性回歸方程y=bx+a).(4)按一定規(guī)則估計回歸方程中的參數(shù)(如最小二乘法)。(5)得出結果后分析殘差圖是否有異常(個別數(shù)據對應殘差過大,或殘差呈現(xiàn)不隨機的規(guī)律性,等等),過存在異常,則檢查數(shù)據是否有誤,或模型是否合適等。第9頁/共21頁一般地,建立回歸模型的基本步驟為:(1)確定研究對象,明確哪30案例2
一只紅鈴蟲的產卵數(shù)y和溫度x有關。現(xiàn)收集了7組觀測數(shù)據列于表中:(1)試建立產卵數(shù)y與溫度x之間的回歸方程;并預測溫度為28oC時產卵數(shù)目。(2)你所建立的模型中溫度在多大程度上解釋了產卵數(shù)的變化?溫度xoC21232527293235產卵數(shù)y/個711212466115325第10頁/共21頁案例2一只紅鈴蟲的產卵數(shù)y和溫度x有關。現(xiàn)收集了7組觀31選變量
解:選取氣溫為解析變量x,產卵數(shù)為預報變量y。畫散點圖假設線性回歸方程為:?=bx+a選模型分析和預測當x=28時,y=19.87×28-463.73≈93估計參數(shù)由計算器得:線性回歸方程為y=19.87x-463.73
相關指數(shù)R2=r2≈0.8642=0.7464所以,一次函數(shù)模型中溫度解釋了74.64%的產卵數(shù)變化。探索新知050100150200250300350036912151821242730333639方案1當x=28時,y=19.87×28-463.73≈93線性模型第11頁/共21頁選變量解:選取氣溫為解析變量x,產卵數(shù)畫散點圖假設線32奇怪?93>66?模型不好?第12頁/共21頁奇怪?93>66?第12頁/共21頁33
y=bx2+a變換y=bt+a非線性關系線性關系方案2問題1選用y=bx2+a
,還是y=bx2+cx+a
?問題3
產卵數(shù)氣溫問題2如何求a、b
?合作探究
t=x2二次函數(shù)模型第13頁/共21頁y=bx2+a變34方案2解答平方變換:令t=x2,產卵數(shù)y和溫度x之間二次函數(shù)模型y=bx2+a就轉化為產卵數(shù)y和溫度的平方t之間線性回歸模型y=bt+a溫度21232527293235溫度的平方t44152962572984110241225產卵數(shù)y/個711212466115325作散點圖,并由計算器得:y和t之間的線性回歸方程為y=0.367t-202.54,相關指數(shù)R2=r2≈0.8962=0.802將t=x2代入線性回歸方程得:
y=0.367x2-202.54當x=28時,y=0.367×282-202.54≈85,且R2=0.802,所以,二次函數(shù)模型中溫度解釋了80.2%的產卵數(shù)變化。t第14頁/共21頁方案2解答平方變換:令t=x2,產卵數(shù)y和溫度x之間二次函數(shù)35問題2
變換y=bx+a非線性關系線性關系問題1如何選取指數(shù)函數(shù)的底?產卵數(shù)氣溫指數(shù)函數(shù)模型方案3合作探究對數(shù)第15頁/共21頁
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T-ZLX 088-2024 綠色食品 永嘉早香柚生產技術規(guī)程
- 二零二五年度新材料研發(fā)股份分紅及市場拓展合同模板
- T-ZGZX 0003-2024 成年智力殘疾人托養(yǎng)服務指南
- 二零二五年度夫妻共同財產保全與婚后生活規(guī)劃協(xié)議
- 二零二五年度企業(yè)合同管理制度與品牌建設合同
- 二零二五年度智慧城市建設抵押貸款協(xié)議
- 二零二五年度城市建筑工地渣土車租賃管理協(xié)議
- 二零二五年度農村土地承包經營權流轉與農業(yè)病蟲害防治服務合同
- 二零二五年度高科技企業(yè)股權合作協(xié)議書
- 2025年度生物制藥產業(yè)合作投資合同
- 2021年河南公務員行測考試真題及答案
- 單晶爐車間安全培訓
- 英語演講技巧與實訓學習通超星期末考試答案章節(jié)答案2024年
- 機械制造技術基礎(課程課件完整版)
- 2024年海南省公務員錄用考試《行測》試題及答案解析
- 《預防未成年人犯罪》課件(圖文)
- 九年級化學人教版跨學科實踐3水質檢測及自制凈水器教學設計
- 【醫(yī)院藥品管理系統(tǒng)探析與設計(論文)10000字】
- 螺旋體病梅毒課件
- 2024年咸寧市引進人才44名歷年高頻難、易錯點500題模擬試題附帶答案詳解
- (小學組)全國版圖知識競賽考試題含答案
評論
0/150
提交評論