




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
§3.1回歸分析的思想及其初步應用(1)高中數(shù)學選修2-3·精品課件第三章統(tǒng)計案例
復習回顧
求回歸直線方程的步驟
某大學中隨機選取8名女大學生,其身高和體重數(shù)據(jù)如下表所示.編號12345678身高/cm165165157170175165155170體重/kg4857505464614359求根據(jù)女大學生的身高預報體重的回歸方程,并預報一名身高為172cm的女大學生的體重.案例分析解:①選取身高為自變量x,體重為因變量y,②作散點圖:
因此,對于身高172cm的女大學生,由線性回歸方程可以預報其體重為:如何描述它們之間線性相關關系的強弱?
相關系數(shù)
相關系數(shù)的性質:(1)|r|≤1.
(2)|r|越接近于1,相關程度越強;|r|越接近于0,相關程度越弱.問題:達到怎樣程度,x、y線性相關呢?它們的相關程度怎樣呢?(相關系數(shù)取值及其意義)-1.0+1.00-0.5+0.5完全負相關無線性相關完全正相關負相關程度增加r正相關程度增加相關關系的測度
r=0.798>0.75表明體重與身高有很強的線性相關性,從而說明我們建立的回歸模型是有意義的.案例1中
r=0.798>0.75表明體重與身高有很強的線性相關性,從而說明我們建立的回歸模型是有意義的.案例1中身高為172cm的女大學生的體重一定是60.316kg嗎?如果不是,你能解析一下原因嗎?答:身高為172cm的女大學生的體重不一定是60.316kg,但一般可以認為她的體重在60.316kg左右.從散點圖看到,樣本點散布在某一條直線的附近,而不是在一條直線上,所以不能用一次函數(shù)y=bx+a描述它們關系.
我們可以線性回歸模型來表示:y=bx+a+e,其中a和b為模型的未知參數(shù),e稱為隨機誤差.案例分析思考:產生隨機誤差項e的原因是什么?隨機誤差e的來源(可以推廣到一般):1、忽略了其它因素的影響:影響身高y的因素不只是體重x,可能還包括遺傳基因、飲食習慣、生長環(huán)境等因素;2、用線性回歸模型近似真實模型所引起的誤差;3、身高y
的觀測誤差.
以上三項誤差越小,說明我們的回歸模型的擬合效果越好.思考:產生隨機誤差項e的原因是什么?隨機誤差e的來源(可以推廣到一般):1、忽略了其它因素的影響:影響身高y的因素不只是體重x,可能還包括遺傳基因、飲食習慣、生長環(huán)境等因素;2、用線性回歸模型近似真實模型所引起的誤差;3、身高y
的觀測誤差.
以上三項誤差越小,說明我們的回歸模型的擬合效果越好.函數(shù)模型與回歸模型之間的差別
可以提供選擇模型的準則我們把自變量x稱為解釋變量,因變量y稱為預報變量.
函數(shù)模型與回歸模型之間的差別我們把自變量x稱為解釋變量,因變量y稱為預報變量.
函數(shù)模型與回歸模型之間的差別線性回歸模型y=bx+a+e與一次函數(shù)模型不同之處在于多了一個隨機誤差e,y的值有它們一起決定.解釋變量x預報變量y隨機誤差e函數(shù)模型與回歸模型之間的差別如何估計a,b,e?
則她們身高-體重的散點圖應該在一條水平直線上:事實上,并非如此,它們和54.5之間存在差別,這時我們就引入隨機誤差,利用隨機誤差和解釋變量共同來預報變量y.54.5kg把所有的這種效應利用總體偏差平方和合并成一個數(shù).怎樣去刻畫每個效應呢?
把所有的這種效應利用總體偏差平方和合并成一個數(shù).怎樣去刻畫每個效應呢?
為了回歸的準確和計算的方便我們引入殘差平方和它代表隨機誤差的效應求出了隨機誤差的效應后,就比較容易得到解釋變量的效應了.同學們知道怎樣求嗎?解釋變量的效應=總體偏差平方和-殘差平方和回歸平方和相關指數(shù)R2:殘差平方和總體偏差平方和顯然,當R2的值越大,說明殘差所占的比例越小,回歸效果約好;反之,回歸效果越差.一般的,當R2越接近于1,說明解釋變量和預報變量之間的相關性越強,如果同一個問題,采用不同的回歸方法分析,我們可以通過選擇R2大的來作為回歸模型.
一般方法:1.利用散點圖觀察兩個變量是否線性相關2.利用殘差來判斷模型擬合的效果(殘差分析)利用殘差圖來分析數(shù)據(jù),對可疑數(shù)據(jù)(殘差較大的數(shù)據(jù))進行重新調查,有錯誤就更正,然后重新利用回歸模型擬合,如果沒有錯誤,則需要找其他原因.殘差圖:編號12345678身高/cm165165157170175165155170體重/kg4857505464614359殘差-6.3732.6272.419-4.6181.1376.627-2.8830.382問題數(shù)據(jù)越窄越好例1.以下是某地搜集到的新房屋的銷售價格y和房屋的面積x的數(shù)據(jù):房屋面積/m211511080135105銷售價格/萬元24.821.618.429.222(1)畫出數(shù)據(jù)對應的散點圖;(2)求線性回歸方程,并在散點圖中加上回歸直線;(3)據(jù)(2)的結果估計當房屋面積為150m2時的銷售價格.例題解析解:(1)數(shù)據(jù)對應的散點圖如下圖所示:
例2.已知某種商品的價格x(元)與需求量y(件)之間的關系有如下一組數(shù)據(jù):求y對x的回歸直線方程,并說明回歸模型擬合效果的好壞.x1416182022y1210753例題解析
所以回歸模型的擬合效果很好.回歸分析基本思想及其初步應用基本思想實際應用回歸分析相關性方法分析回歸優(yōu)劣分析總偏差平方和殘差平方和回歸平方和課堂小結
(相關系數(shù)取值及其意義)-1.0+1.00-0.5+0.5完全負相關無線性相關完全正相關負相關程度增加r正相關程度增加相關關系的測度因此,對于身高172cm的女大學生,由線性回歸方程可以預報其體重為:如何描述它們之間線性相關關系的強弱?
復習回顧解:①選取身高為自變量x,體重為因變量y,②作散點圖:
(相關系數(shù)取值及其意義)-1.0+1.00-0.5+0.5完全負相關無線性相關完全正相關負相關程度增加r正相關程度增加相關關系的測度因此,對于身高172cm的女大學生,由線性回歸方程可以預報其體重為:如何描述它們之間線性相關關系的強弱?
某大學中隨機選取8名女大學生,其身高和體重數(shù)據(jù)如下表所示.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農莊基地出租合同范本
- 買賣物業(yè)用房合同范本
- 醫(yī)療行業(yè)會議服務合同范例
- 廚房滅火維保合同范本
- 合資購車經(jīng)營合同范本
- 吊車合伙經(jīng)營合同范本
- 含稅購貨合同范本
- 運動俱樂部協(xié)議合同范本
- 蔬菜配送合同范本
- 入股餐廳合同范本
- 《抖音營銷教程》課件
- 2025屆山東核電校園招聘正式啟動筆試參考題庫附帶答案詳解
- 2025安徽蕪湖市運達軌道交通建設運營限公司招聘129人高頻重點模擬試卷提升(共500題附帶答案詳解)
- 2025年湖南科技職業(yè)學院高職單招職業(yè)技能測試近5年常考版參考題庫含答案解析
- 2025屆江蘇省無錫市江陰實驗中學中考聯(lián)考歷史試題含解析
- 2024年安徽省高校分類考試對口招生語文試卷真題(含答案)
- 2025年蘇州健雄職業(yè)技術學院高職單招語文2018-2024歷年參考題庫頻考點含答案解析
- 中國高血壓防治指南(2024年修訂版)解讀課件
- 公路工程標準施工招標文件(2018年版)
- (正式版)SH∕T 3548-2024 石油化工涂料防腐蝕工程施工及驗收規(guī)范
- (高清版)JTG 3370.1-2018 公路隧道設計規(guī)范 第一冊 土建工程
評論
0/150
提交評論