103變量間的相關關系統(tǒng)計案例 完整版課件_第1頁
103變量間的相關關系統(tǒng)計案例 完整版課件_第2頁
103變量間的相關關系統(tǒng)計案例 完整版課件_第3頁
103變量間的相關關系統(tǒng)計案例 完整版課件_第4頁
103變量間的相關關系統(tǒng)計案例 完整版課件_第5頁
已閱讀5頁,還剩52頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、考綱要求1.會作兩個有關聯(lián)變量數(shù)據(jù)的散點圖,會利用散點圖認識變量間的相關關系2了解最小二乘法的思想,能根據(jù)給出的線性回歸方程系數(shù)公式建立線性回歸方程3了解獨立性檢驗(只要求22列聯(lián)表)的基本思想、方法及其簡單應用4了解回歸分析的基本思想、方法及其簡單應用熱點提示1.以考查線性回歸系數(shù)為主,同時可能考查利用散點圖判斷變量間的相關關系2以實際生活為背景,重在考查獨立檢驗、回歸分析,多以選擇題、填空題為主.1相關關系及回歸分析(1)相關關系:自變量取值一定時,因變量的取值帶有一定的兩個變量之間的關系叫做相關關系(2)回歸分析:在統(tǒng)計中,對具有相關關系的兩個變量進行 叫做回歸分析回歸分析是尋找相關關系

2、中非確定關系的某種確定性隨機性統(tǒng)計分析2散點圖:將n個數(shù)據(jù)點(xi,yi)(i1,2,3n)描在平面直角坐標系中,以表示具有相關關系的兩個變量的叫做散點圖3正相關與負相關:從散點圖上看,點散布的位置在從的區(qū)域內(nèi),兩個變量的這種相關關系稱為正相關;點散布的位置在從的區(qū)域內(nèi),兩個變量的相關關系稱為負相關左下角到右上角左上角到右下角圖形5線性回歸模型ybxae(e稱為 ),因變量y的值由自變量x和隨機誤差e共同確定,即自變量x只能解釋部分y的變化在統(tǒng)計中,我們也把自變量x稱為 ,因變量y稱為隨機誤差解釋變量預報變量系的強弱當r0時,表示兩個變量;當r時,認為兩個變量有很強的線性相關關系正相關負相關幾

3、乎不存在0.757用相關指數(shù)R2來刻畫回歸的效果,其計算公式是R2R2的值越大,說明殘差平方和越小,也就是說模型擬合的效果在線性回歸模型中,R2表示解釋變量對預報變量變化的 ,R2越接近于1,表示回歸的效果越好越好貢獻率8變量的不同“值”表示個體所屬的,這樣的變量稱為分類變量9列出兩個分類變量的表,稱為列聯(lián)表一般地,假設有兩個分類變量X和Y,它們的值域分別為(x1,x2)和(y1,y2),其樣本頻數(shù)列聯(lián)表如下表:y1y2總計x1ababx2cdcd總計acbdabcd稱為22列聯(lián)表不同類別頻數(shù)10利用隨機變量K2來確定在可以認為“兩個分類變量有關系”的方法稱為兩個分類變量的獨立性檢驗,其中K2

4、 多大程度上1有關線性回歸的說法,不正確的是()A相關關系的兩個變量是非確定關系B散點圖能直觀地反映數(shù)據(jù)的相關程度C回歸直線最能代表線性相關的兩個變量之間的關系D散點圖中的點越集中,兩個變量的相關性越強解析:散點圖上的點大致分布在通過散點圖中心的那條直線附近,整體上呈線性分布時,兩個變量相關關系越強答案:D2對于事件A和事件B,通過計算得到K2的觀測值k4.514,下列說法正確的是()A有99%的把握說事件A和事件B有關B有95%的把握說事件A和事件B有關C有99%的把握說事件A和事件B無關D有95%的把握說事件A和事件B無關解析:k4.5143.841,即有95%的把握認為事件A和事件B有關

5、當k6.635時即有99%的把握認為事件A和事件B有關答案:B3已知回歸方程為0.50 x0.81,則x25時,y的估計值為_解析:當x25時,y0.50250.8111.69.答案:11.694在一項打鼾與患心臟病的調(diào)查中,共調(diào)查了1671人,經(jīng)過計算K227.63,根據(jù)這一數(shù)據(jù)分析,我們有理由認為打鼾與患心臟病是_的(有關,無關)解析:K227.636.635,有99%的把握認為“打鼾與患心臟病有關”答案:有關5下表是某廠14月份用水量(單位:百噸)的一組數(shù)據(jù),由其散點圖可知,用水量y與月份x之間有較好的線性相關關系,求y與x的回歸方程月份x1234用水量y4.5432.5【例1】關于人體

6、的脂肪含量(百分比)和年齡關系的研究中,得到如下一組數(shù)據(jù):判斷它們是否有相關關系,若有,擬合一直線年齡2327394145495051脂肪含量9.517.821.225.927.526.328.229.6解:本題涉及兩個變量:年齡與脂肪含量,可以以年齡為自變量,考察脂肪含量的變化趨勢,而分析相關關系通常借助散點圖以年齡作為x軸,脂肪含量作為y軸,可得相應的散點圖如下圖所示:由散點圖可知,兩者之間具有相關關系判斷有無相關關系,一種常用的簡便方法就是繪制散點圖. 變式遷移 1(2009海南、寧夏高考)對變量x,y有觀測數(shù)據(jù)(xi,yi)(i1,2,10),得散點圖;對變量u,v有觀測數(shù)據(jù)(ui,v

7、i)(i1,2,10),得散點圖.由這兩個散點圖可以判斷()A變量x與y正相關,u與v正相關B變量x與y正相關,u與v負相關C變量x與y負相關,u與v正相關D變量x與y負相關,u與v負相關解析:由圖可知,應選C.答案:C【例2】假設關于某設備的使用年限x和所支出的維修費用y(萬元),有如下的統(tǒng)計資料:若由資料知y對x呈線性相關關系使用年限x23456維修費用y(萬元)2.23.85.56.57.0試求:(1)線性回歸方程x的回歸系數(shù)、的值;(2)求殘差平方知;(3)求相關指數(shù)R2;(4)估計使用年限為10年時,維修費用是多少?解:y對x呈線性相關關系,轉化為一元線性相關的方法,根據(jù)公式分別計算

8、(1)由已知數(shù)據(jù)制成下表.即估計使用10年時維修費用大約是12.38萬元變式遷移 2一項調(diào)查表對9個不同的x值,測得y的9個對應值如下表:試作出該數(shù)據(jù)的散點圖并由圖判斷是否存在回歸直線,若有,則求出回歸方程i123456789xi1.51.82.43.03.53.94.44.85.0yi4.85.77.08.310.912.413.113.615.3解:散點圖如右圖所示由圖知所有數(shù)據(jù)點接近直線排列,因此,認為y對x有線性回歸關系【例3】為了研究某種細菌隨時間x變化時,繁殖個數(shù)y的變化,收集數(shù)據(jù)如下:(1)用天數(shù)x作解釋變量,繁殖個數(shù)y作預報變量,作出這些數(shù)據(jù)的散點圖;天數(shù)x/天123456繁殖

9、個數(shù)y/個612254995190(2)描述解釋變量x與預報變量y之間的關系;(3)計算殘差平方和、相關指數(shù)解:(1)所作散點圖如下圖所示(2)由散點圖看出樣本點分布在一條指數(shù)型函數(shù)yc1ec2x的周圍,于是令zlny,則x123456z1.792.483.223.894.555.25(3)即解釋變量天數(shù)對預報變量細菌的繁殖個數(shù)解釋了99.99%.變式遷移 3下表是某年美國舊轎車價格的調(diào)查資科,今以x表示轎車的使用年數(shù),y表示相應的年均價格,求y關于x的回歸方程.使用年數(shù)x12345678910年均價格y(美元)2651194314941087765538484290226204解:作出散點圖

10、如圖1,圖1可以發(fā)現(xiàn),各點并不是基本處于一條直線附近,因此,y與x之間應是非線性相關關系與已學函數(shù)圖象比較,用yebxa來刻畫題中模型更為合理,令zlny;則zbxa,題中數(shù)據(jù)變成如下表所示:x12345678910 x7.8837.5727.3096.9916.6406.2886.1825.6705.4215.318相應的散點圖如圖2,從圖2可以看出,變換后的樣本點分布在一條直線附近,因此可以用線性回歸方程擬合圖2【例4】(2009遼寧卷)某企業(yè)有兩個分廠生產(chǎn)某種零件,按規(guī)定內(nèi)徑尺寸(單位:mm)的值落在29.94,30.06)的零件為優(yōu)質品從兩個分廠生產(chǎn)的零件中各抽出了500件,量其內(nèi)徑尺

11、寸,得結果如下表:甲廠:分組29.86,2990)29.90,2994)29.94,29,98)29.98,3002)30.02,3006)30.06,3010)30.10,3014)頻數(shù)12638618292614乙廠:分組29.86,2990)29.90,2994)29.94,29,98)29.98,3002)30.02,3006)30.06,3010)30.10,3014)頻數(shù)297185159766218(1)試分別估計兩個分廠生產(chǎn)的零件的優(yōu)質品率;(2)由以上統(tǒng)計數(shù)據(jù)填下面22列聯(lián)表,并問是否有99%的把握認為“兩個分廠生產(chǎn)的零件的質量有差異”.甲廠乙廠合計優(yōu)質品非優(yōu)質品合計思路分析

12、:(1)根據(jù)頻數(shù)分布表進行統(tǒng)計計算;(2)計算卡方統(tǒng)計量,根據(jù)臨界值進行判斷(2)甲廠乙廠合計優(yōu)質品360320680非優(yōu)質品140180320合計5005001000所以有99%的把握認為“兩個分廠生產(chǎn)的零件的質量有差異”本題給出兩個分廠生產(chǎn)的零件尺寸的頻數(shù)分布表,界定零件為優(yōu)質品的標準,先求兩個分廠生產(chǎn)的零件的優(yōu)質品率,再通過獨立性檢驗的方法判斷兩個分廠生產(chǎn)的零件質量之間是否存在差異,從兩個方面對兩個分廠生產(chǎn)的零件質量進行比較評價,試題的目的是考查獨立性檢驗的基本思想與方法,考查分析問題、解決問題的能力,試題的現(xiàn)實意義普遍、實用性強,是一道切合考生實際的應用題. 變式遷移 4在對人們休閑方

13、式的一次調(diào)查中,共調(diào)查了124人,其中女性70人,男性54人女性中有43人主要的休閑方式是看電視,另外27人的休閑方式是運動;男性中有21人主要的休閑方式是看電視,另外33人主要的休閑方式是運動(1)根據(jù)以上數(shù)據(jù)建立一個22列聯(lián)表;(2)畫出二維條形圖;(3)檢驗休閑方式是否與性別有關,可靠性有多大解:(1)22列聯(lián)表如下:休閑方式性別看電視運動合計女432770男213354合計6460124(2)二維條形圖如下圖:(3)假設休閑方式與性別無關,則所以有理由認為休閑方式與性別無關是不合理的,即我們有97.5%的把握認為休閑方式與性別有關1(1)線性相關關系的理解:相關關系與函數(shù)關系不同函數(shù)關系中的兩個變量間是一種確定性關系例如正方形面積S與邊長x之間的關系Sx2就是函數(shù)關系相關關系是一種非確定性關系,即相關關系是非隨機變量與隨機變量之間的關系例如商品的銷售額與廣告費是相關關系兩個變量具有相關關系是回歸分析的前提(2)求回歸方程,關鍵在于正確求出系數(shù),由于,的計算量大,計算時應仔細謹慎,分層進行,避免因計算而產(chǎn)生錯誤(注意回歸直線方程中一次項系數(shù)為,常數(shù)項為,這與一次函數(shù)的習慣表示不同)(3)回歸分析是處理變量相關關系的一種數(shù)學方法主要解決:確定特定量之間是否有相關關系,如

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論