版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
8.1.2樣本相關(guān)系數(shù)(1)1.相關(guān)關(guān)系兩個變量有關(guān)系,但又沒有確切到可由其中的一個去________決定另一個的程度,這種關(guān)系稱為相關(guān)關(guān)系.精確地2.正相關(guān)、負相關(guān)從整體上看,當一個變量的值增加時,另一個變量的相應值也呈現(xiàn)______的趨勢,我們就稱這兩個變量正相關(guān);如果一個變量值增加時,另一個變量的相應值呈現(xiàn)______的趨勢,則稱這兩個變量負相關(guān).增加減少復習引入3.線性相關(guān)一般地,如果兩個變量的取值呈現(xiàn)正相關(guān)或負相關(guān),而且散點落在__________附近,我們就稱這兩個變量線性相關(guān).4.非線性相關(guān)或曲線相關(guān)一般地,如果兩個變量具有相關(guān)性,但不是______相關(guān),那么我們就稱這兩個變量非線性相關(guān)或曲線相關(guān).一條直線線性5.散點圖為了直觀描述成對樣本數(shù)據(jù)的變化特征,把每對成對樣本數(shù)據(jù)都用直角坐標系中的點表示出來,由這些點組成的統(tǒng)計圖,叫做散點圖.通過觀察散點圖中成對樣本數(shù)據(jù)的分布規(guī)律,我們可以大致推斷兩個變量是否存在相關(guān)關(guān)系、是正相關(guān)還是負相關(guān)、是線性相關(guān)還是非線性相關(guān)等.散點圖雖然直觀,但無法確切地反映成對樣本數(shù)據(jù)的相關(guān)程度,也就無法量化兩個變量之間相關(guān)程度的大小.能否像引入均值、方差等數(shù)字特征對單個變量數(shù)據(jù)進行分析那樣,引入一個適當?shù)摹皵?shù)字特征”,對成對樣本數(shù)據(jù)的相關(guān)程度進行定量分析呢?探究:相關(guān)系數(shù)對于變量x和變量y,設(shè)經(jīng)過隨機抽樣獲得的成對樣本數(shù)據(jù)為(x1,y1),(x2,y2),???,(xn,yn),其中x1,x2,???,xn和y1,y2,???,yn的均值分別為和.將數(shù)據(jù)以
為零點進行平移,得到平移后的成對數(shù)據(jù)為
并繪制散點圖.編號123456789101112131423273941454950535456575860619.517.821.225.927.526.328.229.630.231.430.833.535.234.6編號1234567891011121314-25.1-21.1-9.1-7.1-3.10.91.94.95.97.98.99.911.912.9-17.8-9.5-6.1-1.40.2-1.00.92.32.94.13.56.27.97.3利用信息技術(shù)軟件,可以得到散點圖平移
利用信息技術(shù)軟件,可以得到散點圖平移思考:比較數(shù)據(jù)調(diào)整后的散點圖,可以發(fā)現(xiàn)散點有怎樣的分布規(guī)律?這時的散點大多數(shù)分布在第一象限、第三象限,大多數(shù)散點的橫、縱坐標同號,顯然,這樣的規(guī)律是由人體脂肪含量與年齡正相關(guān)所決定的.一般地,如果變量x和y正相關(guān),那么關(guān)于均值平移后的大多數(shù)散點將分布在第一象限、第三象限,對應的成對數(shù)據(jù)同號的居多,如圖(1)所示;如果變量x和y負相關(guān),那么關(guān)于均值平移后的大多數(shù)散點將分布在第二象限、第四象限,對應的成對數(shù)據(jù)異號的居多,如圖(2)所示.思考1:根據(jù)上述分析,你能利用正相關(guān)變量和負相關(guān)變量的成對樣本數(shù)據(jù)平移后呈現(xiàn)的規(guī)律,構(gòu)造一個度量成對樣本數(shù)據(jù)是正相關(guān)還是負相關(guān)的數(shù)字特征嗎?利用散點的橫、縱坐標是否同號,可以構(gòu)造一個量一般情形下,Lxy>0表明成對樣本數(shù)據(jù)正相關(guān);Lxy<0表明成對樣本數(shù)據(jù)負相關(guān).在研究體重與身高之間的相關(guān)程度時,如果體重的單位不變,把身高單位由米改為厘米,單位的改變不會改變體重與身高之間的相關(guān)程度.思考2:
Lxy的大小是否一定能度量出成對樣本數(shù)據(jù)的相關(guān)程度嗎?我們發(fā)現(xiàn),
Lxy的大小與數(shù)據(jù)的度量單位有關(guān),所以不宜直接用它度量成對樣本數(shù)據(jù)相關(guān)程度的大小.為了消除度量單位的影響,需要對數(shù)據(jù)作進一步的“標準化”處理.我們用進一步簡化為
我們稱r為變量x和變量y的樣本相關(guān)系數(shù).當r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當其中一個數(shù)據(jù)的值變小時,另一個數(shù)據(jù)的值通常也變小;當其中一個數(shù)據(jù)的值變大時,另一個數(shù)據(jù)的值通常也變大.當r<0時,稱成對樣本數(shù)據(jù)負相關(guān);當其中一個數(shù)據(jù)的值變小時,另一個數(shù)據(jù)的值通常會變大;當其中一個數(shù)據(jù)的值變大時,另一個數(shù)據(jù)的值通常會變小.從
的結(jié)構(gòu)聯(lián)想到向量的數(shù)量積
思考4:樣本相關(guān)系數(shù)r的大小與成對樣本數(shù)據(jù)的相關(guān)程度有什么內(nèi)在聯(lián)系呢?我們試著從向量數(shù)量積的角度進行思考
設(shè)其第一分量為第二分量為思考5:當|r|=1時,成對樣本數(shù)據(jù)之間具有怎樣的關(guān)系?當|r|=1時,
,向量
與
共線.所以存在一個實數(shù),使得
,即
這表明成對樣本數(shù)據(jù)(xi,yi)都落在直線
上.成對樣本數(shù)據(jù)的兩個分量之間滿足一種線性關(guān)系.樣本相關(guān)系數(shù)r的取值范圍為[-1,1].樣本相關(guān)系數(shù):歸納總結(jié)樣本相關(guān)系數(shù)r是一個描述成對樣本數(shù)據(jù)的數(shù)字特征,它反映了兩個隨機變量之間的線性相關(guān)程度.r的符號反映了相關(guān)關(guān)系的正負性.|r|的大小反映了兩個變量線性相關(guān)的程度,即散點集中于一條直線的程度.③當|r|越接近1時,成對數(shù)據(jù)的線性相關(guān)程度越強;當|r|越接近0時,成對數(shù)據(jù)的線性相關(guān)程度越弱;特別地,當|r|=0時,成對數(shù)據(jù)間沒有線性相關(guān)關(guān)系;當|r|=1時,成對數(shù)據(jù)都落在一條直線上.注意:若0.75≤|r|≤1,則認為y與x的線性相關(guān)程度很強;
若0.3≤|r|<0.75,則認為y與x的線性相關(guān)程度一般;若|r|≤0.25,則認為y與x的線性相關(guān)程度較弱.相關(guān)系數(shù)的性質(zhì):①當r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當r<0時,稱成對樣本數(shù)據(jù)負相關(guān).②|r|≤1;圖(1)中成對樣本數(shù)據(jù)的正線性相關(guān)程度很強.圖(2)中成對樣本數(shù)據(jù)的負線性相關(guān)程度比較強.圖(3)中對樣本數(shù)據(jù)的線性相關(guān)程度很弱.圖(4)中成對樣本數(shù)據(jù)的線性相關(guān)程度極弱.1.已知求得甲、乙、丙3組不同的數(shù)據(jù)的樣本相關(guān)系數(shù)分別為0.81,-0.98,0.63,其中________(填甲、乙或丙)組數(shù)據(jù)的線性相關(guān)程度最強.乙練習2.在一次試驗中,測得(x,y)的4組值分別為(1,2),(2,0),(4,-4),(-1,6),則y與x的樣本相關(guān)系數(shù)為(
)A.1 B.-2C.0 D.-1解:由樣本數(shù)據(jù)可得隨堂檢測2.在一組成對樣本數(shù)據(jù)為(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點圖中,若這組成對樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為-1,則所有的樣本點(xi,yi)(i=1,2,…,n)滿足的方程可以是(
)解析:∵這組成對樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為-1,∴這一組成對樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)線性相關(guān),且是負相關(guān).∴可排除B,C,D,故選A.3.對四組數(shù)據(jù)進行統(tǒng)計,獲得以下散點圖,關(guān)于其樣本相關(guān)系數(shù)的比較,正確的是(
)A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3解析:由給出的四組數(shù)據(jù)的散點圖可以看出,題圖1和題圖3是正相關(guān),樣本相關(guān)系數(shù)大于0,題圖2和題圖4是負相關(guān),樣本相關(guān)系數(shù)小于0,題圖1和題圖2的樣本點集中在一條直線附近,所以相關(guān)性更強,所以r1接近于1,r2接近于-1,由此可得r2<r4<0<r3<r1.4.(多選)下面的各圖中,散點圖與樣本相關(guān)系數(shù)r符合的是(
)解析:因為樣本相關(guān)系數(shù)r的絕對值越接近1,線性相關(guān)程度越高,且r>0時正相關(guān),r<0時負相關(guān),故觀察各選項,易知B不符合,A,C,D均符合.5.假設(shè)關(guān)于某種設(shè)備的使用年限x(單位:年)與所支出的維修費用y(單位:萬元)有如下統(tǒng)計資料:x23456y2.23.85.56.57.01.樣本相關(guān)系數(shù):2.相關(guān)系數(shù)的性質(zhì):①當r>0時,稱成對樣本數(shù)據(jù)正相關(guān);當r<0時,稱成對樣本數(shù)據(jù)負相關(guān).②|r|≤1;③當|r|越接近1時,成對數(shù)據(jù)的線性相關(guān)程度越強;當|r|越接近0時,成對數(shù)據(jù)的線性相關(guān)程度越弱;特別地,當|r|=0時,成對數(shù)據(jù)的沒有線性相關(guān)關(guān)系;當|r|=1時,成對數(shù)據(jù)都落在一條直線上.課堂小結(jié)課外作業(yè)課本103頁1.由簡單隨機抽樣得到的成對樣本數(shù)據(jù)的樣本相關(guān)系數(shù)是否一定能確切地反映變量之間的相關(guān)關(guān)系?為什么?解:樣本相關(guān)系數(shù)可以反映變量之間相關(guān)的正負性及線性相關(guān)的程度,但由于樣本數(shù)據(jù)的隨機性,樣本相關(guān)系數(shù)往往不能確切地反映變量之間的相關(guān)關(guān)系.一般來說,樣本量越大,根據(jù)樣本相關(guān)系數(shù)推斷變量之間相關(guān)的正負性及線性相關(guān)的程度越可靠,而樣本量越小則越不可靠.一個極端的情況是,無論兩個變量之間是什么關(guān)系,如果樣本量取2,則計算可得樣本相關(guān)系數(shù)的絕對值都是1(在樣本相關(guān)系數(shù)存在的情況下),顯然據(jù)此推斷兩個變量完全線性相關(guān)是不合理的.課本103頁2.已知變量x和變量y的3對隨機觀測數(shù)據(jù)(2,2),(3,-1),(5,-7),計算成對樣本數(shù)據(jù)的樣本相關(guān)系數(shù).能據(jù)此推斷這兩個變量線性相關(guān)嗎?為什么?解:由樣本數(shù)據(jù)可得雖然樣本相關(guān)系數(shù)為-1,三個樣本點在一條直線上,但是由于樣本量太小,據(jù)此推斷兩個變量完全線性相關(guān)并不可靠.解:(1)課本103頁3.畫出下列成對數(shù)據(jù)的散點圖,并計算樣本相關(guān)系數(shù).據(jù)此,請你談?wù)剺颖鞠嚓P(guān)系數(shù)在刻畫成對樣本數(shù)據(jù)相關(guān)關(guān)系上的特點.(1)(-2,-3),(-1,-1),(0,1),(1,3),(2,5),(3,7);(2)(0,0),(1,1),(2,4),(3,9),(4,16);(3)(-2,-8),(-1,-1),(0,0),(1,1),(2,8),(3,27);(4)(2,0)
(1,),(0,2),(-1,),(-2,0).248x-4-320-213-16y-2??????515x2041310y?????(2)20.51.5x-320-213-11y??????51020x-10
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度護校與養(yǎng)老機構(gòu)合作服務(wù)合同3篇
- 女生節(jié)活動策劃方案(3篇)
- 中小學校實驗室內(nèi)部管理制度范文(二篇)
- 2025年度物流運輸安全環(huán)保服務(wù)協(xié)議范本3篇
- 液壓銑床課程設(shè)計摘要
- 財務(wù)分析圖表課程設(shè)計
- 平路機安全操作規(guī)程范文(2篇)
- 二零二五年度房地產(chǎn)租賃權(quán)包銷合同3篇
- 2025年上半年安全員工作總結(jié)(3篇)
- 2024年滬教版高三歷史上冊階段測試試卷
- 2025年競聘醫(yī)院內(nèi)科醫(yī)生崗位演講稿模版(3篇)
- 2024年河南省公務(wù)員考試《行測》真題及答案解析
- 消防系統(tǒng)工程質(zhì)量控制資料檢查記錄
- 中藥封包療法操作規(guī)范
- 浙江產(chǎn)業(yè)帶分布情況
- 道岔主要幾何尺寸表
- 柳宗元毛筆楷書字帖
- 纖力玻璃鋼管道厚度,重量一覽表
- 新浪網(wǎng)刪貼申請文檔 (個人)
- 低溫乙烯罐內(nèi)罐預冷過程溫度急降原因探討
- 大同利創(chuàng)光伏電站試運行報告
評論
0/150
提交評論