變量間的相關關系講義.doc_第1頁
變量間的相關關系講義.doc_第2頁
變量間的相關關系講義.doc_第3頁
變量間的相關關系講義.doc_第4頁
變量間的相關關系講義.doc_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

_變量間的相關關系講義一、基礎知識梳理知識點1:變量之間的相關關系兩個變量之間的關系可能是確定的關系(如:函數關系),或非確定性關系。當自變量取值一定時,因變量也確定,則為確定關系;當自變量取值一定時,因變量帶有隨機性,這種變量之間的關系稱為相關關系。相關關系是一種非確定性關系,如長方體的高與體積之間的關系就是確定的函數關系,而人的身高與體重的關系,學生的數學成績好壞與物理成績的關系等都是相關關系。注意:兩個變量之間的相關關系又可分為線性相關和非線性相關,如果所有的樣本點都落在某一函數曲線的附近,則變量之間具有相關關系(不確定性的關系),如果所有樣本點都落在某一直線附近,那么變量之間具有線性相關關系,相關關系只說明兩個變量在數量上的關系,不表明他們之間的因果關系,也可能是一種伴隨關系。點睛:兩個變量相關關系與函數關系的區(qū)別和聯系相同點:兩者均是兩個變量之間的關系,不同點:函數關系是一種確定的關系,如勻速直線運動中時間t與路程s的關系,相關關系是一種非確定的關系,如一塊農田的小麥產量與施肥量之間的關系,函數關系是兩個隨機變量之間的關系,而相關關系是非隨機變量與隨機變量之間的關系;函數關系式一種因果關系,而相關關系不一定是因果關系,也可能是伴隨關系。知識點2.散點圖.1.在考慮兩個量的關系時,為了對變量之間的關系有一個大致的了解,人們常將變量所對應的點描出來,這些點就組成了變量之間的一個圖,通常稱這種圖為變量之間的散點圖。2.從散點圖可以看出如果變量之間存在著某種關系,這些點會有一個集中的大致趨勢,這種趨勢通??梢杂靡粭l光滑的曲線來近似,這種近似的過程稱為曲線擬合。3.對于相關關系的兩個變量,如果一個變量的值由小變大時,另一個變量的的值也由小變大,這種相關稱為正相關,正相關時散點圖的點散布在從左下角到由上角的區(qū)域內。如果一個變量的值由小變大時,另一個變量的值由大變小,這種相關稱為負相關,負相關時散點圖的點散步在從左上角到右下角的區(qū)域。注意:畫散點圖的關鍵是以成對的一組數據,分別為此點的橫、縱坐標,在平面直角坐標系中把其找出來,其橫縱坐標的單位長度的選取可以不同,應考慮數據分布的特征,散點圖只是形象的描述點的分布,如果點的分布大致呈一種集中趨勢,則兩個變量可以初步判斷具有相關關系,如圖中數據大致分布在一條直線附近,則表示的關系是線性相關,如果兩個變量統(tǒng)計數據的散點圖呈現如下圖所示的情況,則兩個變量之間不具備相關關系,例如學生的身高和學生的英語成績就沒有相關關系。點睛:散點圖又稱散點分布圖,是以一個變量為橫坐標,另一變量為縱坐標,利用散點(坐標點)的分布形態(tài)反映變量統(tǒng)計關系的一種圖形。特點是能直觀表現出影響因素和預測對象之間的總體關系趨勢。優(yōu)點是能通過直觀醒目的圖形方式反映變量間關系的變化形態(tài),以便決定用何種數學表達方式來模擬變量之間的關系。散點圖不僅可傳遞變量間關系類型的信息,也能反映變量間關系的明確程度知識點3:回歸直線(1)回歸直線的定義如果散點圖中點的分布從整體上看大致在一條直線附近,我們就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線。(2)回歸直線的特征如果能夠求出這條回歸直線的方程(簡稱回歸方程),那么我們就可以比較清楚的了解對應兩個變量之間的相關性,就像平均數可以作為一個變量的數據的代表一樣,這條直線也可以作為兩個變量之間具有相關關系的代表。(3)回歸直線方程一般地,設x與y是具有相關關系的兩個變量,且相應n組觀測值的n個點(xi,yi)(i=1,2,n)大致分布在一條直線的附近,求在整體上與這n個點最接近的一條直線,設此直線方程為,這里的y在上方加上“”是為了區(qū)分實際值y,表示當x取值xi,y相應的觀察值yi而直線上對應于xi,的縱坐標是點睛:1)散點圖中的點整體上分布在一條直線附近時,可以應用線性回歸分析的方法分析數據;2)回歸直線是反映:“從整體上看,各點與此直線的距離的和最小”的一條直線,它反映了具有線性相關關系的兩個變量之間的規(guī)律;3)我們可以通過回歸直線方程,由一個變量的值來推測另一個變量的值,解決生活中的實際問題;這種方法稱為回歸方法知識點4:回歸系數公式及相關問題1.最小二乘法:求回歸直線的關鍵是如何用數學的方法刻畫從整體上看,各點與此直線的距離最小,假設我們已經得到兩個具有線性相關關系的變量的一組數據:。當自變量?。?1,2,n)時,可以得到(=1,2,n),它與實際收集到的之間的偏差是(=1,2,n)這樣用n個偏差的和來刻畫“各點與此直線的整體偏差”是比較合適的。總的偏差為,偏差有正有負,易抵消,所以采用絕對值,由于帶絕對值計算不方便所以換成平方,現在的問題就歸結為:當,b取什么值時Q最小,即點到直線y=bx+a的整體距離最?。ㄆ渲?,) 這種通過求式的最小值而得到回歸直線的方法,即使得樣本數據的點到回歸直線的距離的平方和最小的方法叫最小二乘法。2.回歸直線方程的求法先判斷變量是否線性相關若線性相關,利用公式計算出a,b利用回歸方程對生活實際問題進行分析與預測注意:線性回歸直線方程中x的系數是b,常數項是a,與直線的斜截式不大一樣,如果散點圖中的點分布從整體上看不在任何一條直線附近,這時求出的線性回歸方程實用價值不大。點睛:線性回歸方程:一般地,設有個觀察數據如下:當a,b使取得最小值時,就稱為擬合這對數據的線性回歸方程,該方程所表示的直線稱為回歸直線知識點5:線性回歸分析思想在實際中的應用教材中利用回歸直線對年齡與脂肪的關系做了上述分析,這種分析方法叫做線性回歸分析。利用這種分析方法可以對生活中的很多問題進行分析與預測,求線性回歸方程的步驟:計算平均數;計算的積,求;計算;將結果代入公式求;用 求;寫出回歸方程注意:對一組數據進行線性回歸分析時,應先畫出其散點圖,看其是否呈直線形,再依系數a,b的計算公式,算出由于計算量較大,所以在計算時應借助技術手段,認真細致,謹防計算中產生錯誤。知識點6:利用相關系數判斷線性相關程度最小二乘法求出回歸直線的方程后,可以對上面兩個變量的關系進行分析與預測,如圖前兩個是線性相關,可以求回歸方程,后兩個是非線性相關,直線不能很好地反映圖中兩個變量之間的關系。顯然求回歸直線的方程是沒有意義的。有些變量線性相關,有些非線性相關,衡量變量的線性相關程度引入一個量:相關系數注意它的符號:當時,x,y正相關,當時,x,y負相關,統(tǒng)計學認為:對于r,若那么負相關很強,若,那么正相關很強若,那么相關性一般, 若,那么相關性較弱,點睛:相關系數的絕對值越大,線性相關關系就越強。二、??碱}型例解易-知識點1例1:下列兩個變量之間是相關關系的是()A、圓的面積與半徑B、球的體積與半徑 C、角度與它的正弦值 D、一個考生的數學成績與物理成績思路分析:由題意知A表示圓的面積與半徑之間的關系S=r2,B表示球的體積與半徑之間的關系C表示角度與它的正弦值y=sin,前面所說的都是確定的函數關系,相關關系不是確定的函數關系,故選D解:D點撥:本題考查變量間的相關關系,判斷兩個變量間的關系還是函數關系還是相關關系的關鍵是判斷兩個變量之間的關系是否是確定的,若確定的則是函數關系;若不確定,則是相關關系例2:名師出高徒可以解釋為老師的水平越高,學生的水平也越高,那么教師與學生的水平之間有何種關系呢?你能舉出更多的描述生活中兩變量相關關系的成語與俗語嗎?至少寫兩個。思路分析:名師出高徒的意思是有名的教師一定能教出高明的徒弟,高水平教師有很大趨勢教出高水平的學生,實際學生成績的好壞還與很多因素有關,如學生的天賦,學生的努力,學習的環(huán)境等,所以它們之間的關系帶有不確定性即為相關關系。解:教師的水平與學生的水平之間具有相關關系生活中描述兩個變量之間的相關關系的成語或俗語還有:老子英雄兒好漢,強將手下無弱兵,虎父無犬子2009寧夏高考中 知識點2例3.對變量x、y有觀測數據(xi,yi)(i=1,2,10),得散點圖1;對變量u,v有觀測數據(ui,vi)(i=1,2,10),得散點圖2由這兩個散點圖可以判斷()A、變量x與y正相關,u與v正相關 B、變量x與y正相關,u與v負相關 C、變量x與y負相關,u與v正相關 D、變量x與y負相關,u與v負相關 思路分析:由題圖1可知,y隨x的增大而減小,各點整體呈遞減趨勢,x與y負相關,由題圖2可知,u隨v的增大而增大,各點整體呈遞增趨勢,u與v正相關解:C點撥:本題考查散點圖,是通過讀圖來解決問題,考查讀圖能力,是一個基礎題,本題可以粗略的反應兩個變量之間的關系,是不是線性相關,是正相關還是負相關易知識點3例4:5個學生的數學和物理成績如下表: 由散點圖判斷它們是否相關,是正相關還是負相關?思路分析:分別以數學和物理成績作為橫縱坐標建立直角坐標系,描點畫出散點圖,然后根據散點圖判斷。解:以x軸表示數學成績,y軸表示物理成績可得到相應的散點圖,如圖所示 由散點圖可知,兩者之間具有相關關系,且為正相關例5:下表為某地近幾年機動車輛數與交通事故數的統(tǒng)計資料,請判斷機動車輛數與交通事故數之間是否有線性相關關系,如果具有線性相關關系,求出線性回歸方程;如果不具有線性相關關系,說明理由思路分析:根據表中數據畫出散點圖,觀察數據是否集中,判斷變量之間關系,再利用最小二乘法計算系數a,b寫出線性回歸方程解:在直角坐標系中畫出數據的散點圖,直觀判斷散點在一條直線附近,故具有線性相關關系計算相應的數據之和:,將它們代入()式計算得,所以,所求線性回歸方程為知識點4例6:有一位同學家開了一個小賣部,他為了研究氣溫對熱飲銷售的影響,經過統(tǒng)計得到了一個熱飲杯數與當天氣溫之間的線性關系,其回歸方程為 y=-2.35x+147.77如果某天氣溫為-2時,則該小賣部大約能賣出熱飲的杯數是()A、140 B、143 C、152 D、156思路分析:一個熱飲杯數與當天氣溫之間的線性關系,其回歸方程為 y=-2.35x+147.77如果某天氣溫為-2時,即x=-2,則該小賣部大約能賣出熱飲的杯數y=-2.35(-2)+147.77=152.47152解:C例7:某縣教研室要分析學生初中升學的數學成績對高一年級數學成績有什么影響,在高一年級學生中隨機抽選10名學生,分析他們入學的數學成績和高一年級期末數學考試成績(如下表):(1)對變量x與y進行相關性檢驗,如果x與y之間具有線性相關關系,求出線性回歸方程;(2)若某學生入學數學成績是80分,試估測他高一期末數學考試成績思路分析:(1)根據所給的數據利用最小二乘法寫出線性回歸方程的系數和a的值,寫出線性回歸方程,注意運算過程中不要出錯(2)將x=80代入所求出的線性回歸方程中,得y=8分,即這個學生的高一期末數學考試成績預測值為84分解:(1)設所求的線性回歸方程為y=ax+b最小二乘法可以寫出因此所求的線性回歸方程y=0.742x+23.108(2)將x=80代入所求出的線性回歸方程中,得y=84分,即這個學生的高一期末數學考試成績預測值為84分點撥:利用回歸方程可以對總體進行預測估計,回歸方程將部分觀測值所反映的規(guī)律進行延伸,使我們對有線性相關關系的兩個變量進行分析和控制,依據自變量的取值估計和預報因變量的值,在現實生活中有廣泛的應用 知識點5例8:某種產品的廣告費用支出x萬元與銷售額y萬元之間有如下的對應數據: (1)根據上表提供的數據,求出y關于x的線性回歸方程;(2)據此估計廣告費用為10萬元時,所得的銷售收入知識點6例9:一臺機器使用的時間較長,但還可以使用,它按不同的轉速生產出來的某機械零件有一些會有缺點,每小時生產有缺點零件的多少,隨機器的運轉的速度而變化,下表為抽樣試驗的結果:(1)利用散點圖或相關系數r的大小判斷變量y對x是否線性相關?為什么?(2)如果y對x有線性相關關系,求回歸直線方程;(3)若實際生產中,允許每小時的產品中有缺點的零件最多為10個,那么機器的運轉速度應控制在什么范圍內?(最后結果精確到0.001參考數據: ,1611+149+128+85=438,162+142+122+82=660,112+92+82+52=291)思路分析:(1)利用所給的數據做出兩個變量的相關系數,得到相關系數趨近于1,得到兩個變量具有線性相關關系(2)先做出橫標和縱標的平均數,做出利用最小二乘法求線性回歸方程的系數的量,做出系數,求出a,寫出線性回歸方程(3)根據上一問做出的線性回歸方程,使得函數值小于或等于10,解出不等式三、典例方法詳析考點1:相關關系方法:兩個變量間的關系。相關關系是一種非確定的關系,也不一定是因果關系。如產品銷售額與廣告費的投入關系。例10:下面哪些變量是相關關系() A、出租車費與行駛的里程 B、房屋面積與房屋價格 C、人的身高與體重 D、鐵塊的大小與質量 思路分析:由出租車費與行駛的里程、房屋面積與房屋價格和鐵塊的大小與質量知它們都是確定的函數關系,故A、B、C不對,根據經驗知人的身高會影響體重但不是唯一因素,故是相關關系從而得出正確答案解:A、由出租車費與行駛的里程的公式知,是確定的函數關系,故A不對;B、房屋面積與房屋價格,是確定的函數關系,故B不對;C、人的身高會影響體重,但不是唯一因素,故C對;D、鐵塊的大小與質量,是確定的函數關系故D不對故選C考點2:散點圖方法:根據所給數據分別作為點的橫縱坐標在直角坐標系內描點,畫圖。例11:某研究小組在一項實驗中獲得一組數據,將其整理得到如圖所示的散點圖,下列函數中,最能近似刻畫y與t之間關系的是()A、y=2t B、y=2t2 C、y=t3 D、y=log2t思路分析:根據所給的散點圖,觀察出圖象在第一象限,單調遞增,并且增長比較緩慢,一般用對數函數來模擬,在選項中只有一個底數是2的對數函數,解:D綜合技能提升考點3:回歸方程方法:利用最小二乘法的思想,根據線性回歸方程系數公式建立回歸方程,估計和預測取值,從而獲得對兩個變量之間整體關系的了解。例12.在某種產品表面進行腐蝕刻線試驗,得到腐蝕深度y與腐蝕時間x的一組數據如表所示:(1)畫出數據的散點圖;(2)根據散點圖,你能得出什么結論?(3)求回歸方程思路分析:(1)由圖表可以知道有(5,6)(10,10)(15,11)(20,13)(30,16)(40,17)(50,19)(60,23)點的坐標,在坐標系中描出點的坐標,得到散點圖(2)散點圖呈帶狀分布,x與y是具有相關關系的兩個變量,且對應n組觀測值的n個點大致分布在一條直線附近(3)計算得r=0.9793079920.75x與y有很強的線性相關關系,做出橫標和縱標的平均數,利用最小二乘法做出回歸直線方程的系數,得到回歸直線方程解:(1)由圖表可以知道有(5,6)(10,10)(15,11)(20,13)(30,16)(40,17)(50,19)(60,23),在坐標系中得到散點圖如圖所示(2)結論:x與y是具有相關關系的兩個變量,且對應n組觀測值的n個點大致分布在一條直線附近,其中整體上與這n個點最接近的一條直線最能代表變量x與y之間的關系(3)計算得r=0.9793079920.75x與y有很強的線性相關關系, x=5+10+15+20+30+40+50+60 8=28.75 y=6+10+11+13+16+17+19+23 8=14.25由計算器計算得 a=6.6164386.62, b=0.2698630.27, y=6.62+0.27x四、學法對應題練1、下列選項中,兩個變量具有相關關系的是()A、正方形的面積與周長 B、勻速行駛車輛的行駛路程與時間 C、人的身高與體重 D、人的身高與視力 分析:由正方形的面積與周長的公式和勻速直線運動的路程公式知它們都是確定的函數關系,故A、B不對,根據經驗知人的身高會影響體重但不是唯一因素,故是相關關系;人的身高與視力無任何關系,故選C2、下列變量關系是相關關系的是()家庭的經濟條件與學生的學習成績之間的關系教師的執(zhí)教水平與學生的學習成績之間的關系;學生的身高與學生的學習成績之間的關系;學生的學習態(tài)度與學習成績之間的關系A、 B、 C、 D、 分析:對于,家庭的經濟條件與學生的學習成績之間的關系沒有關系,所以不是;對于,教師的執(zhí)教水平與學生的學習成績之間的有關系,但不確定;是相關關系,所以是;對于,學生的身高與學生的學習成績之間沒有關系;所以不是;對于,學生的學習態(tài)度與學習成績之間有關系,但關系不確定;所以是相關關系,所以是故選D學法指導考查了兩個變量之間具有相關關系的定義,根據學過公式和經驗進行逐項驗證,一定要和函數關系區(qū)別出來3.在畫兩個變量的散點圖時,下面哪個敘述是正確的()A、預報變量x軸上,解釋變量y軸上 B、解釋變量x軸上,預報變量y軸上 C、可以選擇兩個變量中任意一個變量x軸上 D、可以選擇兩個變量中任意一個變量y軸上分析:通常把自變量稱為解析變量,因變量稱為預報變量,故解釋變量為自變量,預報變量為因變量故選B4. 下表提供了某廠節(jié)能降耗技術改造后生產甲產品過程中記錄的產量x(噸)與相應的生產能耗y(噸標準煤)的幾組對照數據(1)請畫出上表數據的散點圖;(2)請根據上表提供的數據,用最小二乘法求出y關于x的線性回歸方程 y=bx+a;(3)已知該廠技改前100噸甲產品的生產能耗為90噸標準煤試根據(2)求出的線性回歸方程,預測生產100噸甲產品的生產能耗比技改前降低多少噸標準煤?(參考數值:32.5+43+54+64.5=66.5)學法指導本題考查散點圖,是通過讀圖來解決問題,考查讀圖能力,是一個基礎題,本題可以粗略的反應兩個變量之間的關系,是不是線性相關,是正相關還是負相關5(2010臨潁縣)已知回歸直線斜率的估計值是1.23,樣本平均數 x=4,y=5,則該回歸直線方程為()A、y=1.23x+4 B、 y=1.23x+0.08 C、 y=0.08x+1.23 D、 y=1.23x+5 思路分析:根據回歸直線斜率的估計值是1.23,得到線性回歸方程是y=1.23x+b,根據橫標和縱標的值得到樣本中心點,把中心點代入

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論