版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第七章統計案例§1一元線性回歸§2成對數據的線性相關性新課程標準新學法解讀1.掌握散點圖與曲線擬合的概念.2.了解最小二乘法,會求一元線性回歸方程.3.理解線性相關系數公式并會簡單應用.1.會畫散點圖,并能利用散點圖判斷兩個變量是否具有相關關系.2.理解最小二乘法原理,會求回歸直線方程.3.掌握相關系數公式.4.會用相關系數公式判斷兩個變量的線性相關性.[筆記教材]知識點一散點圖、直線擬合1.散點圖直角坐標系中每個點對應的一對數據(xi,yi),稱為成對數據,這些點構成的圖形稱為______________.2.曲線擬合從散點圖上可以看出,如果變量之間存在著某種關系,這些點會有―個大致趨勢,這種趨勢通??梢杂胈_______來近似地描述,這樣近似描述的過程稱為曲線擬合.3.直線擬合若在兩個變量X和Y的散點圖中,所有點看上去都在________附近波動,此時就可以用一條直線來近似地描述這兩個量之間的關系,稱之為直線擬合.答案:1.散點圖2.一條光滑的曲線3.一條直線知識點二一元線性回歸方程1.“最小二乘法”的含義使樣本點的縱坐標與直線上對應點的縱坐標差的平方和最小,即[y1-(a+bx1)]2+[y2-(a+bx2)]2+…+[yn-(a+yxn)]2________.2.一元線性回歸分析(1)設樣本點為(x1,y1),(x2,y2),…(xn,yn),直線方程Y=eq\o(a,\s\up15(^))+eq\o(b,\s\up15(^))X稱作Y關于X的線性回歸方程,相應的直線稱作Y關于X的________,eq\o(a,\s\up15(^)),eq\o(b,\s\up15(^))是這個線性回歸方程的系數.其中eq\o(b,\s\up15(^))=________=________=________,eq\o(a,\s\up15(^))=________,eq\x\to(x)=________,eq\x\to(y)=________.(2)利用回歸直線對總體進行估計利用回歸直線我們可以進行預測,若回歸直線方程為Y=eq\o(b,\s\up15(^))X+eq\o(a,\s\up15(^)),則X=X0處的估計值為Y=________.答案:1.最小2.(1)回歸直線eq\f(x1y1+x2y2+…+xnyn-n\x\to(x)\x\to(y),x\o\al(2,1)+x\o\al(2,2)+…+x\o\al(2,n)-n\x\to(x)2)eq\f(\a\vs4\al(\i\su(i=1,n,x)iyi-n\x\to(x)\x\to(y)),\a\vs4\al(\i\su(i=1,n,x)\o\al(2,i)-n\x\to(x)2))eq\f(\a\vs4\al(\i\su(i=1,n,?)xi-\x\to(x)??yi-\x\to(y)?),\a\vs4\al(\i\su(i=1,n,?)xi-\x\to(x)?2))eq\x\to(y)-eq\o(b,\s\up15(^))eq\x\to(x)eq\f(1,n)eq\i\su(i=1,n,x)ieq\f(1,n)eq\i\su(i=1,n,y)i(2)eq\o(b,\s\up15(^))X0+eq\o(a,\s\up15(^))知識點三相關系數1.相關關系兩個變量有關系,但又沒有確切到可由其中的一個去精確地決定另一個的程度,這種關系稱為________.2.相關系數r的計算一般地,設隨機變量X,Y的n組觀測值分別為(x1,y1),(x2,y2),…,(xn,yn),記r=eq\f(?x1-\x\to(x)??y1-\x\to(y)?+?x2-\x\to(x)??y2-\x\to(y)?+…+?xn-\x\to(x)??yn-\x\to(y)?,\r(?x1-\x\to(x)?2+?x2-\x\to(x)?2+…+?xn-\x\to(x)?2)\r(?y1-\x\to(y)?2+?y2-\x\to(y)?2+…+?yn-\x\to(y)?2))=eq\f(\i\su(i=1,n,)?xi-\x\to(x)??yi-\x\to(y)?,\r(\a\vs4\al(\i\su(i=1,n,)?xi-\x\to(x)?2))\r(\a\vs4\al(\i\su(i=1,n,)?yi-\x\to(y)?2)))=eq\f(?x1y1+x2y2+…+xnyn?-n\x\to(x)\x\to(y),\r(?x\o\al(2,1)+x\o\al(2,2)+…+x\o\al(2,n)?-n\x\to(x)2)\r(?y\o\al(2,1)+y\o\al(2,2)+…+y\o\al(2,n)?-n\x\to(y)2)),稱r為隨機變量X和Y的樣本(線性)相關系數.3.相關系數r的性質(1)r的取值范圍為________.(2)|r|值越接近1,隨機變量之間的線性相關程度越________.(3)|r|值越接近0,隨機變量之間的線性相關程度越________.(4)利用相關系數r來檢驗線性相關顯著性水平時,通常與0.75作比較,若r>0.75,則線性相關較為顯著,否則為不顯著.4.相關性的分類(1)當________時,兩個隨機變量的值總體上變化越勢相同,此時稱兩個隨機變量正相關.(2)當________時,兩個隨機變量的值總體上變化越勢相反,此時稱兩個變量負相關.(3)當________時,此時稱兩個隨機變量線不相關.答案:1.相關關系3.(1)[-1,1](2)強(3)弱4.(1)r>0(2)r<0(3)r=0[重點理解]1.對正、負相關的理解在相關關系中,正、負相關只是代表一個趨勢.以正相關為例,在散點圖中,只要點散布在從左下角到右上角的區(qū)域,就說明這兩個變量是正相關的,允許個別的點(xi,yi),(xj,yj)(i,j∈N+)滿足當xi<xj時有yi>yj,這點要與函數關系中增函數的概念區(qū)別開來.2.求回歸直線方程的注意點對于任意一組樣本數據,利用公式都可以求得“回歸直線方程”,如果這組數據不具有線性相關關系,即不存在回歸直線,那么所得的“回歸直線方程”是沒有實際意義的,因此,對于一組樣本數據,應先作散點圖觀察,在具有線性相關關系的前提下再求回歸直線方程.[自我排查]1.判斷正誤.(正確的畫“√”,錯誤的畫“”)(1)回歸方程中,由x的值得出的y值是準確值.()(2)回歸直線一定過點(eq\x\to(x),eq\x\to(y)).(√)(3)回歸直線一定過樣本中的某一個點.()(4)選取一組數據中的部分點得到的回歸方程與由整組數據得到的回歸方程是同一個方程.()(5)|r|越小,線性回歸方程的擬合效果越好.()(6)相關系數是用來衡量兩個變量的線性相關性強弱的.(√)(7)當相關系數r滿足0≤r≤1時,回歸系數eq\o(b,\s\up15(^))也滿足0≤b≤1.()2.相關系數r的取值范圍是()A.[-1,1] B.[-1,0]C.[0,1] D.(-1,1)答案:A3.下列數據x,y符合哪一種函數模型()x12345678910y22.6933.383.63.844.084.24.3A.y=2+eq\f(1,3)x B.y=2exC.y=2eeq\s\up15(eq\f(1,x)) D.y=2+lnx答案:D4.已知變量x與y正相關,且由觀測數據算得樣本平均數eq\x\to(x)=3,eq\x\to(y)=3.5,則由該觀測數據算得線性回歸方程可能為()A.y=0.4x+2.3 B.y=2x-2.4C.y=-2x+9.5 D.y=-0.3x+4.4答案:A5.(2022安徽池州模擬)某超市統計了最近5年的商品銷售額與利潤率數據,經計算相關系數r=0.862,則下列判斷正確的是()A.商品銷售額與利潤率正相關,且具有較弱的相關關系B.商品銷售額與利潤率正相關,且具有較強的相關關系C.商品銷售額與利潤率負相關,且具有較弱的相關關系D.商品銷售額與利潤率負相關,且具有較強的相關關系答案:B研習1相關關系的判斷[典例1](1)兩個變量x,y與其線性相關系數r有下列說法:①若r>0,則x增大時,y也隨之相應增大;②若r<0,則x增大時,y也相應增大;③若r=1或r=-1,則x與y的關系完全對應(有函數關系),在散點圖上各個散點均在一條直線上,其中正確的有()A.①② B.②③C.①③ D.①②③(2)有五組變量:①汽車的重量和汽車每消耗1升汽油所行駛的平均路程;②平均日學習時間和平均學習成績;③某人每日吸煙量和其身體健康情況;④正方形的邊長和面積;⑤汽車的重量和百公里耗油量.其中兩個變量成正相關的是()A.①③ B.②④C.②⑤ D.④⑤(1)[答案]C[解析]根據兩個變量的相關性與其相關系數r之間的關系知,①③正確,②錯誤,故選C.(2)[答案]C[解析]其中①③成負相關關系,②⑤成正相關關系,④成函數關系,故選C.[巧歸納]1.線性相關系數是從數值上來判斷變量間的線性相關程度,是定量的方法.與觀察散點圖相比較,線性相關系數要精細得多,需要注意的是線性相關系數r的絕對值小,只是說明線性相關程度低,但不一定不相關,可能是非線性相關.2.利用相關系數r來檢驗線性相關顯著性水平時,通常與0.75作比較,若r>0.75,則線性相關較為顯著,否則為不顯著.[練習1]下列兩變量中具有相關關系的是()A.正方體的體積與邊長B.人的身高與體重C.勻速行駛車輛的行駛距離與時間D.球的半徑與體積答案:B解析:選項A中正方體的體積為邊長的立方,有固定的函數關系;選項C中勻速行駛車輛的行駛距離與時間成正比,也是函數關系;選項D中球的體積是eq\f(4,3)π與半徑的立方相乘,有固定函數關系.只有選項B中人的身高與體重具有相關關系.研習2回歸直線方程[典例2]一臺機器由于使用時間較長,生產的零件有一些會缺損,按不同轉速生產出來的零件有缺損的統計數據如下表:轉速x(轉/秒)1614128每小時生產缺損零件數y(件)11985(1)作出散點圖;(2)如果y與x線性相關,求出線性回歸方程;(3)若實際生產中,允許每小時的產品中有缺損的零件最多為10個,那么,機器的運轉速度應控制在什么范圍?(1)[解]根據表中的數據畫出散點圖如圖.(2)[解]設線性回歸方程為eq\o(y,\s\up15(∧))=eq\o(b,\s\up15(∧))x+eq\o(a,\s\up15(∧)),并列表.i1234xi1614128yi11985xiyi1761269640eq\x\to(x)=12.5,eq\x\to(y)=8.25,xeq\o\al(2,i)=660,xiyi=438,所以eq\o(b,\s\up15(∧))=eq\f(438-4×12.5×8.25,660-4×12.52)≈0.73,eq\o(a,\s\up15(∧))=8.25-0.73×12.5=-0.875,所以eq\o(y,\s\up15(∧))=0.73x-0.875.(3)[解]令0.73x-0.875≤10,解得x≤14.9≈15,故機器的運轉速度應控制在15轉/秒內.[巧歸納]1.求回歸直線方程的步驟:(1)在分析兩個變量的相關關系時,可根據樣本數據散點圖確定兩個變量之間是否存在相關關系;(2)把數據制成表,從表中計算出eq\x\to(x),eq\x\to(y),xeq\o\al(2,1)+xeq\o\al(2,2)+…+xeq\o\al(2,n),x1y1+x2y2+…+xnyn的值;(3)計算eq\o(a,\s\up15(^)),eq\o(b,\s\up15(^));(4)寫出線性回歸方程eq\o(y,\s\up15(^))=eq\o(a,\s\up15(^))+eq\o(b,\s\up15(^))x.2.回歸直線y=a+bx必過樣本點(eq\x\to(x),eq\x\to(y)),其中eq\x\to(x)=eq\f(1,n)eq\a\vs4\al(\i\su(i=1,n,x)i,\x\to(y))=eq\f(1,n)yi.線性回歸方程中的截距eq\o(a,\s\up15(^))和斜率eq\o(b,\s\up15(^))都是通過樣本估計而得到的,存在著誤差,這種誤差可能導致預報結果的偏差,所以由線性回歸方程給出的是一個預報值而非精確值.[練習2]某班5名學生的數學和物理成績如下表:學生學科ABCDE數學成績(x)8876736663物理成績(y)7865716461(1)畫出散點圖;(2)求物理成績y對數學成績x的線性回歸方程;(3)一名學生的數學成績是96,試預測他的物理成績.(1)解:散點圖如圖.(2)解:eq\x\to(x)=eq\f(1,5)×(88+76+73+66+63)=73.2,eq\x\to(y)=eq\f(1,5)×(78+65+71+64+61)=67.8.eq\i\su(i=1,5,x)iyi=88×78+76×65+73×71+66×64+63×61=25054.eq\i\su(i=1,5,x)eq\o\al(2,i)=882+762+732+662+632=27174.所以eq\o(b,\s\up15(∧))=eqeq\i\su(i=1,5,x)iyi-5\x\to(x)2=eq\f(25054-5×73.2×67.8,27174-5×73.22)≈0.625.eq\o(a,\s\up15(∧))=eq\x\to(y)-eq\o(b,\s\up15(∧))eq\x\to(x)≈67.8-0.625×73.2=22.05.所以y對x的線性回歸方程是eq\o(y,\s\up15(∧))=22.05+0.625x.(3)解:x=96,則y=0.625×96+22.05≈82,即可以預測他的物理成績是82.研習3線性相關系數及其應用[典例3]近年來,隨著互聯網的發(fā)展,網約車服務在我國各地迅猛發(fā)展,為人們出行提供了便利,但也給城市交通管理帶來了一些困難.為掌握網約車在M省的發(fā)展情況,M省某調查機構從該省抽取了5個城市,分別收集和分析了網約車的A,B兩項指標數xi,yi(i=1,2,3,4,5),數據如下表所示:城市1城市2城市3城市4城市5A指標數x24568B指標數y34445經計算得:eq\r(\a\vs4\al(\i\su(i=1,5,)?xi-\x\to(x)?2))=2eq\r(5),eq\r(\a\vs4\al(\i\su(i=1,5,)(yi-\x\to(y)))2)=eq\r(2).(1)試求y與x間的相關系數r,并利用r說明y與x是否具有較強的線性相關關系(若eq\b\lc\|\rc\|(\a\vs4\al\co1(r))>0,75,則線性相關程度很高,可用線性回歸模型擬合);(2)求y關于x的回歸方程,并預測當A指標數為7時,B指標數的估計值.參考數據:eq\r(0.3)≈0.55,eq\r(0.9)≈0.95.解:(1)eq\x\to(x)=eq\f(2+4+5+6+8,5)=5,eq\x\to(y)=eq\f(3+4+4+4+5,5)=4,eq\i\su(i=1,5,?)xi-eq\x\to(x))(yi-eq\x\to(y))=6,相關系數r=eq\f(\a\vs4\al(\i\su(i=1,5,)?xi-\x\to(x)??yi-\x\to(y)?),\r(\a\vs4\al(\i\su(i=1,5,)?xi-\x\to(x)?2))\r(\a\vs4\al(\i\su(i=1,5,)?yi-\x\to(y)?2)))=eq\f(6,2\r(5)·\r(2))=eq\r(\f(9,10))≈0.95,因為r>0.75,所以y與x具有較強的線性相關關系,可用線性回歸模型擬合y與x的關系.(2)解:由(1)知,eq\o(b,\s\up15(^))=eq\f(\i\su(i=1,5,)(xi-\x\to(x))(yi-\x\to(y)),\i\su(i=1,5,)(xi-\x\to(x))2)=eq\f(6,20)=eq\f(3,10),eq\o(a,\s\up15(^))=eq\x\to(y)-eq\o(b,\s\up15(^))eq\x\to(x)=4-eq\f(3,10)×5=eq\f(5,2),所以y與x之間線性回歸方程為eq\o(y,\s\up15(^))=eq\f(3,10)x+eq\f(5,2),當x=7時,eq\o(y,\s\up15(^))=eq\f(3,10)×7+eq\f(5,2)=4.6.當A指標數為7時,B指標數的估計值為4.6.[巧歸納]1.散點圖只能直觀判斷兩變量是否具有相關關系.2.相關系數能精確刻畫兩變量線性相關關系的強弱.[練習3](2022江蘇南京秦淮中學模擬)(多選題)為了對變量x與y的線性相關性進行檢驗,由樣本點(x1,y1),(x2,y2),…,(x10,y10)求得兩個變量的樣本相關系數為r,那么下面說法中錯誤的有()A.若所有樣本點都在直線y=-2x+1上,則r=1B.若所有樣本點都在直線y=-2x+1上,則r=-2C.若eq\b\lc\|\rc\|(\a\vs4\al\co1(r))越大,則變量x與y的線性相關性越強D.若eq\b\lc\|\rc\|(\a\vs4\al\co1(r))越小,則變量x與y的線性相關性越強答案:ABD解析:若所有樣本點都在直線y=-2x+1上,則|r|=1,又直線斜率為負數,則r=-1,A,B選項均錯誤;若|r|越大,則變量x與y的線性相關性越強,C選項正確,D選項錯誤.故選ABD.研習4非線性回歸問題[典例4]某地區(qū)不同身高的未成年男性的體重平均值如下表:身高x(cm)60708090100110體重y(kg)6.137.909.9912.1515.0217.50身高x(cm)120130140150160170體重y(kg)20.9226.8631.1138.8547.2555.05(1)試建立y與x之間的回歸方程;(2)如果一名在校男生身高為168(1)[解]根據表中的數據畫出散點圖,如圖:由圖看出,這些點分布在某條指數型函數曲線y=c1ec2x的周圍,于是令z=lny,列表如下:x60708090100110z1.812.072.302.502.712.86x120130140150160170z3.043.293.443.663.864.01作出散點圖,如圖:由表中數據可求得z與x之間的回歸直線方程為eq\o(z,\s\up15(^))=0.693+0.020x,則有y=e0.693+0.020x.(2)[解]由(1)知,當x=168時,y=e0.693+0.020×168≈57.57,所以在校男生身高為168cm,預測他的體重約為[巧歸納]兩個變量不具有線性關系,不能直接利用線性回歸方程建立兩個變量的關系,可以通過變換的方法轉化為線性回歸模型,如y=c1ec2x,我們可以通過對數變換把指數關系變?yōu)榫€性關系,令z=lny,則變換后樣本點應該分布在直線z=bx+a(a=lnc1,b=c2)的周圍.[練習4]為了研究某種細菌隨時間x變化繁殖個數y的變化,收集數據如下:時間x/天123456繁殖個數y612254995190(1)作出這些數據的散點圖;(2)求y與x之間的回歸方程.(1)解:散點圖如圖所示,(2)解:由散點圖看出樣本點分布在一條指數函數y=c1ec2x圖象的周圍,于是令z=lny,則x123456z1.792.483.223.894.555.25由計算器算得z=0.69x+1.112,則有y=e0.69x+1.112.1.下列結論正確的是()①函數關系是一種確定性關系;②相關關系是一種非確定性關系;③回歸分析是對具有函數關系的兩個變量進行統計分析的一種方法;④回歸分析是對具有相關關系的兩個變量進行統計分析的一種常用方法.A.①② B.①②③C.①②④ D.①②③④答案:C解析:函數關系和相關關系的區(qū)別是前者是確定性關系,后者是非確定性關系,故①②正確;回歸分析是對具有相關關系的兩個變量進行統計分析的一種方法,故③錯誤,④正確.2.下表是x和y之間的一組數據,則y關于x的線性回歸方程必過點()x1234y1357A.(2,3) B.(1.5,4)C.(2.5,4) D.(2.5,5)答案:C解析:線性回歸方程必過樣本點的中心(eq\x\to(x),eq\x\to(y)),即(2.5,4),故選C.3.(2022廣西玉林師院附中模擬)判斷如圖所示的圖形中具有相關關系的是()答案:C解析:根據圖象可得A,B為連續(xù)曲線,變量間的關系是確定的,不是相關關系,C中散點分布在一條直線附近,可得其線性相關,D中散點分布在一個長方形區(qū)域,即非線性相關,故選C.4.對具有線性相關關系的變量x和y,由測得的一組數據求得回歸直線的斜率為6.5,且恒過(2,3)點,則這條回歸直線的方程為________.答案:eq\o(y,\s\up15(∧))=-10+6.5x解析:由題意知eq\x\to(x)=2,eq\x\to(y)=3,eq\o(b,\s\up15(∧))=6.5,所以eq\o(a,\s\up15(∧))=eq\x\to(y)-eq\o(b,\s\up15(∧))eq\x\to(x)=3-6.5×2=-10,即回歸直線的方程為eq\o(y,\s\up15(∧))=-10+6.5x.5.部門所屬的10個工業(yè)企業(yè)生產性固定資產價值與工業(yè)增加值資料如下表(單位:百萬元):固定資產價值33566789910工業(yè)增加值15172528303637424045根據上表資料計算的相關系數為________.答案:0.9918解析:eq\x\to(x)=eq\f(3+3+5+6+6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- Unit 4 My home Part A Let's talk(說課稿)-2024-2025學年人教PEP版英語四年級上冊
- 文化行業(yè)采購工作心得
- 金融保險業(yè)務員工作總結
- 全國青島版信息技術七年級上冊專題三第3課二、《中級美圖師-為圖片添加特效》說課稿
- 康復科康復治療與康復評估工作總結
- 2025年幼兒園工會工作計劃學校工作計劃
- 農業(yè)行業(yè)客服工作感悟
- 農業(yè)行業(yè)話務員工作報告
- 保險行業(yè)美工的保險形象
- 電子通信人事工作總結
- 數學課怎樣分層教學案例
- 學校餐廳供貨者評價和退出機制
- 2023醫(yī)院招聘護士考試真題庫及參考答案
- 湖北省襄樊市襄陽古城旅游區(qū)總體重點規(guī)劃
- 消火栓月檢查表
- 項目財務核算業(yè)務藍圖
- 8.臺球助教速成培訓手冊0.9萬字
- 無縫鋼管焊接作業(yè)指導書(1)
- 零缺陷與質量成本
- 網吧企業(yè)章程范本
- 安徽省書法家協會會員登記表
評論
0/150
提交評論