舊教材適用2023高考數(shù)學一輪總復習第十章統(tǒng)計統(tǒng)計案例第3講變量間的相關關系與統(tǒng)計案例_第1頁
舊教材適用2023高考數(shù)學一輪總復習第十章統(tǒng)計統(tǒng)計案例第3講變量間的相關關系與統(tǒng)計案例_第2頁
舊教材適用2023高考數(shù)學一輪總復習第十章統(tǒng)計統(tǒng)計案例第3講變量間的相關關系與統(tǒng)計案例_第3頁
舊教材適用2023高考數(shù)學一輪總復習第十章統(tǒng)計統(tǒng)計案例第3講變量間的相關關系與統(tǒng)計案例_第4頁
舊教材適用2023高考數(shù)學一輪總復習第十章統(tǒng)計統(tǒng)計案例第3講變量間的相關關系與統(tǒng)計案例_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第3講變量間的相關關系與統(tǒng)計案例1.變量間的相關關系(1)常見的兩變量之間的關系有兩類:一類是函數(shù)關系,另一類是相關關系;與函數(shù)關系不同,相關關系是一種非eq\o(□,\s\up3(01))確定性關系.(2)從散點圖上看,點分布在從左下角到右上角的區(qū)域內(nèi),兩個變量的這種相關關系稱為eq\o(□,\s\up3(02))正相關,點分布在左上角到右下角的區(qū)域內(nèi),兩個變量的相關關系為eq\o(□,\s\up3(03))負相關.2.回歸方程與回歸分析(1)線性相關關系與回歸直線如果散點圖中點的分布從整體上看大致在eq\o(□,\s\up3(04))一條直線附近,就稱這兩個變量之間具有線性相關關系,這條直線叫做回歸直線.(2)回歸方程①最小二乘法:求回歸直線使得樣本數(shù)據(jù)的點到回歸直線的eq\o(□,\s\up3(05))距離的平方和最小的方法叫做最小二乘法.②回歸方程:方程eq\o(y,\s\up10(^))=eq\o(b,\s\up10(^))x+eq\o(a,\s\up10(^))是兩個具有線性相關關系的變量的一組數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)的回歸方程,其中eq\o(a,\s\up10(^)),eq\o(b,\s\up10(^))是待定數(shù).eq\b\lc\{\rc\(\a\vs4\al\co1(\o(b,\s\up10(^))=\f(\i\su(i=1,n,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\i\su(i=1,n,)xi-\o(x,\s\up10(-))2)=\f(\i\su(i=1,n,x)iyi-n\o(x,\s\up10(-))\o(y,\s\up10(-)),\i\su(i=1,n,x)\o\al(2,i)-n\o(x,\s\up10(-))2),,\o(a,\s\up10(^))=\o(y,\s\up10(-))-\o(b,\s\up10(^))\o(x,\s\up10(-)).))(3)回歸分析①定義:對具有eq\o(□,\s\up3(06))相關關系的兩個變量進行統(tǒng)計分析的一種常用方法.②樣本點的中心:在具有線性相關關系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)中,eq\o(x,\s\up10(-))=eq\f(1,n)(x1+…+xn),eq\o(y,\s\up10(-))=eq\f(1,n)(y1+…+yn),eq\o(a,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(b,\s\up10(^))eq\o(x,\s\up10(-)),(eq\o(x,\s\up10(-)),eq\o(y,\s\up10(-)))稱為樣本點的中心.③相關系數(shù)r=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\r(\i\su(i=1,n,)xi-\o(x,\s\up10(-))2\i\su(i=1,n,)yi-\o(y,\s\up10(-))2)),當r>0時,兩變量eq\o(□,\s\up3(07))正相關;當r<0時,兩變量eq\o(□,\s\up3(08))負相關;當|r|≤1且|r|越接近于1時,相關程度eq\o(□,\s\up3(09))越強;當|r|≤1且|r|越接近于0時,相關程度eq\o(□,\s\up3(10))越弱.3.獨立性檢驗(1)獨立性檢驗的有關概念①分類變量可用變量的不同“值”表示個體所屬的eq\o(□,\s\up3(11))不同類別的變量稱為分類變量.②2×2列聯(lián)表假設有兩個分類變量X和Y,它們的取值分別為{x1,x2}和{y1,y2},其樣本頻數(shù)列聯(lián)表(稱為2×2列聯(lián)表)為y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d(2)獨立性檢驗利用隨機變量K2=eq\f(nad-bc2,a+bc+da+cb+d)(其中n=a+b+c+d為樣本容量)來判斷“兩個變量有關系”的方法稱為獨立性檢驗.步驟如下:①計算隨機變量K2的觀測值k,查表確定臨界值k0:P(K2≥k0)0.50.400.250.150.10k00.4550.7081.3232.0722.706P(K2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828②如果k≥k0,就推斷“X與Y有關系”,這種推斷犯錯誤的概率不超過P(K2≥k0);否則,就認為在犯錯誤的概率不超過P(K2≥k0)的前提下不能推斷“X與Y有關系”.1.求解回歸方程的關鍵是確定eq\o(a,\s\up10(^)),eq\o(b,\s\up10(^)),應充分利用回歸直線過樣本點的中心(eq\o(x,\s\up10(-)),eq\o(y,\s\up10(-))).2.根據(jù)回歸方程計算的eq\o(y,\s\up10(^))值,僅是一個預報值,不是真實發(fā)生的值.3.根據(jù)K2的值可以判斷兩個分類變量有關的可信程度,若K2越大,則兩分類變量有關的把握越大.1.下面是一個2×2列聯(lián)表:y1y2總計x1a2173x2222547總計b46120其中a,b處填的值分別為()A.94,72 B.52,50C.52,74 D.74,52答案C解析由a+21=73,得a=52,a+22=b,得b=74.故選C.2.甲、乙、丙、丁四位同學各自對A,B兩個變量的線性相關性做了試驗,并用回歸分析方法分別求得相關系數(shù)r與殘差平方和m,如下表:甲乙丙丁r0.820.780.690.85m106115124103則哪位同學的試驗結果體現(xiàn)的A,B兩變量有更強的線性相關性()A.甲 B.乙C.丙 D.丁答案D解析r越大,m越小,線性相關性越強,故選D.3.(2022·鄭州一中月考)變量X與Y相對應的一組數(shù)據(jù)為(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量U與V相對應的一組數(shù)據(jù)為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示變量Y與X之間的線性相關系數(shù),r2表示變量V與U之間的線性相關系數(shù),則()A.r2<r1<0 B.0<r2<r1C.r2<0<r1 D.r2=r1答案C解析對于變量Y與X而言,Y隨X的增大而增大,故Y與X正相關,即r1>0;對于變量V與U而言,V隨U的增大而減小,故V與U負相關,即r2<0,故選C.4.通過隨機詢問110名不同的大學生是否愛好某項運動,得到了如下的列聯(lián)表.參照附表,能得到的正確結論是()男女總計愛好402060不愛好203050總計6050110A.有99%以上的把握認為“愛好該項運動與性別有關”B.有99%以上的把握認為“愛好該項運動與性別無關”C.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別有關”D.在犯錯誤的概率不超過0.1%的前提下,認為“愛好該項運動與性別無關”附:K2=eq\f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.P(K2≥k0)0.050.0100.001k03.8416.63510.828答案A解析由列聯(lián)表中的數(shù)據(jù)可得K2=eq\f(110×40×30-20×202,60×50×60×50)≈7.822>6.635,故有99%以上的把握認為“愛好該項運動與性別有關”.故選A.5.(2021·山西太原模擬)某產(chǎn)品的廣告費用x與銷售額y的統(tǒng)計數(shù)據(jù)如下表:廣告費用x(萬元)4235銷售額y(萬元)49263954根據(jù)上表可得回歸方程eq\o(y,\s\up10(^))=eq\o(b,\s\up10(^))x+eq\o(a,\s\up10(^))中的eq\o(b,\s\up10(^))為9.4,據(jù)此模型預測廣告費用為6萬元時銷售額約為________萬元.答案65.5解析由表可計算eq\o(x,\s\up10(-))=eq\f(4+2+3+5,4)=3.5,eq\o(y,\s\up10(-))=eq\f(49+26+39+54,4)=42,因為點(3.5,42)在回歸直線eq\o(y,\s\up10(^))=eq\o(b,\s\up10(^))x+eq\o(a,\s\up10(^))上,且eq\o(b,\s\up10(^))=9.4,所以42=9.4×3.5+eq\o(a,\s\up10(^)),解得eq\o(a,\s\up10(^))=9.1.故回歸方程為eq\o(y,\s\up10(^))=9.4x+9.1.令x=6,得eq\o(y,\s\up10(^))=65.5.故預測廣告費用為6萬元時銷售額約為65.5萬元.6.(2021·安徽馬鞍山模擬)某企業(yè)為了調(diào)查其產(chǎn)品在國內(nèi)和國際市場的發(fā)展情況,隨機抽取國內(nèi)、國外各100名客戶代表,了解他們對該企業(yè)產(chǎn)品的發(fā)展前景所持的態(tài)度,得到如圖所示的等高條形圖,則________(填“能”或“不能”)有99%的把握認為是否持樂觀態(tài)度與國內(nèi)外差異有關.P(K2≥k0)0.0500.0100.0050.001k03.8416.6357.87910.828附:K2=eq\f(nad-bc2,a+bc+da+cb+d).答案能解析根據(jù)題目所給數(shù)據(jù)得到如下2×2列聯(lián)表:樂觀不樂觀總計國內(nèi)代表6040100國外代表4060100總計100100200則K2=eq\f(200×60×60-40×402,100×100×100×100)=8>6.635,所以有99%的把握認為是否持樂觀態(tài)度與國內(nèi)外差異有關.精準設計考向,多角度探究突破考向一兩個變量的相關性角度相關關系的判斷例1觀察下圖所示的散點圖,其中對兩個變量的相關關系判斷正確的是()A.a(chǎn)為正相關,b為負相關,c為不相關B.a(chǎn)為負相關,b為不相關,c為正相關C.a(chǎn)為負相關,b為正相關,c為不相關D.a(chǎn)為正相關,b為不相關,c為負相關答案D解析根據(jù)散點圖,由相關性可知,a中各點分布在從左下角到右上角的區(qū)域里,是正相關;b中各點分布不是帶狀的,相關性不明確,所以不相關;c中各點分布在從左上角到右下角的區(qū)域里,是負相關.角度相關系數(shù)的意義例2(2021·南寧一中期末)某公司為了準確地把握市場,做好產(chǎn)品生產(chǎn)計劃,對過去四年的數(shù)據(jù)進行整理得到了第x年與年銷售量y(單位:萬件)之間的關系如下表:x1234y12284256(1)在圖中畫出表中數(shù)據(jù)的散點圖;(2)根據(jù)(1)中的散點圖擬合y與x的回歸模型,并用相關系數(shù)加以說明;(3)建立y關于x的回歸方程,預測第5年的銷售量約為多少?參考數(shù)據(jù):eq\r(\o(∑,\s\up10(4),\s\do7(i=1))yi-\o(y,\s\up10(-))2)≈32.7,eq\r(5)≈2.24,eq\o(∑,\s\up10(4),\s\do7(i=1))xiyi=418.參考公式:相關系數(shù)r=eq\f(\o(∑,\s\up10(n),\s\do7(i=1))xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\r(\o(∑,\s\up10(n),\s\do7(i=1))xi-\o(x,\s\up10(-))2\o(∑,\s\up10(n),\s\do7(i=1))yi-\o(y,\s\up10(-))2)),回歸方程eq\o(y,\s\up10(^))=eq\o(a,\s\up10(^))+eq\o(b,\s\up10(^))x的斜率和截距的最小二乘估計分別為eq\o(b,\s\up10(^))=eq\f(\o(∑,\s\up10(n),\s\do7(i=1))xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\o(∑,\s\up10(n),\s\do7(i=1))xi-\o(x,\s\up10(-))2)=eq\f(\o(∑,\s\up10(n),\s\do7(i=1))xiyi-n\o(x,\s\up10(-))\o(y,\s\up10(-)),\o(∑,\s\up10(n),\s\do7(i=1))x\o\al(2,i)-n\o(x,\s\up10(-))2),eq\o(a,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(b,\s\up10(^))eq\o(x,\s\up10(-)).解(1)作出散點圖如圖:(2)由(1)中的散點圖可知,各點大致分布在一條直線附近,由題中所給表格及參考數(shù)據(jù),得eq\o(x,\s\up10(-))=eq\f(5,2),eq\o(y,\s\up10(-))=eq\f(69,2),eq\o(∑,\s\up10(4),\s\do7(i=1))xiyi=418,eq\r(\o(∑,\s\up10(4),\s\do7(i=1))yi-\o(y,\s\up10(-))2)≈32.7,eq\o(∑,\s\up10(4),\s\do7(i=1))xeq\o\al(2,i)=30,eq\o(∑,\s\up10(4),\s\do7(i=1))(xi-eq\o(x,\s\up10(-)))(yi-eq\o(y,\s\up10(-)))=eq\o(∑,\s\up10(4),\s\do7(i=1))xiyi-4eq\o(x,\s\up10(-))eq\o(y,\s\up10(-))=418-4×eq\f(5,2)×eq\f(69,2)=73,eq\r(\o(∑,\s\up10(4),\s\do7(i=1))xi-\o(x,\s\up10(-))2)=eq\r(\o(∑,\s\up10(4),\s\do7(i=1))x\o\al(2,i)-4\o(x,\s\up10(-))2)=eq\r(30-4×\b\lc\(\rc\)(\a\vs4\al\co1(\f(5,2)))2)=eq\r(5)≈2.24,∴r=eq\f(\o(∑,\s\up10(4),\s\do7(i=1))xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\r(\o(∑,\s\up10(4),\s\do7(i=1))xi-\o(x,\s\up10(-))2\o(∑,\s\up10(4),\s\do7(i=1))yi-\o(y,\s\up10(-))2))≈eq\f(73,2.24×32.7)≈0.9966.∵y與x的相關系數(shù)近似為0.9966,說明y與x的線性相關程度相當強,∴可以用線性回歸模型擬合y與x的關系.(3)由(2),知eq\o(x,\s\up10(-))=eq\f(5,2),eq\o(y,\s\up10(-))=eq\f(69,2),eq\o(∑,\s\up10(4),\s\do7(i=1))xiyi=418,eq\o(∑,\s\up10(4),\s\do7(i=1))xeq\o\al(2,i)=30,∴eq\o(b,\s\up10(^))=eq\f(\o(∑,\s\up10(4),\s\do7(i=1))xiyi-4\o(x,\s\up10(-))\o(y,\s\up10(-)),\o(∑,\s\up10(4),\s\do7(i=1))x\o\al(2,i)-4\o(x,\s\up10(-))2)=eq\f(73,5),eq\o(a,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(b,\s\up10(^))eq\o(x,\s\up10(-))=eq\f(69,2)-eq\f(73,5)×eq\f(5,2)=-2.故y關于x的回歸方程為eq\o(y,\s\up10(^))=eq\f(73,5)x-2.當x=5時,eq\o(y,\s\up10(^))=eq\f(73,5)×5-2=71,∴預測第5年的銷售量約為71萬件.判斷相關關系的兩種方法(1)散點圖法:如果所有的樣本點都落在某一函數(shù)的曲線附近,變量之間就有相關關系.如果所有的樣本點都落在某一直線附近,變量之間就有線性相關關系.(2)相關系數(shù)法:利用相關系數(shù)判定,|r|越趨近于1相關性越強.1.(2021·江西六校聯(lián)考)對四組數(shù)據(jù)進行統(tǒng)計,獲得如圖所示的散點圖,關于其相關系數(shù)的比較,正確的是()A.r2<r4<0<r3<r1 B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1 D.r2<r4<0<r1<r3答案A解析易知題中圖①與圖③是正相關,圖②與圖④是負相關,且圖①與圖②中的樣本點集中分布在一條直線附近,則r2<r4<0<r3<r1.2.為了監(jiān)控某種零件的一條生產(chǎn)線的生產(chǎn)過程,檢驗員每隔30min從該生產(chǎn)線上隨機抽取一個零件,并測量其尺寸(單位:cm).下面是檢驗員在一天內(nèi)依次抽取的16個零件的尺寸:抽取次序12345678零件尺寸9.9510.129.969.9610.019.929.9810.04抽取次序910111213141516零件尺寸10.269.9110.1310.029.2210.0410.059.95經(jīng)計算得eq\o(x,\s\up10(-))=eq\f(1,16)eq\i\su(i=1,16,x)i=9.97,s=eq\r(\f(1,16)\i\su(i=1,16,)xi-\o(x,\s\up10(-))2)=eq\r(\f(1,16)\i\su(i=1,16,x)\o\al(2,i)-16\o(x,\s\up10(-))2)≈0.212,eq\r(\i\su(i=1,16,)i-8.52)≈18.439,eq\i\su(i=1,16,)(xi-eq\o(x,\s\up10(-)))(i-8.5)=-2.78,其中xi為抽取的第i個零件的尺寸,i=1,2,…,16.(1)求(xi,i)(i=1,2,…,16)的相關系數(shù)r,并回答是否可以認為這一天生產(chǎn)的零件尺寸不隨生產(chǎn)過程的進行而系統(tǒng)地變大或變小(若|r|<0.25,則可以認為零件的尺寸不隨生產(chǎn)過程的進行而系統(tǒng)地變大或變小);(2)一天內(nèi)抽檢零件中,如果出現(xiàn)了尺寸在(eq\o(x,\s\up10(-))-3s,eq\o(x,\s\up10(-))+3s)之外的零件,就認為這條生產(chǎn)線在這一天的生產(chǎn)過程可能出現(xiàn)了異常情況,需對當天的生產(chǎn)過程進行檢查.①從這一天抽檢的結果看,是否需對當天的生產(chǎn)過程進行檢查?②在(eq\o(x,\s\up10(-))-3s,eq\o(x,\s\up10(-))+3s)之外的數(shù)據(jù)稱為離群值,試剔除離群值,估計這條生產(chǎn)線當天生產(chǎn)的零件尺寸的均值與標準差.(精確到0.01)附:樣本(xi,yi)(i=1,2,…,n)的相關系數(shù)r=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\r(\i\su(i=1,n,)xi-\o(x,\s\up10(-))2)\r(\i\su(i=1,n,)yi-\o(y,\s\up10(-))2)).參考數(shù)據(jù):eq\r(0.008)≈0.09.解(1)由樣本數(shù)據(jù),得(xi,i)(i=1,2,…,16)的相關系數(shù)r=eq\f(\i\su(i=1,16,)xi-\o(x,\s\up10(-))i-8.5,\r(\i\su(i=1,16,)xi-\o(x,\s\up10(-))2)\r(\i\su(i=1,16,)i-8.52))≈eq\f(-2.78,0.212×\r(16)×18.439)≈-0.18.由于|r|<0.25,因此可以認為這一天生產(chǎn)的零件尺寸不隨生產(chǎn)過程的進行而系統(tǒng)地變大或變?。?2)①由于eq\o(x,\s\up10(-))=9.97,s≈0.212,因此由樣本數(shù)據(jù)可以看出抽取的第13個零件的尺寸在(eq\o(x,\s\up10(-))-3s,eq\o(x,\s\up10(-))+3s)以外,因此需對當天的生產(chǎn)過程進行檢查.②剔除離群值,即第13個數(shù)據(jù),剩下數(shù)據(jù)的平均數(shù)為eq\f(1,15)×(16×9.97-9.22)=10.02,這條生產(chǎn)線當天生產(chǎn)的零件尺寸的均值的估計值為10.02.eq\i\su(i=1,16,x)eq\o\al(2,i)≈16×0.2122+16×9.972≈1591.134,剔除第13個數(shù)據(jù),剩下數(shù)據(jù)的樣本方差為eq\f(1,15)×(1591.134-9.222-15×10.022)≈0.008,這條生產(chǎn)線當天生產(chǎn)的零件尺寸的標準差的估計值為eq\r(0.008)≈0.09.考向二回歸分析例3在紅外線照射下,組織溫度升高,毛細血管擴張,血流加快,物質代謝增強,組織細胞活力及再生能力提高,因此紅外線治療儀對某些疾病的治療有著很好的作用.某藥店兼營某紅外線治療儀,經(jīng)過近5個月的營銷,對銷售狀況進行相關數(shù)據(jù)分析,發(fā)現(xiàn)月銷售量與銷售價格有關,統(tǒng)計數(shù)據(jù)如下表:每臺紅外線治療儀的銷售價格x/元140150160170180紅外線治療儀的月銷售量y/臺6455453526(1)根據(jù)表中數(shù)據(jù)求y關于x的線性回歸方程;(2)①每臺紅外線治療儀的價格為165元時,預測紅外線治療儀的月銷售量;(四舍五入為整數(shù))②若該紅外線治療儀的成本為120元/臺,要使每月獲得最大的純收益,利用(1)中結論,問每臺紅外線治療儀的銷售價格應定為多少?(四舍五入,精確到1元)參考公式:回歸方程eq\o(y,\s\up10(^))=eq\o(b,\s\up10(^))x+eq\o(a,\s\up10(^)),其中eq\o(b,\s\up10(^))=eq\f(\o(\o(∑,\s\up10(n)),\s\do7(i=1))xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\o(\o(∑,\s\up10(n)),\s\do7(i=1))xi-\o(x,\s\up10(-))2),eq\o(a,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(b,\s\up10(^))eq\o(x,\s\up10(-)).解(1)eq\o(x,\s\up10(-))=eq\f(140+150+160+170+180,5)=160,eq\o(y,\s\up10(-))=eq\f(64+55+45+35+26,5)=45,eq\i\su(i=1,5,)(xi-eq\o(x,\s\up10(-)))2=(140-160)2+(150-160)2+(160-160)2+(170-160)2+(180-160)2=1000,eq\i\su(i=1,5,)(xi-eq\o(x,\s\up10(-)))(yi-eq\o(y,\s\up10(-)))=-20×19-10×10+0×0-10×10-20×19=-960,∴eq\o(b,\s\up10(^))=eq\f(eq\i\su(i=1,5,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),eq\i\su(i=1,5,)xi-\o(x,\s\up10(-))2)=eq\f(-960,1000)=-0.96,∴eq\o(a,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(b,\s\up10(^))eq\o(x,\s\up10(-))=45+0.96×160=198.6,∴y關于x的線性回歸方程為eq\o(y,\s\up10(^))=-0.96x+198.6.(2)①由(1)知,當x=165時,eq\o(y,\s\up10(^))=-0.96×165+198.6=40.2≈40,即每臺紅外線治療儀的價格為165元時,紅外線治療儀的月銷售量約為40臺.②藥店每月獲得的純收益Q(x)=(-0.96x+198.6)(x-120)=-0.96x2+313.8x-23832,∴當x=eq\f(313.8,2×0.96)≈163時,Q(x)取得最大值,即要使每月獲得最大的純收益,每臺紅外線治療儀的銷售價格應定為163元.(1)正確理解計算eq\o(b,\s\up10(^)),eq\o(a,\s\up10(^))的公式和準確的計算是求線性回歸方程的關鍵.(2)回歸方程eq\o(y,\s\up10(^))=eq\o(b,\s\up10(^))x+eq\o(a,\s\up10(^))必過樣本點中心(eq\o(x,\s\up10(-)),eq\o(y,\s\up10(-))).(3)在分析兩個變量的相關關系時,可根據(jù)樣本數(shù)據(jù)作出散點圖來確定兩個變量之間是否具有相關關系,若具有線性相關關系,則可通過線性回歸方程來估計和預測.(4)對非線性回歸分析問題可通過適當?shù)膿Q元轉化為線性回歸分析問題求解.3.某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響.對近8年的年宣傳費xi和年銷售量yi(i=1,2,…,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.eq\o(x,\s\up10(-))eq\o(y,\s\up10(-))eq\o(w,\s\up10(-))eq\o(∑,\s\up10(8),\s\do7(i=1))(xi-eq\o(x,\s\up10(-)))2eq\o(∑,\s\up10(8),\s\do7(i=1))(wi-eq\o(w,\s\up10(-)))2eq\o(∑,\s\up10(8),\s\do7(i=1))(xi-eq\o(x,\s\up10(-)))·(yi-eq\o(y,\s\up10(-)))eq\o(∑,\s\up10(8),\s\do7(i=1))(wi-eq\o(w,\s\up10(-)))·(yi-eq\o(y,\s\up10(-)))46.65636.8289.81.61469108.8表中wi=eq\r(xi),eq\o(w,\s\up10(-))=eq\f(1,8)eq\o(∑,\s\up10(8),\s\do7(i=1))wi.(1)根據(jù)散點圖判斷,y=a+bx與y=c+deq\r(x)哪一個適宜作為年銷售量y關于年宣傳費x的回歸方程類型?(給出判斷即可,不必說明理由)(2)根據(jù)(1)的判斷結果及表中數(shù)據(jù),建立y關于x的回歸方程;(3)已知這種產(chǎn)品的年利潤z與x,y的關系為z=0.2y-x.根據(jù)(2)的結果回答下列問題:①年宣傳費x=49時,年銷售量及年利潤的預報值是多少?②年宣傳費x為何值時,年利潤的預報值最大?附:對于一組數(shù)據(jù)(u1,v1),(u2,v2),…,(un,vn),其回歸直線eq\o(v,\s\up10(^))=eq\o(α,\s\up10(^))+eq\o(β,\s\up10(^))u的斜率和截距的最小二乘估計分別為eq\o(β,\s\up10(^))=eq\f(\o(∑,\s\up10(n),\s\do7(i=1))ui-\o(u,\s\up10(-))vi-\o(v,\s\up10(-)),\o(∑,\s\up10(n),\s\do7(i=1))ui-\o(u,\s\up10(-))2),eq\o(α,\s\up10(^))=eq\o(v,\s\up10(-))-eq\o(β,\s\up10(^))eq\o(u,\s\up10(-)).解(1)由散點圖可以判斷,y=c+deq\r(x)適宜作為年銷售量y關于年宣傳費x的回歸方程類型.(2)令w=eq\r(x),先建立y關于w的線性回歸方程.由于eq\o(d,\s\up10(^))=eq\f(\o(∑,\s\up10(8),\s\do7(i=1))wi-\o(w,\s\up10(-))yi-\o(y,\s\up10(-)),\o(∑,\s\up10(8),\s\do7(i=1))wi-\o(w,\s\up10(-))2)=eq\f(108.8,1.6)=68,eq\o(c,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(d,\s\up10(^))eq\o(w,\s\up10(-))=563-68×6.8=100.6,所以y關于w的線性回歸方程為eq\o(y,\s\up10(^))=100.6+68w,因此y關于x的回歸方程為eq\a\vs4\al(\o(y,\s\up10(^)))=100.6+68eq\r(x).(3)①由(2)知,當x=49時,年銷售量y的預報值eq\a\vs4\al(\o(y,\s\up10(^)))=100.6+68eq\r(49)=576.6,年利潤z的預報值eq\o(z,\s\up10(^))=576.6×0.2-49=66.32.②根據(jù)(2)的結果知,年利潤z的預報值eq\o(z,\s\up10(^))=0.2(100.6+68eq\r(x))-x=-x+13.6eq\r(x)+20.12.所以當eq\r(x)=eq\f(13.6,2)=6.8,即x=46.24時,eq\o(z,\s\up10(^))取得最大值.故年宣傳費為46.24千元時,年利潤的預報值最大.考向三獨立性檢驗例4(1)黨的十九大報告明確提出:在共享經(jīng)濟等領域培育增長點、形成新動能.共享經(jīng)濟是公眾將閑置資源通過社會化平臺與他人共享,進而獲得收入的經(jīng)濟現(xiàn)象.為考察共享經(jīng)濟對企業(yè)經(jīng)濟活躍度的影響,在四個不同的企業(yè)各取兩個部門進行共享經(jīng)濟對比試驗,根據(jù)四個企業(yè)得到的試驗數(shù)據(jù)畫出如下四個等高條形圖,最能體現(xiàn)共享經(jīng)濟對該部門的發(fā)展有顯著效果的圖形是()答案D解析根據(jù)四個選項中的等高條形圖可知,選項D中共享與不共享的企業(yè)經(jīng)濟活躍度的差異較大,且最能體現(xiàn)共享經(jīng)濟對該部門的發(fā)展有顯著效果,故選D.(2)(2021·全國甲卷)甲、乙兩臺機床生產(chǎn)同種產(chǎn)品,產(chǎn)品按質量分為一級品和二級品,為了比較兩臺機床產(chǎn)品的質量,分別用兩臺機床各生產(chǎn)了200件產(chǎn)品,產(chǎn)品的質量情況統(tǒng)計如下表:一級品二級品合計甲機床15050200乙機床12080200合計270130400①甲機床、乙機床生產(chǎn)的產(chǎn)品中一級品的頻率分別是多少?②能否有99%的把握認為甲機床的產(chǎn)品質量與乙機床的產(chǎn)品質量有差異?附:K2=eq\f(nad-bc2,a+bc+da+cb+d),P(K2≥k)0.0500.0100.001k3.8416.63510.828解①設甲機床、乙機床生產(chǎn)的產(chǎn)品中一級品的頻率分別為P1,P2,則P1=eq\f(150,200)=0.75,P2=eq\f(120,200)=0.6.②根據(jù)題表中的數(shù)據(jù),得K2=eq\f(400×150×80-50×1202,200×200×270×130)=eq\f(400,39)≈10.256.因為10.256>6.635,所以有99%的把握認為甲機床的產(chǎn)品質量與乙機床的產(chǎn)品質量有差異.1.比較幾個分類變量有關聯(lián)的可能性大小的方法(1)通過計算K2的大小判斷:K2越大,兩變量有關聯(lián)的可能性越大.(2)通過計算|ad-bc|的大小判斷:|ad-bc|越大,兩變量有關聯(lián)的可能性越大.(3)通過計算eq\f(a,a+b)與eq\f(c,c+d)的大小判斷:相差越大,兩變量有關聯(lián)的可能性越大.2.獨立性檢驗的一般步驟(1)根據(jù)樣本數(shù)據(jù)制成2×2列聯(lián)表.(2)根據(jù)公式K2=eq\f(nad-bc2,a+bc+da+cb+d)計算K2的觀測值k.(3)比較k與臨界值的大小關系,作統(tǒng)計推斷.4.(2021·南陽市一中第一次目標考試)為考察A,B兩種藥物預防某疾病的效果,進行動物實驗,分別得到如下等高條形圖.根據(jù)圖中信息,在下列各項中,說法最佳的一項是()A.藥物B的預防效果優(yōu)于藥物A的預防效果B.藥物A的預防效果優(yōu)于藥物B的預防效果C.藥物A,B對該疾病均有顯著的預防效果D.藥物A,B對該疾病均沒有預防效果答案B解析由題圖可得服用藥物A的患病比例少于服用藥物B的患病比例,而服用藥物A的未患病比例多于服用藥物B的未患病比例,所以藥物A的預防效果優(yōu)于藥物B的預防效果.故選B.5.(2022·廣西柳州高三摸底考試)隨著我國老齡化進程不斷加快,養(yǎng)老將會是未來每個人要面對的問題,而如何養(yǎng)老則是我國逐漸進入老齡化社會后,整個社會需要回答的問題.為了調(diào)查某地區(qū)老年人是否愿意參加個性化社區(qū)型醫(yī)養(yǎng)結合型養(yǎng)老機構,用簡單隨機抽樣方法從該地區(qū)調(diào)查了500位老人,結果如下:男女不愿意參加4030愿意參加160270(1)估計該地區(qū)老年人中,愿意參加個性化社區(qū)型醫(yī)養(yǎng)結合型養(yǎng)老機構的男性老年人的比例以及女性老年人的比例;(2)根據(jù)統(tǒng)計數(shù)據(jù)能有多大的把握認為該地區(qū)的老年人是否愿意參加個性化社區(qū)型醫(yī)養(yǎng)結合型養(yǎng)老機構與性別有關?請說明理由.參考公式:K2=eq\f(nad-bc2,a+bc+da+cb+d)參考數(shù)據(jù):P(K2≥k0)0.0500.0250.0100.0050.001k03.8415.0246.6357.87910.828解(1)由統(tǒng)計數(shù)據(jù)可知愿意參加個性化社區(qū)型醫(yī)養(yǎng)結合型養(yǎng)老機構的男性老年人人數(shù)為160,調(diào)查的男性老年人總人數(shù)為200,故愿意參加個性化社區(qū)型醫(yī)養(yǎng)結合型養(yǎng)老機構的男性老年人的比例為eq\f(160,200)=eq\f(4,5);由統(tǒng)計數(shù)據(jù)可知愿意參加個性化社區(qū)型醫(yī)養(yǎng)結合型養(yǎng)老機構的女性老年人人數(shù)為270,調(diào)查的女性老年人總人數(shù)為300,故愿意參加個性化社區(qū)型醫(yī)養(yǎng)結合型養(yǎng)老機構的女性老年人的比例為eq\f(270,300)=eq\f(9,10).(2)結合列聯(lián)表的數(shù)據(jù)計算K2=eq\f(500×40×270-30×1602,70×430×200×300)=eq\f(3000,301)≈9.967>7.879,所以有99.5%的把握認為該地區(qū)的老年人是否愿意參加個性化社區(qū)型醫(yī)養(yǎng)結合型養(yǎng)老機構與性別有關.

1.為了考察兩個變量x和y之間的線性相關性,甲、乙兩位同學各自獨立地做了100次和150次試驗,并且利用線性回歸方法,求得回歸直線分別為l1和l2,已知兩個人在試驗中發(fā)現(xiàn)變量x的觀測數(shù)據(jù)的平均值都是s,變量y的觀測數(shù)據(jù)的平均值都是t,那么下列說法正確的是()A.l1和l2有交點(s,t)B.l1與l2相關,但交點不一定是(s,t)C.l1與l2必定平行D.l1與l2必定重合答案A解析由題意知(s,t)是甲、乙兩位同學所做試驗的樣本點的中心,而線性回歸直線恒過樣本點的中心,故選A.2.某互聯(lián)網(wǎng)公司借助手機微信平臺推廣自己的產(chǎn)品,對今年前5個月的月微信推廣費用x與月利潤額y(單位:百萬元)進行了初步統(tǒng)計,得到下列表格中的數(shù)據(jù):x24568y304060p70經(jīng)計算,月微信推廣費用x與月利潤額y滿足線性回歸方程eq\o(y,\s\up10(^))=6.5x+17.5,則p的值為()A.50 B.56.5C.60 D.70答案A解析由于回歸直線過樣本中心點,eq\o(x,\s\up10(-))=5,eq\o(y,\s\up10(-))=eq\f(200+p,5),代入線性回歸方程得eq\f(200+p,5)=6.5×5+17.5,解得p=50.故選A.3.(2020·全國Ⅰ卷)某校一個課外學習小組為研究某作物種子的發(fā)芽率y和溫度x(單位:℃)的關系,在20個不同的溫度條件下進行種子發(fā)芽實驗,由實驗數(shù)據(jù)(xi,yi)(i=1,2,…,20)得到下面的散點圖:由此散點圖,在10℃至40℃之間,下面四個回歸方程類型中最適宜作為發(fā)芽率y和溫度x的回歸方程類型的是()A.y=a+bx B.y=a+bx2C.y=a+bex D.y=a+blnx答案D解析由散點圖可知,實驗數(shù)據(jù)分布在一個對數(shù)型函數(shù)圖象的附近,因此最適宜作為發(fā)芽率y和溫度x的回歸方程類型的是y=a+blnx.故選D.4.以下四個命題:①在回歸分析中,可用相關指數(shù)R2的值判斷模型的擬合效果,R2越大,模型的擬合效果越好;②回歸模型中殘差是實際值yi與估計值eq\o(y,\s\up10(^))的差,殘差點所在的帶狀區(qū)域寬度越窄,說明模型擬合精度越高;③在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點圖中,若所有樣本點(xi,yi)(i=1,2,…,n)都在直線y=-eq\f(1,2)x+1上,則這組樣本數(shù)據(jù)的線性相關系數(shù)為-eq\f(1,2);④對分類變量x與y的隨機變量K2的觀測值k來說,k越小,判斷“x與y有關系”的把握程度越大.其中真命題的個數(shù)為()A.1 B.2C.3 D.4答案B解析根據(jù)相關指數(shù)的意義可知①正確;由殘差的定義和殘差圖的繪制可以知道②正確;相關系數(shù)req\b\lc\(\rc\)(\a\vs4\al\co1(r=\f(\i\su(i=1,n,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\r(\i\su(i=1,n,)xi-\o(x,\s\up10(-))2\i\su(i=1,n,)yi-\o(y,\s\up10(-))2))))反映的是兩變量之間線性相關程度的強弱,與回歸直線斜率eq\o(b,\s\up10(^))=eq\f(\i\su(i=1,n,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\i\su(i=1,n,)xi-\o(x,\s\up10(-))2)無關,因為所有樣本點都在直線y=-eq\f(1,2)x+1上,所以樣本數(shù)據(jù)的線性相關系數(shù)為-1,故③錯誤;K2的觀測值k越小,x與y有關系的把握程度越小,故④錯誤.故選B.5.(2021·山西大同模擬)針對“中學生追星問題”,某校團委對“學生性別和中學生追星是否有關”作了一次調(diào)查,其中女生人數(shù)是男生人數(shù)的eq\f(1,2),男生追星的人數(shù)占男生人數(shù)的eq\f(1,6),女生追星的人數(shù)占女生人數(shù)的eq\f(2,3).若有95%的把握認為是否追星和性別有關,則男生至少有()A.11人 B.12人C.18人 D.24人附表及公式:K2=eq\f(nad-bc2,a+bc+da+cb+d),n=a+b+c+d.P(K2≥k0)0.0500.0250.0100.005k03.8415.0246.6357.879答案B解析設男生人數(shù)為x,依題意可得2×2列聯(lián)表如下:追星不追星總計男生eq\f(x,6)eq\f(5x,6)x女生eq\f(x,3)eq\f(x,6)eq\f(x,2)總計eq\f(x,2)xeq\f(3x,2)若有95%的把握認為是否追星和性別有關,則K2>3.841,即eq\f(\f(3x,2)\b\lc\(\rc\)(\a\vs4\al\co1(\f(x2,36)-\f(5x2,18)))2,x·\f(x,2)·\f(x,2)·x)=eq\f(3x,8)>3.841,則x>10.24,∵eq\f(x,2),eq\f(x,6)為整數(shù),∴若有95%的把握認為是否追星和性別有關,則男生至少有12人,故選B.6.高三年級267位學生參加期末考試,某班37位學生的語文成績、數(shù)學成績與總成績在全年級中的排名情況如圖所示,甲、乙、丙為該班三位學生.從這次考試成績看,(1)在甲、乙兩人中,其語文成績名次比其總成績名次靠前的學生是________;(2)在語文和數(shù)學兩個科目中,丙同學的成績名次更靠前的科目是________.答案(1)乙(2)數(shù)學解析(1)由圖分析,甲的語文成績名次比其總成績名次靠后,乙的語文成績名次比其總成績名次靠前,故填乙.(2)根據(jù)丙在兩個圖中對應的點的縱坐標,觀察易得,丙同學成績名次更靠前的科目是數(shù)學.7.某數(shù)學老師身高176cm,他爺爺、父親和兒子的身高分別是173cm、170cm和182cm.因兒子的身高與父親的身高有關,該老師用線性回歸分析的方法預測他孫子的身高約為________cm.eq\b\lc\(\rc\)(\a\vs4\al\co1(\o(b,\s\up10(^))=\f(\i\su(i=1,n,)xi-\o(x,\s\up10(-))yi-\o(y,\s\up10(-)),\i\su(i=1,n,)xi-\o(x,\s\up10(-))2),\o(a,\s\up10(^))=\o(y,\s\up10(-))-\o(b,\s\up10(^))\o(x,\s\up10(-))))答案185解析設父親身高為xcm,兒子身高為ycm,則x173170176y170176182eq\o(x,\s\up10(-))=173,eq\o(y,\s\up10(-))=176,eq\o(b,\s\up10(^))=eq\f(0×-6+-3×0+3×6,02+9+9)=1,eq\o(a,\s\up10(^))=eq\o(y,\s\up10(-))-eq\o(b,\s\up10(^))eq\o(x,\s\up10(-))=176-1×173=3,所以eq\o(y,\s\up10(^))=x+3,當x=182時,eq\o(y,\s\up10(^))=185.8.(2022·北京海淀模擬)如圖是某地區(qū)2004年至2020年環(huán)境基礎設施投資額y(單位:億元)的折線圖.為了預測該地區(qū)2022年的環(huán)境基礎設施投資額,建立了y與時間變量t的兩個線性回歸模型.根據(jù)2004年至2020年的數(shù)據(jù)(時間變量t的值依次為1,2,…,17)建立模型①:eq\o(y,\s\up10(^))=-30.4+13.5t;根據(jù)2014年至2020年的數(shù)據(jù)(時間變量t的值依次為1,2,…,7)建立模型②:eq\o(y,\s\up10(^))=99+17.5t.利用這兩個模型,該地區(qū)2022年的環(huán)境基礎設施投資額的預測值分別為________,________;并且可以判斷利用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論