




已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
11.3 變量間的相關(guān)關(guān)系與統(tǒng)計案例,高考文數(shù) (課標專用),考點一 變量間的相關(guān)關(guān)系,五年高考,A組 統(tǒng)一命題課標卷題組,1.(2018課標全國,18,12分)下圖是某地區(qū)2000年至2016年環(huán)境基礎(chǔ)設(shè)施投資額y(單位:億元) 的折線圖. 為了預(yù)測該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額,建立了y與時間變量t的兩個線性回歸模型.根 據(jù)2000年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,17)建立模型: =-30.4+13.5t;根據(jù) 2010年至2016年的數(shù)據(jù)(時間變量t的值依次為1,2,7)建立模型: =99+17.5t.,(1)分別利用這兩個模型,求該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值; (2)你認為用哪個模型得到的預(yù)測值更可靠?并說明理由.,解析 (1)利用模型,該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值為 =-30.4+13.519= 226.1(億元). 利用模型,該地區(qū)2018年的環(huán)境基礎(chǔ)設(shè)施投資額的預(yù)測值為 =99+17.59=256.5(億元). (2)利用模型得到的預(yù)測值更可靠. 理由如下: (i)從折線圖可以看出,2000年至2016年的數(shù)據(jù)對應(yīng)的點沒有隨機散布在直線y=-30.4+13.5t上 下,這說明利用2000年至2016年的數(shù)據(jù)建立的線性模型不能很好地描述環(huán)境基礎(chǔ)設(shè)施投資 額的變化趨勢.2010年相對2009年的環(huán)境基礎(chǔ)設(shè)施投資額有明顯增加,2010年至2016年的數(shù)據(jù) 對應(yīng)的點位于一條直線的附近,這說明從2010年開始環(huán)境基礎(chǔ)設(shè)施投資額的變化規(guī)律呈線性,方法總結(jié) 利用回歸直線方程進行預(yù)測是對總體的估計,此估計值不是準確值,把自變量代入 回歸直線方程即可對因變量進行估計,但需注意自變量的取值范圍.,2.(2017課標全國,19,12分)為了監(jiān)控某種零件的一條生產(chǎn)線的生產(chǎn)過程,檢驗員每隔30 min 從該生產(chǎn)線上隨機抽取一個零件,并測量其尺寸(單位:cm).下面是檢驗員在一天內(nèi)依次抽取的 16個零件的尺寸:,經(jīng)計算得 = xi=9.97,s= = 0.212, 18.439, (xi- )(i-8.5)=-2.78,其中xi為抽取的第i個零件的尺寸,i=1,2,16. (1)求(xi,i)(i=1,2,16)的相關(guān)系數(shù)r,并回答是否可以認為這一天生產(chǎn)的零件尺寸不隨生產(chǎn)過 程的進行而系統(tǒng)地變大或變小(若|r|0.25,則可以認為零件的尺寸不隨生產(chǎn)過程的進行而系統(tǒng) 地變大或變小); (2)一天內(nèi)抽檢零件中,如果出現(xiàn)了尺寸在( -3s, +3s)之外的零件,就認為這條生產(chǎn)線在這一天 的生產(chǎn)過程可能出現(xiàn)了異常情況,需對當天的生產(chǎn)過程進行檢查. (i)從這一天抽檢的結(jié)果看,是否需對當天的生產(chǎn)過程進行檢查? (ii)在( -3s, +3s)之外的數(shù)據(jù)稱為離群值,試剔除離群值,估計這條生產(chǎn)線當天生產(chǎn)的零件尺寸 的均值與標準差.(精確到0.01) 附:樣本(xi,yi)(i=1,2,n)的相關(guān)系數(shù),解析 (1)由樣本數(shù)據(jù)得(xi,i)(i=1,2,16)的相關(guān)系數(shù)為r= = -0.18. 由于|r|0.25,因此可以認為這一天生產(chǎn)的零件尺寸不隨生產(chǎn)過程的進行而系統(tǒng)地變大或變小. (2)(i)由于 =9.97,s0.212,由樣本數(shù)據(jù)可以看出抽取的第13個零件的尺寸在( -3s, +3s)以外, 因此需對當天的生產(chǎn)過程進行檢查. (ii)剔除離群值,即第13個數(shù)據(jù),剩下數(shù)據(jù)的平均數(shù)為 (169.97-9.22)=10.02, 這條生產(chǎn)線當天生產(chǎn)的零件尺寸的均值的估計值為10.02. =160.2122+169.9721 591.134, 剔除第13個數(shù)據(jù),剩下數(shù)據(jù)的樣本方差為 (1 591.134-9.222-1510.022)0.008, 這條生產(chǎn)線當天生產(chǎn)的零件尺寸的標準差的估計值為 0.09.,方法總結(jié) 樣本的數(shù)字特征. (1)樣本數(shù)據(jù)的相關(guān)系數(shù)r, r= 反映樣本數(shù)據(jù)的相關(guān)程度,|r|越大,則相關(guān)性越強. (2)樣本數(shù)據(jù)的均值反映樣本數(shù)據(jù)的平均水平;樣本數(shù)據(jù)的方差反映樣本數(shù)據(jù)的穩(wěn)定性,方差越 小,數(shù)據(jù)越穩(wěn)定;樣本數(shù)據(jù)的標準差為方差的算術(shù)平方根.,3.(2015課標,19,12分)某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單 位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響.對近8年的年宣傳費xi和年銷售量yi (i=1,2,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值.,表中wi= , = wi. (1)根據(jù)散點圖判斷,y=a+bx與y=c+d 哪一個適宜作為年銷售量y關(guān)于年宣傳費x的回歸方程 類型?(給出判斷即可,不必說明理由) (2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程; (3)已知這種產(chǎn)品的年利潤z與x,y的關(guān)系為z=0.2y-x.根據(jù)(2)的結(jié)果回答下列問題: (i)年宣傳費x=49時,年銷售量及年利潤的預(yù)報值是多少? (ii)年宣傳費x為何值時,年利潤的預(yù)報值最大? 附:對于一組數(shù)據(jù)(u1,v1),(u2,v2),(un,vn),其回歸直線v=+u的斜率和截距的最小二乘估計分別 為 = , = - .,考點二 獨立性檢驗 1.(2019課標全國,17,12分)某商場為提高服務(wù)質(zhì)量,隨機調(diào)查了50名男顧客和50名女顧客,每 位顧客對該商場的服務(wù)給出滿意或不滿意的評價,得到下面列聯(lián)表:,(1)分別估計男、女顧客對該商場服務(wù)滿意的概率; (2)能否有95%的把握認為男、女顧客對該商場服務(wù)的評價有差異? 附:K2= .,解析 本題通過對概率與頻率的關(guān)系、統(tǒng)計案例中兩變量相關(guān)性檢驗考查學生的抽象概括 能力與數(shù)據(jù)處理能力,重點考查數(shù)學抽象、數(shù)據(jù)分析、數(shù)學運算的核心素養(yǎng);倡導(dǎo)學生關(guān)注生 活,提高數(shù)學應(yīng)用意識. (1)由調(diào)查數(shù)據(jù),男顧客中對該商場服務(wù)滿意的比率為 =0.8,因此男顧客對該商場服務(wù)滿意的 概率的估計值為0.8. 女顧客中對該商場服務(wù)滿意的比率為 =0.6,因此女顧客對該商場服務(wù)滿意的概率的估計值 為0.6. (2)K2= 4.762. 由于4.7623.841,故有95%的把握認為男、女顧客對該商場服務(wù)的評價有差異.,思路分析 (1)計算頻率,通過頻率估計概率.(2)將數(shù)據(jù)代入公式計算K2,與附表中的k比較大小, 作出判斷.,2.(2018課標全國,18,12分)某工廠為提高生產(chǎn)效率,開展技術(shù)創(chuàng)新活動,提出了完成某項生產(chǎn) 任務(wù)的兩種新的生產(chǎn)方式.為比較兩種生產(chǎn)方式的效率,選取40名工人,將他們隨機分成兩組, 每組20人.第一組工人用第一種生產(chǎn)方式,第二組工人用第二種生產(chǎn)方式.根據(jù)工人完成生產(chǎn)任 務(wù)的工作時間(單位:min)繪制了如下莖葉圖: (1)根據(jù)莖葉圖判斷哪種生產(chǎn)方式的效率更高,并說明理由; (2)求40名工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)m,并將完成生產(chǎn)任務(wù)所需時間超過m和不超過 m的工人數(shù)填入下面的列聯(lián)表;,(3)根據(jù)(2)中的列聯(lián)表,能否有99%的把握認為兩種生產(chǎn)方式的效率有差異? 附:K2= , .,解析 (1)第二種生產(chǎn)方式的效率更高. 理由如下: (i)由莖葉圖可知:用第一種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務(wù)所需時間至少80分 鐘,用第二種生產(chǎn)方式的工人中,有75%的工人完成生產(chǎn)任務(wù)所需時間至多79分鐘.因此第二種 生產(chǎn)方式的效率更高. (ii)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)為85.5分鐘,用第 二種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)所需時間的中位數(shù)為73.5分鐘.因此第二種生產(chǎn)方式的效 率更高. (iii)由莖葉圖可知:用第一種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)平均所需時間高于80分鐘;用第二 種生產(chǎn)方式的工人完成生產(chǎn)任務(wù)平均所需時間低于80分鐘.因此第二種生產(chǎn)方式的效率更高.,(3)由于 K2= =106.635,所以有99%的把握認為兩種生產(chǎn)方式的效率有差異.,思路分析 (1)根據(jù)莖葉圖中的數(shù)據(jù)大致集中在哪個莖,作出判斷; (2)通過莖葉圖確定數(shù)據(jù)的中位數(shù),按要求完成22列聯(lián)表; (3)根據(jù)(2)中22列聯(lián)表,將有關(guān)數(shù)據(jù)代入公式計算得K2的值,借助臨界值表作出統(tǒng)計推斷.,方法總結(jié) 解決此類問題的步驟: (1)審清題意:弄清題意,理順條件和結(jié)論; (2)找數(shù)量關(guān)系:把圖形語言轉(zhuǎn)化為數(shù)字,找關(guān)鍵數(shù)量關(guān)系; (3)建立解決方案:找準公式,將22列聯(lián)表中的數(shù)值代入公式計算; (4)作出結(jié)論:依據(jù)數(shù)據(jù),借助臨界值表作出正確判斷.,解后反思 獨立性檢驗問題的常見類型及解題策略: (1)已知分類變量的數(shù)據(jù),判斷兩個分類變量的相關(guān)性,可依據(jù)數(shù)據(jù)及公式計算K2,然后作出判 斷; (2)獨立性檢驗與概率統(tǒng)計的綜合問題,關(guān)鍵是根據(jù)獨立性檢驗的一般步驟,作出判斷,再根據(jù) 概率統(tǒng)計的相關(guān)知識求解.,3.(2017課標全國,19,12分)海水養(yǎng)殖場進行某水產(chǎn)品的新、舊網(wǎng)箱養(yǎng)殖方法的產(chǎn)量對比,收 獲時各隨機抽取了100個網(wǎng)箱,測量各箱水產(chǎn)品的產(chǎn)量(單位:kg),其頻率分布直方圖如下:,(1)記A表示事件“舊養(yǎng)殖法的箱產(chǎn)量低于50 kg”,估計A的概率; (2)填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān);,(3)根據(jù)箱產(chǎn)量的頻率分布直方圖,對這兩種養(yǎng)殖方法的優(yōu)劣進行比較. 附: , K2= .,解析 (1)舊養(yǎng)殖法的箱產(chǎn)量低于50 kg的頻率為 (0.012+0.014+0.024+0.034+0.040)5=0.62. 因此,事件A的概率估計值為0.62. (2)根據(jù)箱產(chǎn)量的頻率分布直方圖得列聯(lián)表:,K2= 15.705. 由于15.7056.635,故有99%的把握認為箱產(chǎn)量與養(yǎng)殖方法有關(guān). (3)箱產(chǎn)量的頻率分布直方圖表明:新養(yǎng)殖法的箱產(chǎn)量平均值(或中位數(shù))在50 kg到55 kg之間, 舊養(yǎng)殖法的箱產(chǎn)量平均值(或中位數(shù))在45 kg到50 kg之間,且新養(yǎng)殖法的箱產(chǎn)量分布集中程度 較舊養(yǎng)殖法的箱產(chǎn)量分布集中程度高,因此,可以認為新養(yǎng)殖法的箱產(chǎn)量較高且穩(wěn)定,從而新養(yǎng) 殖法優(yōu)于舊養(yǎng)殖法.,解后反思 解獨立性檢驗問題的關(guān)注點: (1)兩個明確:明確兩類主體;明確研究的兩個問題. (2)兩個關(guān)鍵:準確畫出22列聯(lián)表;準確求解K2.,B組 自主命題省(區(qū)、市)卷題組,1.(2015湖北,4,5分)已知變量x和y滿足關(guān)系y=-0.1x+1,變量y與z正相關(guān).下列結(jié)論中正確的是 ( ) A.x與y正相關(guān),x與z負相關(guān) B.x與y正相關(guān),x與z正相關(guān) C.x與y負相關(guān),x與z負相關(guān) D.x與y負相關(guān),x與z正相關(guān),答案 C 由y=-0.1x+1,知x與y負相關(guān), 即y隨x的增大而減小, 又y與z正相關(guān), 所以z隨y的增大而增大,減小而減小, 所以z隨x的增大而減小,x與z負相關(guān),故選C.,2.(2015福建,4,5分)為了解某社區(qū)居民的家庭年收入與年支出的關(guān)系,隨機調(diào)查了該社區(qū)5戶家 庭,得到如下統(tǒng)計數(shù)據(jù)表:,根據(jù)上表可得回歸直線方程 = x+ ,其中 =0.76, = - . 據(jù)此估計,該社區(qū)一戶年收入為15萬元家庭的年支出為 ( ) A.11.4萬元 B.11.8萬元 C.12.0萬元 D.12.2萬元,答案 B 由統(tǒng)計數(shù)據(jù)表可得 = =10.0, = =8.0, 則 =8.0-0.7610.0=0.4, 所以回歸直線方程為 =0.76x+0.4, 當x=15時, =0.7615+0.4=11.8, 故估計年收入為15萬元家庭的年支出為11.8萬元.故選B.,3.(2015重慶,17,13分)隨著我國經(jīng)濟的發(fā)展,居民的儲蓄存款逐年增長.設(shè)某地區(qū)城鄉(xiāng)居民人民 幣儲蓄存款(年底余額)如下表:,(1)求y關(guān)于t的回歸方程 = t+ ; (2)用所求回歸方程預(yù)測該地區(qū)2015年(t=6)的人民幣儲蓄存款. 附:回歸方程 = t+ 中, = = - .,解析 (1)列表計算如下:,這里n=5, = ti= =3, = yi= =7.2. 又ltt= -n =55-532=10,lty= tiyi-n =120-537.2=12, 從而 = = =1.2, = - =7.2-1.23=3.6, 故所求回歸方程為 =1.2t+3.6. (2)將t=6代入回歸方程可預(yù)測該地區(qū)2015年的人民幣儲蓄存款為 =1.26+3.6=10.8(千億元).,C組 教師專用題組 考點一 變量間的相關(guān)關(guān)系,1.(2012課標全國,3,5分)在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散點 圖中,若所有樣本點(xi,yi)(i=1,2,n)都在直線y= x+1上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為 ( ) A.-1 B.0 C. D.1,答案 D 所有點均在直線上,則樣本相關(guān)系數(shù)最大即為1,故選D.,2.(2014課標,19,12分)某地區(qū)2007年至2013年農(nóng)村居民家庭人均純收入y(單位:千元)的數(shù)據(jù) 如下表:,(1)求y關(guān)于t的線性回歸方程; (2)利用(1)中的回歸方程,分析2007年至2013年該地區(qū)農(nóng)村居民家庭人均純收入的變化情況, 并預(yù)測該地區(qū)2015年農(nóng)村居民家庭人均純收入. 附:回歸直線的斜率和截距的最小二乘估計公式分別為: = , = - .,解析 (1)由所給數(shù)據(jù)計算得 = (1+2+3+4+5+6+7)=4, = (2.9+3.3+3.6+4.4+4.8+5.2+5.9)=4.3, (ti- )2=9+4+1+0+1+4+9=28, (ti- )(yi- )=(-3)(-1.4)+(-2)(-1)+(-1)(-0.7)+00.1+10.5+20.9+31.6=14, = = =0.5, = - =4.3-0.54=2.3,所求回歸方程為 =0.5t+2.3. (2)由(1)知, =0.50,故2007年至2013年該地區(qū)農(nóng)村居民家庭人均純收入逐年增加,平均每年增 加0.5千元. 將2015年的年份代號t=9代入(1)中的回歸方程,得 =0.59+2.3=6.8, 故預(yù)測該地區(qū)2015年農(nóng)村居民家庭人均純收入為6.8千元.,考點二 獨立性檢驗 1.(2014安徽,17,12分)某高校共有學生15 000人,其中男生10 500人,女生4 500人.為調(diào)查該校學 生每周平均體育運動時間的情況,采用分層抽樣的方法,收集300位學生每周平均體育運動時 間的樣本數(shù)據(jù)(單位:小時). (1)應(yīng)收集多少位女生的樣本數(shù)據(jù)? (2)根據(jù)這300個樣本數(shù)據(jù),得到學生每周平均體育運動時間的頻率分布直方圖(如圖所示),其 中樣本數(shù)據(jù)的分組區(qū)間為:0,2,(2,4,(4,6,(6,8,(8,10,(10,12.估計該校學生每周平均體育運動 時間超過4小時的概率; (3)在樣本數(shù)據(jù)中,有60位女生的每周平均體育運動時間超過4小時,請完成每周平均體育運動 時間與性別列聯(lián)表,并判斷是否有95%的把握認為“該校學生的每周平均體育運動時間與性 別有關(guān)”. 附:K2=,解析 (1)300 =90,所以應(yīng)收集90位女生的樣本數(shù)據(jù). (2)由頻率分布直方圖得1-2(0.100+0.025)=0.75, 所以該校學生每周平均體育運動時間超過4小時的概率的估計值為0.75. (3)由(2)知,300位學生中有3000.75=225人的每周平均體育運動時間超過4小時,75人的每周平 均體育運動時間不超過4小時. 又因為樣本數(shù)據(jù)中有210份是關(guān)于男生的,90份是關(guān)于女生的, 所以每周平均體育運動時間與性別列聯(lián)表如下: 每周平均體育運動時間與性別列聯(lián)表,結(jié)合列聯(lián)表可算得K2= = 4.7623.841. 所以,有95%的把握認為“該校學生的每周平均體育運動時間與性別有關(guān)”.,2.(2010課標,19,12分)為調(diào)查某地區(qū)老年人是否需要志愿者提供幫助,用簡單隨機抽樣方法從 該地區(qū)調(diào)查了500位老年人,結(jié)果如下:,(1)估計該地區(qū)老年人中,需要志愿者提供幫助的老年人的比例; (2)能否有99%的把握認為該地區(qū)的老年人是否需要志愿者提供幫助與性別有關(guān)? (3)根據(jù)()的結(jié)論,能否提出更好的調(diào)查方法來估計該地區(qū)的老年人中,需要志愿者提供幫助 的老年人的比例? 說明理由. 附:,K2=,解析 (1)調(diào)查的500位老年人中有70位需要志愿者提供幫助,因此該地區(qū)老年人中,需要幫助的老年 人的比例的估計值為 =14%. (2)K2= 9.967. 由于9.9676.635, 所以有99%的把握認為該地區(qū)的老年人是否需要幫助與性別有關(guān). (3)由(2)的結(jié)論知,該地區(qū)老年人是否需要幫助與性別有關(guān),并且從樣本數(shù)據(jù)能看出該地區(qū)男 性老年人與女性老年人中需要幫助的比例有明顯差異,因此在調(diào)查時,先確定該地區(qū)老年人中 男、女的比例,再把老年人分成男、女兩層并采用分層抽樣方法比采用簡單隨機抽樣方法更 好.,評析 本題考查分層抽樣和獨立性檢驗,考查統(tǒng)計思想和運算求解能力、應(yīng)用意識,分類與整 合思想.,考點一 變量間的相關(guān)關(guān)系,三年模擬,A組 20172019年高考模擬考點基礎(chǔ)題組,1.(2019安徽馬鞍山二模,4)在一組樣本數(shù)據(jù)(x1,y1)、(x2,y2)、(xn,yn)(n2,x1、x2、xn互 不相等)的散點圖中,若所有樣本點(xi,yi)(i=1,2,n)都在直線y=-2x+100上,則這組樣本數(shù)據(jù)的 樣本相關(guān)系數(shù)為 ( ) A.-1 B.0 C. D.1,答案 A 因為所有樣本點(xi,yi)(i=1,2,n)都在直線y=-2x+100上,所以這組樣本數(shù)據(jù)呈負相 關(guān),且相關(guān)系數(shù)為-1.故選A.,2.(2019廣東深圳一模,4)已知某產(chǎn)品的銷售額y(萬元)與廣告費用x(萬元)之間的關(guān)系如下表:,若求得其線性回歸方程為 =6.5x+ ,則預(yù)計當廣告費用為6萬元時的銷售額為 ( ) A.42萬元 B.45萬元 C.48萬元 D.51萬元,答案 C 由題意得 = =2, = =22, =6.5x+ , =22-6.52=9,則 =6.5x+9, 當x=6時, =6.56+9=48.故選C.,3.(2018湖南張家界三模,4)已知變量x,y之間的線性回歸方程為 =-0.7x+10.3,且變量x,y之間的 一組相關(guān)數(shù)據(jù)如下表所示,則下列說法錯誤的是 ( ),A.變量x,y之間呈負相關(guān)關(guān)系 B.可以預(yù)測,當x=20時, =-3.7 C.m=4 D.該回歸直線必過點(9,4),答案 C 由-0.70,得變量x,y之間呈負相關(guān)關(guān)系,故A正確;當x=20時, =-0.720+10.3=-3.7,故 B正確; 由題中表格數(shù)據(jù)可知 = (6+8+10+12)=9, = (6+m+3+2)= ,則 =-0.79+10.3, 解得m=5,故C錯; 由m=5,得 = =4,所以該回歸直線必過點(9,4),故D正確.故選C.,4.(2017湖南益陽調(diào)研,4)某公司20102015年的年利潤x(單位:百萬元)與年支出y(單位:百萬元) 的統(tǒng)計資料如下表所示:,根據(jù)統(tǒng)計資料,得 ( ) A.利潤中位數(shù)是16,x與y有正線性相關(guān)關(guān)系 B.利潤中位數(shù)是17,x與y有正線性相關(guān)關(guān)系 C.利潤中位數(shù)是17,x與y有負線性相關(guān)關(guān)系 D.利潤中位數(shù)是18,x與y有負線性相關(guān)關(guān)系,答案 B 利潤的6個數(shù)的中間兩個數(shù)為16,18,平均數(shù)為17,故利潤的中位數(shù)為17.因為x增加 時,y也增加,因此x與y正相關(guān).故選B.,5.(2018河北石家莊二中三模,13)如圖是具有相關(guān)關(guān)系的兩個變量的一組數(shù)據(jù)的散點圖和回歸 直線,若去掉一個點使得余下的5個點所對應(yīng)的數(shù)據(jù)的相關(guān)系數(shù)最大,則應(yīng)當去掉的點是 .,答案 E,解析 由于點越靠近回歸直線,相關(guān)性越強,相關(guān)系數(shù)越大,又由于點E到回歸直線的距離最大, 所以要去掉點E.,考點二 獨立性檢驗 1.(2019廣東湛江高考測試(二),5)有人認為在機動車駕駛技術(shù)上,男性優(yōu)于女性.這是真的嗎?某 社會調(diào)查機構(gòu)與交警合作隨機統(tǒng)計了經(jīng)常開車的100名駕駛員最近三個月內(nèi)是否有交通事故 或交通違法事件發(fā)生,得到下面的列聯(lián)表:,附:K2=,據(jù)此表,可得 ( ) A.認為機動車駕駛技術(shù)與性別有關(guān)的可靠性不足50% B.認為機動車駕駛技術(shù)與性別有關(guān)的可靠性超過50% C.認為機動車駕駛技術(shù)與性別有關(guān)的可靠性不足60% D.認為機動車駕駛技術(shù)與性別有關(guān)的可靠性超過60%,答案 A 由題表中數(shù)據(jù),計算得K2= 0.336 70.455, 認為機動車駕駛技術(shù)與性別有關(guān)的可靠性不足50%. 故選A.,解題關(guān)鍵 本題考查獨立性檢驗的應(yīng)用,關(guān)鍵是理解獨立性檢驗的思路.,2.(2017湖南邵陽二模,3)假設(shè)有兩個分類變量X和Y的22列聯(lián)表如下:,對同一樣本,以下數(shù)據(jù)能說明X與Y有關(guān)系的可能性最大的一組為 ( ) A.a=45,c=15 B.a=40,c=20 C.a=35,c=25 D.a=30,c=30,答案 A 根據(jù)22列聯(lián)表與獨立性檢驗可知, 當|30a-10c|越大時,X與Y有關(guān)系的可能性越大, 故選A.,3.(2018全國統(tǒng)一考試第二次調(diào)研,5)某科研機構(gòu)為了研究中年人禿頭是否與患有心臟病有關(guān), 隨機調(diào)查了一些中年人的情況,具體數(shù)據(jù)如下表所示:,根據(jù)表中數(shù)據(jù)得K2= 15.968,由K210.828,斷定禿頭與患有心臟病有關(guān), 那么這種判斷出錯的可能性為 ( ) 附表:,A.0.1 B.0.05 C.0.01 D.0.001,答案 D 由于K210.828,所以根據(jù)附表可得斷定禿頭與患有心臟病有關(guān)出錯的可能性為0.001,故選D.,4.(2017安徽皖南一模,4)下列說法錯誤的是 ( ) A.回歸直線過樣本點的中心( , ) B.兩個隨機變量的線性相關(guān)性越強,則相關(guān)系數(shù)的絕對值就越接近1 C.在回歸直線方程 =0.2x+0.8中,當解釋變量x每增加1個單位時,預(yù)報變量 平均增加0.2個單 位 D.對分類變量X與Y,隨機變量K2的觀測值k越大,則判斷“X與Y有關(guān)系”的把握程度越小,答案 D A.回歸直線過樣本點的中心( , ),正確; B.兩個隨機變量相關(guān)性越強,則相關(guān)系數(shù)的絕對值越接近1,正確; C.在回歸直線方程 =0.2x+0.8中, 當解釋變量x每增加1個單位時,預(yù)報量平均增加0.2個單位,正確; D.對分類變量X與Y的隨機變量K2的觀測值k來說,k越大,“X與Y有關(guān)系”的把握程度越大,因 此不正確.故選D.,B組 20172019年高考模擬專題綜合題組 (時間:45分鐘 分值:75分) 一、選擇題(每題5分,共15分),1.(2019湖北七市(州)教科研協(xié)作體3月模擬,3)為了規(guī)定工時定額,需要確定加工零件所花費的 時間,為此進行了5次試驗,得到5組數(shù)據(jù):(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5),根據(jù)收集到的數(shù)據(jù)可知 x1+x2+x3+x4+x5=100,由最小二乘法求得回歸直線方程為 =0.67x+54.8,則y1+y2+y3+y4+y5的值為 ( ) A.68.2 B.341 C.355 D.366.2,答案 B 依題意可得 = =20,由樣本點的中心( , )在回歸直線 =0.67x+54.8上可得 = 0.6720+54.8=68.2,故y1+y2+y3+y4+y5=5 =568.2=341,故選B.,2.(2019湖北恩施2月教學質(zhì)量檢測,6)下列說法中正確的個數(shù)是( ) 相關(guān)系數(shù)r用來衡量兩個變量之間線性關(guān)系的強弱,|r|越接近于1,相關(guān)性越弱; 回歸直線 = x+ 過樣本點的中心( , ); 相關(guān)指數(shù)R2用來刻畫回歸的效果,R2越小,說明模型的擬合效果越不好. A.0 B.1 C.2 D.3,答案 C 相關(guān)系數(shù)r是衡量兩個變量之間線性關(guān)系強弱的量,|r|越接近于1,這兩個變量的線 性相關(guān)關(guān)系越強,|r|越接近于0,線性相關(guān)關(guān)系越弱,故錯誤; 回歸直線 = x+ 過樣本點的中心( , ),故正確; 用相關(guān)指數(shù)R2來刻畫回歸的效果,R2越大,說明模型的擬合效果越好;R2越小,說明模型的擬合 效果越不好,故正確. 綜上,說法中正確的個數(shù)是2.故選C.,3.(2018江西南昌一模,10)已知具有線性相關(guān)的五個樣本點A1(0,0),A2(2,2),A3(3,2),A4(4,2),A5(6, 4),用最小二乘法得到回歸直線方程l1: = x+ ,過點A1,A2的直線方程l2:y=mx+n,那么下列四個 命題中, m , n;直線l1過點A3; (yi- xi- )2 (yi-mxi-n)2; |yi- xi- | |yi-mxi-n|. 參考公式: = 正確的命題有 ( ) A.1個 B.2個 C.3個 D.4個,答案 B 由所給的數(shù)據(jù)計算可得 =3, =2,回歸直線方程為 =0.6x+0.2, 過點A1,A2的直線方程為y=x. 所以m , n,正確; 直線l1過點A3,正確; (yi- xi- )2=0.8, (yi-mxi-n)2=9,錯誤; |yi- xi- |=1.6, |yi-mxi-n|=5,錯誤. 綜上可得,正確的命題有2個. 選B.,4.(2019湖南郴州第三次質(zhì)量檢測,18)某市環(huán)保部門對該市市民進行了一次垃圾分類知識的網(wǎng) 絡(luò)問卷調(diào)查,每位市民僅有一次參加機會,通過隨機抽樣,得到參與問卷調(diào)查的100人的得分(滿 分:100分)數(shù)據(jù),統(tǒng)計結(jié)果如下表所示.,(1)若規(guī)定問卷得分不低于70分的市民稱為“環(huán)保關(guān)注者”,請完成下面的22列聯(lián)表,并判斷 能否在犯錯誤概率不超過0.05的前提下,認為是不是“環(huán)保關(guān)注者”與性別有關(guān);,(2)若問卷得分不低于80分的人稱為“環(huán)保達人”.現(xiàn)在從本次調(diào)查的“環(huán)保達人”中利用分 層抽樣的方法隨機抽取5名市民參與環(huán)保知識問答,再從這5名市民中抽取2人參與座談會,求 抽取的2名市民中,既有男“環(huán)保達人”又有女“環(huán)保達人”的概率. 附表及公式:K2= ,n=a+b+c+d,解析 (1)22列聯(lián)表如下:,將22列聯(lián)表中的數(shù)據(jù)代入公式計算得 K2= 3.033.841, 所以在犯錯誤的概率不超過0.05的前提下,不能認為是不是“環(huán)保關(guān)注者”與性別有關(guān). (2)由題可知,利用分層抽樣的方法抽得男“環(huán)保達人”3人,女“環(huán)保達人”2人. 設(shè)3個男“環(huán)保達人”分別為A,B,C;2個女“環(huán)保達人”分別為D,E. 從中抽取2人的所有情況為(AB),(AC),(AD),(AE),(BC),(BD),(BE),(CD),(CE),(DE),共10種情況. 既有男“環(huán)保達人”又有“女環(huán)保達人”的情況有(AD),(AE),(BD),(BE),(CD),(CE),共6種情 況. 故所求概率P= = .,5.(2019廣東深圳第二次調(diào)研,18)某網(wǎng)店經(jīng)銷某商品,為了解該商品的月銷量y(單位:千件)與當 月售價x(單位:元/件)之間的關(guān)系,收集了5組數(shù)據(jù)進行了初步處理,得到如下表:,(1)統(tǒng)計學中用相關(guān)系數(shù)r來衡量兩個變量之間線性相關(guān)關(guān)系的強弱,若|r|0.75,1,則認為相 關(guān)性很強;若|r|0.3,0.75),則認為相關(guān)性一般;若|r|0,0.25,則認為相關(guān)性較弱.請計算相關(guān) 系數(shù)r,并說明y與x之間的線性相關(guān)關(guān)系的強弱(精確到0.01); (2)求y關(guān)于x的線性回歸方程; (3)根據(jù)(2)中的線性回歸方程,估計當售價x定為多少時,月銷售金額最大?(月銷售金額=月銷售 量當月售價) 附注: 參考數(shù)據(jù): 12.85.參考公式:相關(guān)系數(shù)r= ,線性回歸方程 = x+ 中, = , = - x.,6.(2019安徽黃山第二次質(zhì)量檢測,19)2019年全國“兩會”,即中華人民共和國第十三屆全國 人大二次會議和中國人民政治協(xié)商會議第十三屆全國委員會第二次會議,分別于2019年3月5 日和3月3日在北京召開.為了了解哪些人更關(guān)注“兩會”,某機構(gòu)隨機抽取了年齡在1575歲 之間的200人進行調(diào)查,并按年齡繪制的頻率分布直方圖如圖所示,把年齡落在區(qū)間15,35)和 35,75內(nèi)的人分別稱為“青少年人”和“中老年人”.經(jīng)統(tǒng)計“青少年人”和“中老年人”的 人數(shù)之比為1921.其中“青少年人”中有40人關(guān)注“兩會”,“中老年人”中關(guān)注“兩會” 和不關(guān)注“兩會”的人數(shù)之比是21.,(1)求圖中a,b的值; (2)現(xiàn)采用分層抽樣的方法在25,35)和45,55)中隨機抽取8名代表,從8人中任選2人,求2人中至 少有1個是“中老年人”的概率; (3)根據(jù)已知條件,完成下面的22列聯(lián)表,并根據(jù)此統(tǒng)計結(jié)果判斷:能否有99.9%的把握認為 “中老年人”比“青少年人”更加關(guān)注“兩會”.,解析 (1)由題意得 解得 (2分) (2)由題意得在25,35)中抽取6人,記為A,B,C,D,E,F,在45,55)中抽取2人,記為1,2. 則從8人中任取2人的全部基本事件(共28種)列舉如下: AB,AC,AD,AE,AF,A1,A2,BC,BD,BE,BF,B1,B2,CD,CE,CF,C1,C2,DE,DF,D1,D2,EF,E1,E2,F1,F2, 12, (4分) 記2人中至少有1個是“中老年人”為事件A,則P(A)= . (6分) (3)22列聯(lián)表如下: (8分),K2= 12.15710.828, (10分) 所以有99.9%的把握認為“中老年人”比“青少年人”更加關(guān)注“兩會”. (12分),7.(2019湖南百所重點名校大聯(lián)考,19)近期,某公交公司分別推出支付寶和微信掃碼支付乘車 活動,活動設(shè)置了一段時間的推廣期,由于推廣期內(nèi)優(yōu)惠力度較大,吸引越來越多的人開始使用 掃碼支付.某線路公交車隊統(tǒng)計了活動剛推出一周內(nèi)每一天使用掃碼支付的人次,用x表示活 動推出的天數(shù),y(十人次)表示每天使用掃碼支付的人次(單位:十人次),統(tǒng)計數(shù)據(jù)如下表所示:,根據(jù)以上數(shù)據(jù),繪制了如圖所示的散點圖. (1)根據(jù)散點圖判斷,在推廣期內(nèi),y=a+bx與y=cdx(c,d均為大于零的常數(shù))哪一個適宜作為掃碼 支付的人次y關(guān)于活動推出天數(shù)x的回歸方程類型?(說明理由) (2)根據(jù)(1)的判斷結(jié)果及表中的數(shù)據(jù),求y關(guān)于x的回歸方程,并預(yù)測活動推出第8天使用掃碼支 付的人次. 參考數(shù)據(jù):,其中vi=lg yi, = vi. 參考公式: 對于一組數(shù)據(jù)(u1,v1),(u2,v2),(un,vn),其回歸直線 = + u的斜率和截距的最小二乘估計公式分 別為: = , = - .,解析 (1)根據(jù)散點圖判斷,y=cdx適宜作為掃碼支付的人次y關(guān)于活動推出天數(shù)x的回歸方程類 型(理由略.合理即可). (4分) (2)將y=cdx兩邊同時取常用對數(shù)得lg y=lg(cdx)=lg c+lg dx. 設(shè)lg y=v,v=lg c+lg dx. (5分) =4, =1.54, =140, lg d= = = =0.25, (7分) 把樣本點的中心(4,1.54)代入v=lg c+lg dx,得lg c=0.54, =0.54+0.25x,lg y=0.54+0.25x, (9分) y關(guān)于x的回歸方程為 =100.54+0.25x=100.54(100.25)x=3.47100.25x, 把x=8代入得, =3.47102=347, (11分) 故活動推出第8天使用掃碼支付的人次為3 470. (12分),8.(2019河南名校聯(lián)盟尖子生第六次聯(lián)合調(diào)研,19)隨著智能手機的普及,手機計步軟件迅速流 行開來,這類軟件能自動記載每個人每日健步的步數(shù),從而為科學健身提供一定的幫助.某市工 會為了解該市市民每日健步走的情況,從本市市民中隨機抽取了2 000名市民(其中不超過40 歲的市民恰好有1 000名),利用手機計步軟件統(tǒng)計了他們某天健步的步數(shù),并將樣本數(shù)據(jù)分為 3,5),5,7),7,9),9,11),11,13),13,15),15,17),17,19),19,21九組(單位:千步),將抽取的不超過4 0歲的市民的樣本數(shù)據(jù)繪制成頻率分布直方圖如圖,將40歲以上的市民的樣本數(shù)據(jù)繪制成頻數(shù) 分布表如下,并利用該樣本的頻率分布估計總體的概率分布.,(1)現(xiàn)規(guī)定,日健步步數(shù)不低于13 000步的為“健步達人”,填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷 能否有99.9%的把握認為是不是“健步達人”與年齡有關(guān);,(2)利用樣本平均數(shù)和中位數(shù)估計該
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度浙江省二級造價工程師之建設(shè)工程造價管理基礎(chǔ)知識通關(guān)試題庫(有答案)
- 心理健康疏導(dǎo)課件
- 腫瘤標志物的臨床意義
- 正常孩子的日常護理
- 校園防火安全教育
- 高考物理核心考點考前沖刺 勻變速直線運動位移與時間的關(guān)系(含解析)
- 幼兒園小班數(shù)學《小幫手》課件
- 幼兒園小班美術(shù)教案《花被子》
- 消防急救技能培訓(xùn)
- 中班活動:尋找春天的秘密
- 2025山西汾西礦業(yè)集團公司招聘300人易考易錯模擬試題(共500題)試卷后附參考答案
- GB/T 16895.3-2024低壓電氣裝置第5-54部分:電氣設(shè)備的選擇和安裝接地配置和保護導(dǎo)體
- 2025年法院書記員招聘考試題庫(含各題型)
- 2025山西焦煤集團公司招聘高頻重點提升(共500題)附帶答案詳解
- 《民用無人機作業(yè)氣象條件等級 植保》編制說明
- 中藥灌腸法治療腎衰
- 人教版(2024)英語七年級上冊單詞表
- 客戶拓展推介-化學品儲存方案
- ISO27001-2013信息安全管理體系要求
- 安裝門窗承包勞務(wù)合同模板
- 220kV升壓站調(diào)試施工方案
評論
0/150
提交評論