




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第27講統(tǒng)計(jì)案例和回歸方程【知識點(diǎn)總結(jié)】一、線性回歸線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個(gè)變量之間的關(guān)系(相關(guān)關(guān)系)的方法。對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其回歸方程的求法為其中,,,(,)稱為樣本點(diǎn)的中心。步驟:畫散點(diǎn)圖,如散點(diǎn)圖中的點(diǎn)基本分布在一條直線附近,則這條直線叫這兩個(gè)變量的回歸直線,直線斜率k>0,稱兩個(gè)變量正相關(guān);k<0,稱兩個(gè)變量負(fù)相關(guān)。二、獨(dú)立性獨(dú)立性檢驗(yàn)是判斷兩個(gè)分類變量是否存在相關(guān)關(guān)系的案例分析方法。步驟為列出22列聯(lián)表(如表13-8所示),求出,并判斷:A1A2合計(jì)B1aca+cB2bdb+d合計(jì)a+bc+dn=a+b+c+d若K2>10.828,有99.9%把握稱“A取A1或A2”對“B取B1,B2”有關(guān)系;若10.828K2>6.635,有99%把握稱“A取A1或A2”對“B取B1,B2”有關(guān)系;若6.635K2>3.841,有95%把握稱“A取A1或A2”對“B取B1,B2”有關(guān)系;若K23.841,沒有把握稱A與B相關(guān)。【典型例題】例1.(2022·全國·高三專題練習(xí)(文))在對兩個(gè)變量x,y進(jìn)行回歸分析時(shí)有下列步驟:①對所求出的回歸方程作出解釋;②收集數(shù)據(jù)(xi,yi),i=1,2,…,n;③求回歸方程;④根據(jù)所收集的數(shù)據(jù)繪制散點(diǎn)圖.則下列操作順序正確的是()A.①②④③ B.③②④① C.②③①④ D.②④③①例2.(2022·全國·高三專題練習(xí))對于數(shù)據(jù)組,如果由線性回歸方程得到的對應(yīng)于自變量的估計(jì)值是,那么將稱為相應(yīng)于點(diǎn)的殘差.某工廠為研究某種產(chǎn)品產(chǎn)量(噸)與所需某種原材料噸)的相關(guān)性,在生產(chǎn)過程中收集4組對應(yīng)數(shù)據(jù)如下表所示:34562.534根據(jù)表中數(shù)據(jù),得出關(guān)于的線性回歸方程為,據(jù)此計(jì)算出樣本點(diǎn)處的殘差為-0.15,則表中的值為()A.3.3 B.4.5 C.5 D.5.5例3.(2022·全國·高三專題練習(xí))據(jù)貴州省氣候中心報(bào),2021年6月上旬,我省降水量在15.2-170.3mm之間,畢節(jié)市局地、遵義市北部、銅仁市局地和黔東南州東南部不足50mm,其余均在50mmm以上,局地超過100mm.若我省某地區(qū)2021年端午節(jié)前后3天,每一天下雨的概率均為.通過模擬實(shí)驗(yàn)的方法來估計(jì)該地區(qū)這3天中恰好有2天下雨的概率,利用計(jì)算機(jī)或計(jì)算器可以產(chǎn)生0到9之間取整數(shù)值的隨機(jī)數(shù)(,且)表示是否下雨:當(dāng)時(shí)表示該地區(qū)下雨,當(dāng)時(shí),表示該地區(qū)不下雨.因?yàn)槭?天,所以每三個(gè)隨機(jī)數(shù)作為一組,從隨機(jī)數(shù)表中隨機(jī)取得20組數(shù)如下:332714740945593468491272073445992772951431169332435027898719(1)求出k的值,使得該地區(qū)每一天下雨的概率均為;并根據(jù)上述20組隨機(jī)數(shù)估計(jì)該地區(qū)這3天中恰好有2天下雨的概率;(2)2016年到2020年該地區(qū)端午節(jié)當(dāng)天降雨量(單位:mm)如表:時(shí)間2016年2017年2018年2019年2020年年份12345降雨量2827252322經(jīng)研究表明:從2016年到2020年,該地區(qū)端午節(jié)有降雨的年份的降雨量與年份具有線性相關(guān)關(guān)系,求回歸直線方程.并預(yù)測該地區(qū)2022年端午節(jié)有降雨的話,降雨量約為多少?參考公式:,.例4.(2022·全國·高三專題練習(xí)(理))某企業(yè)新研發(fā)了一種產(chǎn)品,產(chǎn)品的成本由原料成本及非原料成本組成.每件產(chǎn)品的非原料成本(元)與生產(chǎn)該產(chǎn)品的數(shù)量(千件)有關(guān),經(jīng)統(tǒng)計(jì)得到如下數(shù)據(jù):123456781126135282524根據(jù)以上數(shù)據(jù),繪制了散點(diǎn)圖.觀察散點(diǎn)圖,兩個(gè)變量不具有線性相關(guān)關(guān)系,現(xiàn)考慮用反比例函數(shù)模型和指數(shù)函數(shù)模型分別對兩個(gè)變量的關(guān)系進(jìn)行擬合.已求得用指數(shù)函數(shù)模型擬合的回歸方程為與的相關(guān)系數(shù).(1)用反比例函數(shù)模型求關(guān)于的回歸方程;(2)用相關(guān)系數(shù)判斷上述兩個(gè)模型哪一個(gè)擬合效果更好(精確到,并用其估計(jì)產(chǎn)量為10千件時(shí)每件產(chǎn)品的非原料成本.參考數(shù)據(jù):360參考公式:對于一組數(shù)據(jù),其回歸直線的斜率和截距的最小一乘估計(jì)分別為:,,相關(guān)系數(shù)例5.(2022·全國·高三專題練習(xí))如圖是某小區(qū)2020年1月至2021年1月當(dāng)月在售二手房均價(jià)(單位:萬元/平方米)的散點(diǎn)圖.(圖中月份代碼1~13分別對應(yīng)2020年1月~2021年1月).根據(jù)散點(diǎn)圖選擇和兩個(gè)模型進(jìn)行擬合,經(jīng)過數(shù)據(jù)處理得到兩個(gè)回歸方程分別為和,并得到以下一些統(tǒng)計(jì)量的值:殘差平方和總偏差平方和(1)請利用相關(guān)指數(shù)判斷哪個(gè)模型的擬合效果更好;(2)估計(jì)該小區(qū)2021年6月份的二手房均價(jià).(精確到萬元/平方米)參考數(shù)據(jù):,,,,,,,.參考公式:相關(guān)指數(shù).例6.(2022·全國·高三專題練習(xí))近年來,明代著名醫(yī)藥學(xué)家李時(shí)珍故鄉(xiāng)黃岡市蘄春縣大力發(fā)展大健康產(chǎn)業(yè),蘄艾產(chǎn)業(yè)化種植已經(jīng)成為該縣脫貧攻堅(jiān)的主要產(chǎn)業(yè)之一,已知蘄艾的株高y(單位:cm)與一定范圍內(nèi)的溫度x(單位:℃)有關(guān),現(xiàn)收集了蘄艾的13組觀測數(shù)據(jù),得到如下的散點(diǎn)圖:現(xiàn)根據(jù)散點(diǎn)圖利用或建立y關(guān)于x的回歸方程,令,得到如下數(shù)據(jù):10.15109.943.040.1613.94-2.111.670.2121.22且(,)與(,)(i=1,2,3,…,13)的相關(guān)系數(shù)分別為,,且=﹣0.9953.(1)用相關(guān)系數(shù)說明哪種模型建立y與x的回歸方程更合適;(2)根據(jù)(1)的結(jié)果及表中數(shù)據(jù),建立關(guān)于x的回歸方程;(3)已知蘄艾的利潤z與x、y的關(guān)系為,當(dāng)x為何值時(shí),z的預(yù)報(bào)值最大.參考數(shù)據(jù)和公式:0.21×21.22=4.4562,11.67×21.22=247.6374,=15.7365,對于一組數(shù)據(jù)(,)(i=1,2,3,…,n),其回歸直線方程的斜率和截距的最小二乘法估計(jì)分別為,,相關(guān)系數(shù).例7.(2022·河北張家口·高三期末)已知某區(qū)、兩所初級中學(xué)的初一年級在校學(xué)生人數(shù)之比為,該區(qū)教育局為了解雙減政策的落實(shí)情況,用分層抽樣的方法在、兩校初一年級在校學(xué)生中共抽取了名學(xué)生,調(diào)查了他們課下做作業(yè)的時(shí)間,并根據(jù)調(diào)查結(jié)果繪制了如下頻率分布直方圖:(1)在抽取的名學(xué)生中,、兩所學(xué)校各抽取的人數(shù)是多少?(2)該區(qū)教育局想了解學(xué)生做作業(yè)時(shí)間的平均時(shí)長(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值作代表)和做作業(yè)時(shí)長超過小時(shí)的學(xué)生比例,請根據(jù)頻率分布直方圖,估計(jì)這兩個(gè)數(shù)值;(3)另據(jù)調(diào)查,這人中做作業(yè)時(shí)間超過小時(shí)的人中的人來自中學(xué),根據(jù)已知條件填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有的把握認(rèn)為“做作業(yè)時(shí)間超過小時(shí)”與“學(xué)?!庇嘘P(guān)?做作業(yè)時(shí)間超過小時(shí)做作業(yè)時(shí)間不超過小時(shí)合計(jì)校校合計(jì)附表:附:.【技能提升訓(xùn)練】一、單選題1.(2022·全國·高三專題練習(xí))某工廠的每月各項(xiàng)開支與毛利潤(單位:萬元)之間有如下關(guān)系,與的線性回歸方程,則()245683040605070A.17.5 B.17 C.15 D.15.52.(2021·重慶南開中學(xué)高三階段練習(xí))對兩個(gè)變量y和x進(jìn)行回歸分析,得到一組樣本數(shù)據(jù):,,…,,則下列說法中不正確的是()A.由樣本數(shù)據(jù)得到的回歸方程必過樣本中心B.殘差平方和越小的模型,擬合的效果越好C.用相關(guān)指數(shù)R2來刻畫回歸效果,R2越小,說明模型的擬合效果越好D.若變量y和x之間的相關(guān)系數(shù)為r=-0.9362,則變量y和x之間具有線性相關(guān)關(guān)系3.(2021·黑龍江·漠河市高級中學(xué)高三階段練習(xí)(文))某單位為了了解辦公樓用電量(度)與氣溫(℃)之間的關(guān)系,隨機(jī)統(tǒng)計(jì)了四個(gè)工作量與當(dāng)天平均氣溫,并制作了對照表:氣溫(℃)181310-1用電量(度)24343864由表中數(shù)據(jù)得到線性回歸方程,當(dāng)氣溫為℃時(shí),預(yù)測用電量均為A.68度 B.52度 C.12度 D.28度4.(2022·全國·高三專題練習(xí))關(guān)于線性回歸的描述,有下列命題:①回歸直線一定經(jīng)過樣本中心點(diǎn);②相關(guān)系數(shù)的絕對值越大,擬合效果越好;③相關(guān)指數(shù)越接近1擬合效果越好;④殘差平方和越小,擬合效果越好.其中正確的命題個(gè)數(shù)為()A.1 B.2 C.3 D.45.(2022·全國·高三專題練習(xí))下列表述中,正確的個(gè)數(shù)是()①將一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)都加上同一個(gè)常數(shù)后,方差不變;②設(shè)有一個(gè)回歸方程,變量增加1個(gè)單位時(shí),平均增加5個(gè)單位;③設(shè)具有相關(guān)關(guān)系的兩個(gè)變量,的相關(guān)系數(shù)為,那么越接近于0,,之間的線性相關(guān)程度越高;④在一個(gè)列聯(lián)表中,根據(jù)表中數(shù)據(jù)計(jì)算得到的觀測值,若的值越大,則認(rèn)為兩個(gè)變量間有關(guān)的把握就越大.A.0 B.1 C.2 D.36.(2022·全國·高三專題練習(xí)(文))對兩個(gè)變量y與x進(jìn)行回歸分析,分別選擇不同的模型,它們的相關(guān)系數(shù)r如下,其中擬合效果最好的模型是()A.0.2 B.0.8 C.-0.98 D.-0.77.(2022·全國·高三專題練習(xí))對四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得以下散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,正確的是()A. B.C. D.8.(2022·全國·高三專題練習(xí)(理))如果發(fā)現(xiàn)散點(diǎn)圖中所有的樣本點(diǎn)都落在一條斜率為非0實(shí)數(shù)的直線上,則下列說法錯(cuò)誤的是()A.解釋變量和預(yù)報(bào)變量是一次函數(shù)關(guān)系 B.相關(guān)系數(shù)C.相關(guān)指數(shù) D.殘差平方和為09.(2022·全國·高三專題練習(xí)(理))對四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得如圖所示的散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,正確的是()A. B.C. D.10.(2022·全國·高三專題練習(xí)(理))變量x,y的線性相關(guān)系數(shù)為,變量m,n的線性相關(guān)系數(shù)為,下列說法錯(cuò)誤的是()A.若,則說明變量x,y之間線性相關(guān)性強(qiáng)B.若,則說明變量x,y之間的線性相關(guān)性比變量m,n之間的線性相關(guān)性強(qiáng)C.若,則說明變量x,y之間的相關(guān)性為正相關(guān)D.若,則說明變量x,y之間線性不相關(guān)11.(2022·全國·高三專題練習(xí)(文))已知相關(guān)變量和的散點(diǎn)圖如圖所示,若用與擬合時(shí)的相關(guān)系數(shù)分別為則比較的大小結(jié)果為()A. B. C. D.不確定12.(2022·全國·高三專題練習(xí)(文))在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點(diǎn)圖中,若所有樣本點(diǎn)(xi,yi)(i=1,2,…,n)都在直線y=x+1上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為()A.-1 B.0 C. D.113.(2022·全國·高三專題練習(xí))如圖,5個(gè)數(shù)據(jù),去掉后,下列說法錯(cuò)誤的是()A.相關(guān)系數(shù)r變大 B.殘差平方和變大C.R2變大 D.解釋變量x與預(yù)報(bào)變量y的相關(guān)性變強(qiáng)14.(2022·全國·高三專題練習(xí))某公交公司推出掃碼支付乘車優(yōu)惠活動,活動為期兩周,活動的前五天數(shù)據(jù)如下表:第天12345使用人數(shù)()151734578421333由表中數(shù)據(jù)可得y關(guān)于x的回歸方程為,則據(jù)此回歸模型相應(yīng)于點(diǎn)(2,173)的殘差為()A. B. C.3 D.215.(2022·全國·高三專題練習(xí))隨著國家二孩政策的全面放開,為了調(diào)查一線城市和非一線城市的二孩生育意愿,某機(jī)構(gòu)用簡單隨機(jī)抽樣方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如下表.非一線一線總計(jì)愿生452065不愿生132235總計(jì)5842100計(jì)算得,.參照下表,0.0500.0100.0013.8416.63510.828下列結(jié)論正確的是()A.在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為“生育意愿與城市級別有關(guān)”B.在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為“生育意愿與城市級別無關(guān)”C.有以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”D.有以上的把握認(rèn)為“生育意愿與城市級別無關(guān)”16.(2022·全國·高三專題練習(xí))2018世界特色魅力城市200強(qiáng)新鮮出爐,包括黃山市在內(nèi)的28個(gè)中國城市入選,美麗的黃山風(fēng)景和人文景觀迎來眾多賓客.現(xiàn)在很多人喜歡“自助游”,某調(diào)查機(jī)構(gòu)為了了解“自助游”是否與性別有關(guān),在黃山旅游節(jié)期間,隨機(jī)抽取了100人,得如下所示的列聯(lián)表:贊成“自助游”不贊成“自助游”合計(jì)男性301545女性451055合計(jì)7525100參考公式:,其中.0.150.100.050.0250.0100.0050.001x02.0722.7063.8415.0246.6357.87910.828參照公式,得到的正確結(jié)論是()A.有以上的把握認(rèn)為“贊成‘自助游’與性別無關(guān)”B.有以上的把握認(rèn)為“贊成‘自助游’與性別有關(guān)”C.在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為“贊成‘自助游’與性別無關(guān)”D.在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為“贊成‘自助游’與性別有關(guān)”17.(2022·全國·高三專題練習(xí)(文))為了了解某高中生對電視臺某節(jié)目的態(tài)度,在某中學(xué)隨機(jī)調(diào)查了110名同學(xué),得到如下列聯(lián)表:男女總計(jì)喜歡402060不喜歡203050總計(jì)6050110由算得.參照附表,得到的正確結(jié)論是()A.在犯錯(cuò)誤的概率不超過0.1%的前提下,認(rèn)為“喜歡該節(jié)目與性別有關(guān)”B.在犯錯(cuò)誤的概率不超過0.1%的前提下,認(rèn)為“喜歡該節(jié)目與性別無關(guān)”C.有99%的把握認(rèn)為“喜歡該節(jié)目與性別有關(guān)”D.有99%的把握認(rèn)為“喜歡該節(jié)目與性別無關(guān)”18.(2022·全國·高三專題練習(xí)(文))為了解某高校學(xué)生使用手機(jī)支付和現(xiàn)金支付的情況,抽取了部分學(xué)生作為樣本,統(tǒng)計(jì)其喜歡的支付方式,并制作出如等高條形圖:根據(jù)圖中的信息,下列結(jié)論中不正確的是()A.樣本中多數(shù)男生喜歡手機(jī)支付B.樣本中的女生數(shù)量少于男生數(shù)量C.樣本中多數(shù)女生喜歡現(xiàn)金支付D.樣本中喜歡現(xiàn)金支付的數(shù)量少于喜歡手機(jī)支付的數(shù)量19.(2021·全國·高三專題練習(xí)(文))現(xiàn)行普通高中學(xué)生在高一時(shí)面臨著選科的問題,學(xué)校抽取了部分男?女學(xué)生意愿的一份樣本,制作出如下兩個(gè)等高堆積條形圖:根據(jù)這兩幅圖中的信息,下列哪個(gè)統(tǒng)計(jì)結(jié)論是不正確的()A.樣本中的女生數(shù)量多于男生數(shù)量B.樣本中有兩理一文意愿的學(xué)生數(shù)量多于有兩文一理意愿的學(xué)生數(shù)量C.樣本中的男生偏愛兩理一文D.樣本中的女生偏愛兩文一理二、多選題20.(2021·山東聊城·三模)對具有相關(guān)關(guān)系的兩個(gè)變量x和y進(jìn)行回歸分析時(shí),經(jīng)過隨機(jī)抽樣獲得成對的樣本點(diǎn)數(shù)據(jù),則下列結(jié)論正確的是()A.若兩變量x,y具有線性相關(guān)關(guān)系,則回歸直線至少經(jīng)過一個(gè)樣本點(diǎn)B.若兩變量x,y具有線性相關(guān)關(guān)系,則回歸直線一定經(jīng)過樣本點(diǎn)中心C.若以模型擬合該組數(shù)據(jù),為了求出回歸方程,設(shè),將其變換后得到線性方程,則a,b的估計(jì)值分別是3和6.D.用來刻畫回歸模型的擬合效果時(shí),若所有樣本點(diǎn)都落在一條斜率為非零實(shí)數(shù)的直線上,則的值為121.(2021·遼寧朝陽·一模)關(guān)于變量、的個(gè)樣本點(diǎn)、、、及其線性回歸方程:,下列說法正確的有()A.若相關(guān)系數(shù)越小,則表示、的線性相關(guān)程度越弱B.若線性回歸方程中的,則表示變量、正相關(guān)C.若殘差平方和越大,則表示線性回歸方程擬合效果越好D.若,,則點(diǎn)一定在回歸直線上22.(2022·江蘇·高三專題練習(xí))則下列說法正確的是()A.在回歸分析中,殘差的平方和越小,模型的擬合效果越好;B.在殘差圖中,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi),說明選用的模型比較合適;C.若數(shù)據(jù),,…,的平均數(shù)為1,則,,…的平均數(shù)為2;D.對分類變量與的隨機(jī)變量的觀測值來說,越小,判斷“與有關(guān)系”的把握越大.23.(2022·全國·高三專題練習(xí))針對時(shí)下的“抖音熱”,某校團(tuán)委對“學(xué)生性別和喜歡抖音是否有關(guān)”作了一次調(diào)查,其中被調(diào)查的男女生人數(shù)相同,男生喜歡抖音的人數(shù)占男生人數(shù)的,女生喜歡抖音的人數(shù)占女生人數(shù),若有的把握認(rèn)為是否喜歡抖音和性別有關(guān)則調(diào)查人數(shù)中男生可能有()人附表:0.0500.0103.8416.635附:A.25 B.45 C.60 D.75三、填空題24.(2022·全國·高三專題練習(xí))有人發(fā)現(xiàn),多看手機(jī)容易使人近視,下表是調(diào)查機(jī)構(gòu)對此現(xiàn)象的調(diào)查數(shù)據(jù):近視不近視總計(jì)少看手機(jī)多看手機(jī)總計(jì)則在犯錯(cuò)誤的概率不超過__________的前提下認(rèn)為近視與多看手機(jī)有關(guān)系.附表:參考公式:,其中.四、解答題25.(2022·全國·高三專題練習(xí)(文))近年來,新能源產(chǎn)業(yè)蓬勃發(fā)展,已成為我市的一大支柱產(chǎn)業(yè).據(jù)統(tǒng)計(jì),我市一家新能源企業(yè)近5個(gè)月的產(chǎn)值如下表:月份5月6月7月8月9月月份代碼12345產(chǎn)值億元1620273037(1)根據(jù)上表數(shù)據(jù),計(jì)算與的線性相關(guān)系數(shù),并說明與的線性相關(guān)性強(qiáng)弱;(,則認(rèn)為與線性相關(guān)性很強(qiáng);,則認(rèn)為與線性相關(guān)性不強(qiáng))(2)求出關(guān)于的線性回歸方程,并預(yù)測10月該企業(yè)的產(chǎn)值.參考公式:;參考數(shù)據(jù):.26.(2021·江西·模擬預(yù)測(文))某科技公司研發(fā)了一項(xiàng)新產(chǎn)品,經(jīng)過市場調(diào)研,對公司1月份至6月份銷售量及銷售單價(jià)進(jìn)行統(tǒng)計(jì),銷售單價(jià)(千元)和銷售量(千件)之間的一組數(shù)據(jù)如下表所示:月份123456銷售單價(jià)銷售量(1)試根據(jù)1至5月份的數(shù)據(jù),建立關(guān)于的回歸直線方程;(2)若由回歸直線方程得到的估計(jì)數(shù)據(jù)與剩下的檢驗(yàn)數(shù)據(jù)的誤差不超過千元,則認(rèn)為所得到的回歸直線方程是理想的,試問(1)中所得到的回歸直線方程是否理想?參考公式:回歸直線方程,其中.參考數(shù)據(jù):,.27.(2022·河南·溫縣第一高級中學(xué)高三階段練習(xí)(理))身高體重指數(shù)(BMI)的大小直接關(guān)系到人的健康狀況,某高中高三(1)班班主任為了解該班學(xué)生的身體健康狀況,從該班學(xué)生中隨機(jī)選取5名學(xué)生,測量其身高、體重(數(shù)據(jù)如下表)并進(jìn)行線性回歸分析,得到線性回歸方程為,因?yàn)槟承┰颍?號學(xué)生的體重?cái)?shù)據(jù)丟失.學(xué)生編號12345身高165170175170170體重58626563(1)求表格中的值;(2)已知公式可以用來刻畫回歸的效果,請問學(xué)生的體重差異約有百分之多少是由身高引起的.(注:結(jié)果四舍五入取整數(shù))28.(2022·全國·高三專題練習(xí))2021年6月17日9時(shí)22分,我國酒泉衛(wèi)星發(fā)射中心用長征遙十二運(yùn)載火箭,成功將神舟十二號載人飛船送入預(yù)定軌道,順利將聶海勝、劉伯明、湯洪波3名航天員送入太空,發(fā)射取得圓滿成功,這標(biāo)志著中國人首次進(jìn)入自己的空間站.某公司負(fù)責(zé)生產(chǎn)的A型材料是神舟十二號的重要零件,該材料應(yīng)用前景十分廣泛.該公司為了將A型材料更好地投入商用,擬對A型材料進(jìn)行應(yīng)用改造、根據(jù)市場調(diào)研與模擬,得到應(yīng)用改造投入x(億元)與產(chǎn)品的直接收益y(億元)的數(shù)據(jù)統(tǒng)計(jì)如下:序號123456789101112x2346810132122232425y1522274048546068.56867.56665當(dāng)時(shí),建立了y與x的兩個(gè)回歸模型:模型①:,模型②:;當(dāng)時(shí),確定y與x滿足的線性回歸方程為.(1)根據(jù)下列表格中的數(shù)據(jù),比較當(dāng)時(shí)模型①,②的相關(guān)指數(shù)的大小,并選擇擬合精度更高、更可靠的模型,預(yù)測對A型材料進(jìn)行應(yīng)用改造的投入為17億元時(shí)的直接收益;回歸模型模型①模型②回歸方程79.1320.2(2)為鼓勵(lì)科技創(chuàng)新,當(dāng)應(yīng)用改造的投入不少于20億元時(shí),國家給予公司補(bǔ)貼5億元,以回歸方程為預(yù)測依據(jù),根據(jù)(1)中選擇的擬合精度更高更可靠的模型,比較投入17億元與20億元時(shí)公司收益(直接收益+國家補(bǔ)貼)的大小.附:刻畫回歸效果的相關(guān)指數(shù),且當(dāng)越大時(shí),回歸方程的擬合效果越好..用最小二乘法求線性回歸方程的截距:.29.(2021·河南·一模(文))近年來,政府相關(guān)部門引導(dǎo)鄉(xiāng)村發(fā)展旅游的同時(shí),鼓勵(lì)農(nóng)戶建設(shè)溫室大棚種植高品質(zhì)農(nóng)作物.為了解某農(nóng)作物的大棚種植面積對種植管理成本的影響,甲,乙兩同學(xué)一起收集6家農(nóng)戶的數(shù)據(jù),進(jìn)行回歸分析,得到兩個(gè)回歸摸型:模型①:,模型②:,對以上兩個(gè)回歸方程進(jìn)行殘差分析,得到下表:種植面積(畝)234579每畝種植管理成本(百元)252421221614模型①估計(jì)值25.2723.6221.9717.0213.72殘差-0.270.38-0.97-1.020.28模型②26.8420.1718.8317.3116.46-1.840.833.17-1.31-2.46(1)將以上表格補(bǔ)充完整,并根據(jù)殘差平方和判斷哪個(gè)模型擬合效果更好;(2)視殘差的絕對值超過1.5的數(shù)據(jù)視為異常數(shù)據(jù),針對(1)中擬合效果較好的模型,剔除異常數(shù)據(jù)后,重新求回歸方程.附:,;30.(2021·全國·模擬預(yù)測)婺源位于江西省東北部,其境內(nèi)古村落遍布鄉(xiāng)野,保存完整,生態(tài)優(yōu)美,物產(chǎn)豐富,擁有著油菜花之鄉(xiāng)的美譽(yù),被譽(yù)為一顆鑲嵌在贛、浙、皖三省交界處的綠色明珠.為了調(diào)查某片實(shí)驗(yàn)田3月份油菜花的生長高度,研究人員在當(dāng)?shù)仉S機(jī)抽取了13株油菜花進(jìn)行高度測量,所得數(shù)據(jù)如下:,,,,,,,,.并通過繪制及觀察散點(diǎn)圖,選用兩種模型進(jìn)行擬合:模型一:,其中令;模型二:,其中令.(1)求模型二的回歸方程;(2)試通過計(jì)算相關(guān)系數(shù)的大小,說明對于所給數(shù)據(jù),哪一種模型更加合適.參考數(shù)據(jù):,,,.附:對于一組數(shù)據(jù),,…,,其回歸方程的斜率和截距的最小二乘估計(jì)分別為,,相關(guān)系數(shù).31.(2021·陜西·西安中學(xué)高三階段練習(xí)(文))我國為全面建設(shè)社會主義現(xiàn)代化國家,制定了從2021年到2025年的“十四五”規(guī)劃.某企業(yè)為響應(yīng)國家號召,匯聚科研力量,加強(qiáng)科技創(chuàng)新,準(zhǔn)備增加研發(fā)資金,現(xiàn)該企業(yè)為了解年研發(fā)資金投入額x(單位:億元)對年盈利額y(單位:億元)的影響,研究了“十二五”和“十三五”規(guī)劃發(fā)展期間近10年年研發(fā)資金投入額和年盈利額的數(shù)據(jù).通過對比分析,建立了兩個(gè)函數(shù)模型:①;②,其中均為常數(shù),e為自然對數(shù)的底數(shù).令,,經(jīng)計(jì)算得如下數(shù)據(jù):262156526805.36112501302.612(1)請從相關(guān)系數(shù)的角度,分析哪一個(gè)模型擬合程度更好;(2)根據(jù)(1)的選擇及表中數(shù)據(jù),建立y關(guān)于x的回歸方程(回歸系數(shù)精確到0.01).附:相關(guān)系數(shù),線性回歸直線方程,其中附:,.32.(2021·四川·成都七中一模(文))某投資公司2012年至2021年每年的投資金額(單位:萬元)與年利潤增量(單位:萬元)的散點(diǎn)圖如圖:該投資公司為了預(yù)測2022年投資金額為20萬元時(shí)的年利潤增量,建立了關(guān)于的兩個(gè)回歸模型;模型①:由最小二乘公式可求得與的線性回歸方程:;模型②:由圖中樣本點(diǎn)的分布,可以認(rèn)為樣本點(diǎn)集中在由線:的附近,對投資金額做換元,令,則,且有,(1)根據(jù)所給的統(tǒng)計(jì)量,求模型②中關(guān)于的回歸方程;(2)分別利用這兩個(gè)回歸模型,預(yù)測投資金額為20萬元時(shí)的年利潤增量(結(jié)果保留兩位小數(shù));附:樣本的最小乘估計(jì)公式為;參考數(shù)據(jù):.33.(2021·云南師大附中高三階段練習(xí)(文))近年來,由于耕地面積的緊張,化肥的施用量呈增加趨勢.一方面,化肥的施用對糧食增產(chǎn)增收起到了關(guān)鍵作用,另一方面,也成為環(huán)境污染、空氣污染、土壤污染的重要來源之一如何合理地施用化肥,使其最大程度地促進(jìn)糧食增產(chǎn),減少對周圍環(huán)境的污染成為需要解決的重要問題研究糧食產(chǎn)量與化肥施用量的關(guān)系,成為解決上述問題的前提某研究團(tuán)隊(duì)收集了10組化肥施用量和糧食畝產(chǎn)量的數(shù)據(jù)并對這些數(shù)據(jù)作了初步處理,得到了如圖所示的散點(diǎn)圖及一些統(tǒng)計(jì)量的值化肥施用量為(單位:公斤),糧食畝產(chǎn)量為(單位:百公斤).參考數(shù)據(jù):65091.552.51478.630.5151546.5表中.(1)根據(jù)散點(diǎn)圖判斷,與,哪一個(gè)適宜作為糧食畝產(chǎn)量關(guān)于化肥施用量的回歸方程類型(給出判斷即可,不必說明理由);(2)根據(jù)(1)的判斷結(jié)果及表中數(shù)據(jù),建立關(guān)于的回歸方程;(3)根據(jù)(2)的回歸方程,并預(yù)測化肥施用量為27公斤時(shí),糧食畝產(chǎn)量的值;附:①對于一組數(shù)據(jù),其回歸直線的斜率和截距的最小二乘估計(jì)分別為;②?。?4.(2021·河北·高三階段練習(xí))《2021新銳品牌數(shù)字化運(yùn)營白皮書》中,我國提出了新銳品牌的概念,全稱是國貨新銳品牌.對這個(gè)名稱進(jìn)行拆解:國貨?新?銳.新有兩個(gè)層面,一是針對企業(yè)本身,指2011年后成立的品牌.二是針對消費(fèi)者本身,開拓了新的消費(fèi)場景(需求),形成了細(xì)分化的品類.銳:是在短期內(nèi)實(shí)現(xiàn)大大高于傳統(tǒng)品牌的爆發(fā)式增長,并且占據(jù)了一定的消費(fèi)者心智.如圖是11月份中國某信息網(wǎng)發(fā)布的我國市2021年上半年新銳品牌人群用戶(新銳品牌人群,指在指定周期內(nèi)瀏覽新銳品牌相關(guān)內(nèi)容以及商品詳情頁的人群)性別分析數(shù)據(jù).市對購買家電類新銳品牌人群中隨機(jī)調(diào)查了100位男性顧客和100位女性顧客,統(tǒng)計(jì)出每位顧客購買家電消費(fèi)金額,根據(jù)這些數(shù)據(jù)得到如下的頻數(shù)分布表:消費(fèi)金額(元)女性顧客人數(shù)50301064男性顧客人數(shù)204024106(1)若以我國市2021年上半年新銳品牌人群用戶性別分析數(shù)據(jù)作為市抽取新銳品牌人群中性別概率,從市新銳品牌人群中隨機(jī)抽取四人,為四人中男性的人數(shù),求的概率分布列和期望.(2)根據(jù)市統(tǒng)計(jì)購買家電消費(fèi)金額數(shù)據(jù)頻數(shù)分布表,完成下列列聯(lián)表,并根據(jù)列聯(lián)表,判斷是否有99%的把握認(rèn)為購買家電類新銳品牌人群消費(fèi)金額千元以上與性別有關(guān)?不超千元千元以上合計(jì)女性顧客男性顧客合計(jì)附:,0.0500.0100.0013.8416.63510.82835.(2022·全國·高三專題練習(xí))某中學(xué)隨機(jī)抽查了名同學(xué)的每天課外閱讀時(shí)間,得到如下統(tǒng)計(jì)表:時(shí)長(分)人數(shù)(1)求這名同學(xué)的平均閱讀時(shí)長(用區(qū)間中點(diǎn)值代表每個(gè)人的閱讀時(shí)長);(2)在閱讀時(shí)長位于的人中任選人,求甲同學(xué)被選中的概率;(3)進(jìn)一步調(diào)查發(fā)現(xiàn),語文成績和每天的課外閱讀時(shí)間有很大關(guān)系,每天的課外閱讀時(shí)間多于半小時(shí)稱為“閱讀迷”,語文成績達(dá)到分視為優(yōu)秀,根據(jù)每天的課外閱讀時(shí)間和語文成績是否優(yōu)秀,制成一個(gè)列聯(lián)表:閱讀迷非閱讀迷合計(jì)語文成績優(yōu)秀語文成績不優(yōu)秀合計(jì)根據(jù)表中數(shù)據(jù),判斷是否有的把握認(rèn)為語文成績是否優(yōu)秀與課外閱讀時(shí)間有關(guān).參考公式:,其中.參考數(shù)據(jù):36.(2022·全國·高三專題練習(xí))為了比較注射A,B兩種藥物后產(chǎn)生的皮膚皰疹的面積,選200只家兔做試驗(yàn),將這200只家兔隨機(jī)地分成兩組,每組100只,其中一組注射藥物A,另一組注射藥物B.下表1和表2分別是注射藥物A和藥物B后的試驗(yàn)結(jié)果.(皰疹面積單位:mm2)表1:注射藥物A后皮膚皰疹面積的頻數(shù)分布表皰疹面積[60,65)[65,70)[70,75)[75,80)頻數(shù)30402010表2:注射藥物B后皮膚皰疹面積的頻數(shù)分布表皰疹面積[60,65)[65,70)[70,75)[75,80)[80,85)頻數(shù)1025203015(1)完成下面2×2列聯(lián)表;皰疹面積小于70mm2皰疹面積不小于70mm2總計(jì)注射藥物Aa=b=注射藥物Bc=d=總計(jì)n=(2)能否在犯錯(cuò)誤概率不超過0.01的前提下,認(rèn)為“注射藥物A后的皰疹面積與注射藥物B后的皰疹面積有差異”?37.(2022·全國·高三專題練習(xí))某淘寶店經(jīng)過對春節(jié)七天假期的消費(fèi)者進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)在金額不超過1000元的消費(fèi)者中男女比例為,該店按此比例抽取了100名消費(fèi)者進(jìn)行進(jìn)一步分析,得到下表女性消費(fèi)情況:消費(fèi)金額(元)人數(shù)51015473男性消費(fèi)情況:消費(fèi)金額(元)人數(shù)231032若消費(fèi)金額不低于600元的網(wǎng)購者為“網(wǎng)購達(dá)人”,低于600元的網(wǎng)購者為“非網(wǎng)購達(dá)人”(1)分別計(jì)算女性和男性消費(fèi)的平均數(shù),并判斷平均消費(fèi)水平高的一方“網(wǎng)購達(dá)人”出手是否更闊綽?(2)根據(jù)以上統(tǒng)計(jì)數(shù)據(jù)填寫如下列聯(lián)表,并回答能否在犯錯(cuò)誤的概率不超過的前提下認(rèn)為“是否為‘網(wǎng)購達(dá)人’與性別有關(guān)”.女性男性合計(jì)“網(wǎng)購達(dá)人”“非網(wǎng)購達(dá)人”合計(jì)附:.第27講統(tǒng)計(jì)案例和回歸方程【知識點(diǎn)總結(jié)】一、線性回歸線性回歸是研究不具備確定的函數(shù)關(guān)系的兩個(gè)變量之間的關(guān)系(相關(guān)關(guān)系)的方法。對于一組具有線性相關(guān)關(guān)系的數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),其回歸方程的求法為其中,,,(,)稱為樣本點(diǎn)的中心。步驟:畫散點(diǎn)圖,如散點(diǎn)圖中的點(diǎn)基本分布在一條直線附近,則這條直線叫這兩個(gè)變量的回歸直線,直線斜率k>0,稱兩個(gè)變量正相關(guān);k<0,稱兩個(gè)變量負(fù)相關(guān)。二、獨(dú)立性獨(dú)立性檢驗(yàn)是判斷兩個(gè)分類變量是否存在相關(guān)關(guān)系的案例分析方法。步驟為列出22列聯(lián)表(如表13-8所示),求出,并判斷:A1A2合計(jì)B1aca+cB2bdb+d合計(jì)a+bc+dn=a+b+c+d若K2>10.828,有99.9%把握稱“A取A1或A2”對“B取B1,B2”有關(guān)系;若10.828K2>6.635,有99%把握稱“A取A1或A2”對“B取B1,B2”有關(guān)系;若6.635K2>3.841,有95%把握稱“A取A1或A2”對“B取B1,B2”有關(guān)系;若K23.841,沒有把握稱A與B相關(guān)?!镜湫屠}】例1.(2022·全國·高三專題練習(xí)(文))在對兩個(gè)變量x,y進(jìn)行回歸分析時(shí)有下列步驟:①對所求出的回歸方程作出解釋;②收集數(shù)據(jù)(xi,yi),i=1,2,…,n;③求回歸方程;④根據(jù)所收集的數(shù)據(jù)繪制散點(diǎn)圖.則下列操作順序正確的是()A.①②④③ B.③②④① C.②③①④ D.②④③①【答案】D【詳解】根據(jù)回歸分析的思想,可知對兩個(gè)變量x,y進(jìn)行回歸分析時(shí),應(yīng)先收集數(shù)據(jù)(xi,yi),然后繪制散點(diǎn)圖,再求回歸方程,最后對所求的回歸方程作出解釋.故選:D例2.(2022·全國·高三專題練習(xí))對于數(shù)據(jù)組,如果由線性回歸方程得到的對應(yīng)于自變量的估計(jì)值是,那么將稱為相應(yīng)于點(diǎn)的殘差.某工廠為研究某種產(chǎn)品產(chǎn)量(噸)與所需某種原材料噸)的相關(guān)性,在生產(chǎn)過程中收集4組對應(yīng)數(shù)據(jù)如下表所示:34562.534根據(jù)表中數(shù)據(jù),得出關(guān)于的線性回歸方程為,據(jù)此計(jì)算出樣本點(diǎn)處的殘差為-0.15,則表中的值為()A.3.3 B.4.5 C.5 D.5.5【答案】B【詳解】由題意可知,在樣本(4,3)處的殘差-0.15,則,即,解得,即,又,且線性方程過樣本中心點(diǎn)(,),則,則,解得.故答案為:B【點(diǎn)睛】理解殘差的定義,實(shí)際值減去估計(jì)值;線性方程過樣本中心(,);要求對基本知識點(diǎn)比較熟練,計(jì)算才準(zhǔn)確.例3.(2022·全國·高三專題練習(xí))據(jù)貴州省氣候中心報(bào),2021年6月上旬,我省降水量在15.2-170.3mm之間,畢節(jié)市局地、遵義市北部、銅仁市局地和黔東南州東南部不足50mm,其余均在50mmm以上,局地超過100mm.若我省某地區(qū)2021年端午節(jié)前后3天,每一天下雨的概率均為.通過模擬實(shí)驗(yàn)的方法來估計(jì)該地區(qū)這3天中恰好有2天下雨的概率,利用計(jì)算機(jī)或計(jì)算器可以產(chǎn)生0到9之間取整數(shù)值的隨機(jī)數(shù)(,且)表示是否下雨:當(dāng)時(shí)表示該地區(qū)下雨,當(dāng)時(shí),表示該地區(qū)不下雨.因?yàn)槭?天,所以每三個(gè)隨機(jī)數(shù)作為一組,從隨機(jī)數(shù)表中隨機(jī)取得20組數(shù)如下:332714740945593468491272073445992772951431169332435027898719(1)求出k的值,使得該地區(qū)每一天下雨的概率均為;并根據(jù)上述20組隨機(jī)數(shù)估計(jì)該地區(qū)這3天中恰好有2天下雨的概率;(2)2016年到2020年該地區(qū)端午節(jié)當(dāng)天降雨量(單位:mm)如表:時(shí)間2016年2017年2018年2019年2020年年份12345降雨量2827252322經(jīng)研究表明:從2016年到2020年,該地區(qū)端午節(jié)有降雨的年份的降雨量與年份具有線性相關(guān)關(guān)系,求回歸直線方程.并預(yù)測該地區(qū)2022年端午節(jié)有降雨的話,降雨量約為多少?參考公式:,.【詳解】(1)由題意可知,,解得,即表示下雨,表示不下雨.所給的20組數(shù)據(jù)中,,,,,,,,共組表示天中恰好有天下雨,故所求的概率為.(2)由題中所給的數(shù)據(jù)可得,,所以,,所以回歸方程為,當(dāng)時(shí),.所以該地區(qū)年端午節(jié)有降雨的話,降雨量約為.例4.(2022·全國·高三專題練習(xí)(理))某企業(yè)新研發(fā)了一種產(chǎn)品,產(chǎn)品的成本由原料成本及非原料成本組成.每件產(chǎn)品的非原料成本(元)與生產(chǎn)該產(chǎn)品的數(shù)量(千件)有關(guān),經(jīng)統(tǒng)計(jì)得到如下數(shù)據(jù):123456781126135282524根據(jù)以上數(shù)據(jù),繪制了散點(diǎn)圖.觀察散點(diǎn)圖,兩個(gè)變量不具有線性相關(guān)關(guān)系,現(xiàn)考慮用反比例函數(shù)模型和指數(shù)函數(shù)模型分別對兩個(gè)變量的關(guān)系進(jìn)行擬合.已求得用指數(shù)函數(shù)模型擬合的回歸方程為與的相關(guān)系數(shù).(1)用反比例函數(shù)模型求關(guān)于的回歸方程;(2)用相關(guān)系數(shù)判斷上述兩個(gè)模型哪一個(gè)擬合效果更好(精確到,并用其估計(jì)產(chǎn)量為10千件時(shí)每件產(chǎn)品的非原料成本.參考數(shù)據(jù):360參考公式:對于一組數(shù)據(jù),其回歸直線的斜率和截距的最小一乘估計(jì)分別為:,,相關(guān)系數(shù)【解析】(1)令,則可轉(zhuǎn)化為.因?yàn)?,所以,,得,即關(guān)于的回歸方程為.(2)由定義知與的相關(guān)系數(shù)為:,則,所以用反比例函數(shù)模型擬合效果更好.當(dāng)時(shí),(元),則當(dāng)產(chǎn)量為10千件時(shí),每件產(chǎn)品的非原料成本為21元.例5.(2022·全國·高三專題練習(xí))如圖是某小區(qū)2020年1月至2021年1月當(dāng)月在售二手房均價(jià)(單位:萬元/平方米)的散點(diǎn)圖.(圖中月份代碼1~13分別對應(yīng)2020年1月~2021年1月).根據(jù)散點(diǎn)圖選擇和兩個(gè)模型進(jìn)行擬合,經(jīng)過數(shù)據(jù)處理得到兩個(gè)回歸方程分別為和,并得到以下一些統(tǒng)計(jì)量的值:殘差平方和總偏差平方和(1)請利用相關(guān)指數(shù)判斷哪個(gè)模型的擬合效果更好;(2)估計(jì)該小區(qū)2021年6月份的二手房均價(jià).(精確到萬元/平方米)參考數(shù)據(jù):,,,,,,,.參考公式:相關(guān)指數(shù).【詳解】(1)設(shè)模型和的相關(guān)指數(shù)分別為和,則,.因?yàn)椋?所以模型的擬合效果更好.(2)由(1)知,模型的擬合效果更好,利用該模型預(yù)測可得,這個(gè)小區(qū)2021年6月份的在售二手房均價(jià)為:(萬元/平方米).例6.(2022·全國·高三專題練習(xí))近年來,明代著名醫(yī)藥學(xué)家李時(shí)珍故鄉(xiāng)黃岡市蘄春縣大力發(fā)展大健康產(chǎn)業(yè),蘄艾產(chǎn)業(yè)化種植已經(jīng)成為該縣脫貧攻堅(jiān)的主要產(chǎn)業(yè)之一,已知蘄艾的株高y(單位:cm)與一定范圍內(nèi)的溫度x(單位:℃)有關(guān),現(xiàn)收集了蘄艾的13組觀測數(shù)據(jù),得到如下的散點(diǎn)圖:現(xiàn)根據(jù)散點(diǎn)圖利用或建立y關(guān)于x的回歸方程,令,得到如下數(shù)據(jù):10.15109.943.040.1613.94-2.111.670.2121.22且(,)與(,)(i=1,2,3,…,13)的相關(guān)系數(shù)分別為,,且=﹣0.9953.(1)用相關(guān)系數(shù)說明哪種模型建立y與x的回歸方程更合適;(2)根據(jù)(1)的結(jié)果及表中數(shù)據(jù),建立關(guān)于x的回歸方程;(3)已知蘄艾的利潤z與x、y的關(guān)系為,當(dāng)x為何值時(shí),z的預(yù)報(bào)值最大.參考數(shù)據(jù)和公式:0.21×21.22=4.4562,11.67×21.22=247.6374,=15.7365,對于一組數(shù)據(jù)(,)(i=1,2,3,…,n),其回歸直線方程的斜率和截距的最小二乘法估計(jì)分別為,,相關(guān)系數(shù).【詳解】(1)由題意知,,因?yàn)椋杏媚P徒⑴c的回歸方程更合適.(2)因?yàn)?,,所以關(guān)于的回歸方程為(3)由題意知,所以,當(dāng)且僅當(dāng)時(shí)等號成立,所以當(dāng)溫度為20時(shí)這種草藥的利潤最大.例7.(2022·河北張家口·高三期末)已知某區(qū)、兩所初級中學(xué)的初一年級在校學(xué)生人數(shù)之比為,該區(qū)教育局為了解雙減政策的落實(shí)情況,用分層抽樣的方法在、兩校初一年級在校學(xué)生中共抽取了名學(xué)生,調(diào)查了他們課下做作業(yè)的時(shí)間,并根據(jù)調(diào)查結(jié)果繪制了如下頻率分布直方圖:(1)在抽取的名學(xué)生中,、兩所學(xué)校各抽取的人數(shù)是多少?(2)該區(qū)教育局想了解學(xué)生做作業(yè)時(shí)間的平均時(shí)長(同一組中的數(shù)據(jù)用該組區(qū)間的中點(diǎn)值作代表)和做作業(yè)時(shí)長超過小時(shí)的學(xué)生比例,請根據(jù)頻率分布直方圖,估計(jì)這兩個(gè)數(shù)值;(3)另據(jù)調(diào)查,這人中做作業(yè)時(shí)間超過小時(shí)的人中的人來自中學(xué),根據(jù)已知條件填寫下面列聯(lián)表,并根據(jù)列聯(lián)表判斷是否有的把握認(rèn)為“做作業(yè)時(shí)間超過小時(shí)”與“學(xué)校”有關(guān)?做作業(yè)時(shí)間超過小時(shí)做作業(yè)時(shí)間不超過小時(shí)合計(jì)校校合計(jì)附表:附:.【解析】(1)解:設(shè)、兩校所抽取人數(shù)分別為、,由已知可得,解得.(2)解:由直方圖可知,學(xué)生做作業(yè)的平均時(shí)長的估計(jì)值為(小時(shí)).由,可知有的學(xué)生做作業(yè)時(shí)長超過小時(shí).綜上,估計(jì)該區(qū)學(xué)生做作業(yè)時(shí)間的平均時(shí)長為小時(shí),該區(qū)有的學(xué)生做作業(yè)時(shí)長超過3小時(shí).(3)解:由(2)可知,有(人)做作業(yè)時(shí)間超過3小時(shí).故填表如下(單位:人):做作業(yè)時(shí)間超過小時(shí)做作業(yè)時(shí)間不超過小時(shí)合計(jì)校校合計(jì),所以有的把握認(rèn)為“做作業(yè)時(shí)間超過小時(shí)”與“學(xué)?!庇嘘P(guān).【技能提升訓(xùn)練】一、單選題1.(2022·全國·高三專題練習(xí))某工廠的每月各項(xiàng)開支與毛利潤(單位:萬元)之間有如下關(guān)系,與的線性回歸方程,則()245683040605070A.17.5 B.17 C.15 D.15.5【答案】A【分析】根據(jù)表中的數(shù)據(jù),求得樣本中心為,代入回歸方程為,即可求解.【詳解】由題意,根據(jù)表中的數(shù)據(jù),可得,,即樣本中心為,代入與的線性回歸方程為,解得.故選:A.【點(diǎn)睛】本題主要考查了回歸直線方程的應(yīng)用,其中解答中熟記回歸直線的方程必過樣本中心這一基本特征是解答的關(guān)鍵,著重考查了計(jì)算能力.2.(2021·重慶南開中學(xué)高三階段練習(xí))對兩個(gè)變量y和x進(jìn)行回歸分析,得到一組樣本數(shù)據(jù):,,…,,則下列說法中不正確的是()A.由樣本數(shù)據(jù)得到的回歸方程必過樣本中心B.殘差平方和越小的模型,擬合的效果越好C.用相關(guān)指數(shù)R2來刻畫回歸效果,R2越小,說明模型的擬合效果越好D.若變量y和x之間的相關(guān)系數(shù)為r=-0.9362,則變量y和x之間具有線性相關(guān)關(guān)系【答案】C【分析】理解回歸分析中樣本中心、殘差、相關(guān)指數(shù)R2、相關(guān)系數(shù)的含義,即可判斷各選項(xiàng)的正誤.【詳解】A:樣本中心點(diǎn)在回歸直線上,正確;B:殘差平方和越小的模型,擬合效果越好,正確,C:R2越大擬合效果越好,不正確,D:當(dāng)?shù)闹荡笥?.8時(shí),表示兩個(gè)變量具有高度線性相關(guān)關(guān)系,正確.故選:C.3.(2021·黑龍江·漠河市高級中學(xué)高三階段練習(xí)(文))某單位為了了解辦公樓用電量(度)與氣溫(℃)之間的關(guān)系,隨機(jī)統(tǒng)計(jì)了四個(gè)工作量與當(dāng)天平均氣溫,并制作了對照表:氣溫(℃)181310-1用電量(度)24343864由表中數(shù)據(jù)得到線性回歸方程,當(dāng)氣溫為℃時(shí),預(yù)測用電量均為A.68度 B.52度 C.12度 D.28度【答案】A【詳解】由表格可知,,根據(jù)回歸直線方程必過得,因此當(dāng)時(shí),,故選擇A.4.(2022·全國·高三專題練習(xí))關(guān)于線性回歸的描述,有下列命題:①回歸直線一定經(jīng)過樣本中心點(diǎn);②相關(guān)系數(shù)的絕對值越大,擬合效果越好;③相關(guān)指數(shù)越接近1擬合效果越好;④殘差平方和越小,擬合效果越好.其中正確的命題個(gè)數(shù)為()A.1 B.2 C.3 D.4【答案】C【分析】根據(jù)回歸直線方程的性質(zhì),相關(guān)系數(shù)、相關(guān)系數(shù)及殘差平方和的意義判斷各項(xiàng)的正誤即可.【詳解】對于①,回歸直線一定經(jīng)過樣本中心點(diǎn),故正確;對于②,相關(guān)系數(shù)的絕對值越接近于1,相關(guān)性越強(qiáng),故錯(cuò)誤;對于③,相關(guān)指數(shù)越接近1擬合效果越好,故正確;對于④,殘差平方和越小,擬合效果越好,故正確.故選:C.5.(2022·全國·高三專題練習(xí))下列表述中,正確的個(gè)數(shù)是()①將一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)都加上同一個(gè)常數(shù)后,方差不變;②設(shè)有一個(gè)回歸方程,變量增加1個(gè)單位時(shí),平均增加5個(gè)單位;③設(shè)具有相關(guān)關(guān)系的兩個(gè)變量,的相關(guān)系數(shù)為,那么越接近于0,,之間的線性相關(guān)程度越高;④在一個(gè)列聯(lián)表中,根據(jù)表中數(shù)據(jù)計(jì)算得到的觀測值,若的值越大,則認(rèn)為兩個(gè)變量間有關(guān)的把握就越大.A.0 B.1 C.2 D.3【答案】C【分析】①根據(jù)方差的性質(zhì)即可判斷,②由回歸方程一次項(xiàng)的系數(shù)符號可知增減情況,③根據(jù)相關(guān)系數(shù)的含義判斷正誤,④根據(jù)卡方檢驗(yàn)的觀測值的意義判斷正誤.【詳解】①將一組數(shù)據(jù)中的每一個(gè)數(shù)據(jù)都加上同一個(gè)常數(shù)后,方差不變,正確;②設(shè)有一個(gè)回歸方程,變量增加1個(gè)單位時(shí),平均減少5個(gè)單位,錯(cuò)誤;③設(shè)具有相關(guān)關(guān)系的兩個(gè)變量,的相關(guān)系數(shù)為,那么越接近于1,,之間的線性相關(guān)程度越高,錯(cuò)誤;④在一個(gè)列聯(lián)表中,根據(jù)表中數(shù)據(jù)計(jì)算得到的觀測值,若的值越大,兩個(gè)變量有關(guān)系的出錯(cuò)概率越小,則認(rèn)為兩個(gè)變量間有關(guān)的把握就越大,正確.故選:C6.(2022·全國·高三專題練習(xí)(文))對兩個(gè)變量y與x進(jìn)行回歸分析,分別選擇不同的模型,它們的相關(guān)系數(shù)r如下,其中擬合效果最好的模型是()A.0.2 B.0.8 C.-0.98 D.-0.7【答案】C【分析】由相關(guān)系數(shù)的絕對值越大,越具有強(qiáng)大相關(guān)性,即可求解【詳解】∵相關(guān)系數(shù)的絕對值越大,越具有強(qiáng)大相關(guān)性,C相關(guān)系數(shù)的絕對值最大約接近1,∴C擬合程度越好.故選:C7.(2022·全國·高三專題練習(xí))對四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得以下散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,正確的是()A. B.C. D.【答案】A【分析】由給出的四組數(shù)據(jù)的散點(diǎn)圖,結(jié)合相關(guān)系數(shù)的概念,逐圖判定,即可求解.【詳解】由給出的四組數(shù)據(jù)的散點(diǎn)圖可以看出,題圖1和題圖3是正相關(guān),相關(guān)系數(shù)大于0,題圖2和題圖4是負(fù)相關(guān),相關(guān)系數(shù)小于0,題圖1和題圖2的點(diǎn)相對更加集中,所以相關(guān)性更強(qiáng),所以接近于1,接近于,由此可得.故選:A.8.(2022·全國·高三專題練習(xí)(理))如果發(fā)現(xiàn)散點(diǎn)圖中所有的樣本點(diǎn)都落在一條斜率為非0實(shí)數(shù)的直線上,則下列說法錯(cuò)誤的是()A.解釋變量和預(yù)報(bào)變量是一次函數(shù)關(guān)系 B.相關(guān)系數(shù)C.相關(guān)指數(shù) D.殘差平方和為0【答案】B【分析】根據(jù)相關(guān)指數(shù)和殘差的定義逐一判斷即可.【詳解】散點(diǎn)圖中所有的樣本點(diǎn)都落在一條斜率為非0實(shí)數(shù)的直線上,所以解釋變量和預(yù)報(bào)變量是一次函數(shù)關(guān)系,且殘差平方和為0,因此選項(xiàng)AD正確;由題意可知,,若直線的斜率為正,則,若直線的斜率為負(fù),則.故選:B.9.(2022·全國·高三專題練習(xí)(理))對四組數(shù)據(jù)進(jìn)行統(tǒng)計(jì),獲得如圖所示的散點(diǎn)圖,關(guān)于其相關(guān)系數(shù)的比較,正確的是()A. B.C. D.【答案】A【分析】根據(jù)題中給出的散點(diǎn)圖,先判斷是正相關(guān)還是負(fù)相關(guān),然后根據(jù)散點(diǎn)圖的集中程度分析相關(guān)系數(shù)的大小【詳解】解:由圖可知,圖2和圖3是正相關(guān),圖1和圖4是負(fù)相關(guān),囷1和圖2的點(diǎn)相對更加集中,所以相關(guān)性更強(qiáng),所以接近于,接近1,所以,故選:A10.(2022·全國·高三專題練習(xí)(理))變量x,y的線性相關(guān)系數(shù)為,變量m,n的線性相關(guān)系數(shù)為,下列說法錯(cuò)誤的是()A.若,則說明變量x,y之間線性相關(guān)性強(qiáng)B.若,則說明變量x,y之間的線性相關(guān)性比變量m,n之間的線性相關(guān)性強(qiáng)C.若,則說明變量x,y之間的相關(guān)性為正相關(guān)D.若,則說明變量x,y之間線性不相關(guān)【答案】B【分析】根據(jù)相關(guān)系數(shù)的意義逐項(xiàng)分析判斷即可.【詳解】A:因?yàn)榻咏?,所以說明變量x,y之間線性相關(guān)性強(qiáng),故A正確;B:若,滿足,但是不能說明變量x,y之間的線性相關(guān)性比變量m,n之間的線性相關(guān)性強(qiáng),故B錯(cuò)誤;C:若,則說明變量x,y之間的相關(guān)性為正相關(guān),故C正確;D:,則說明變量x,y之間線性不相關(guān),故D正確.故選:B.11.(2022·全國·高三專題練習(xí)(文))已知相關(guān)變量和的散點(diǎn)圖如圖所示,若用與擬合時(shí)的相關(guān)系數(shù)分別為則比較的大小結(jié)果為()A. B. C. D.不確定【答案】C【分析】由散點(diǎn)圖可知,對數(shù)形式的擬合程度高,再根據(jù)負(fù)相關(guān),比較兩個(gè)相關(guān)系數(shù)大小.【詳解】由散點(diǎn)圖可知,擬合比用擬合的程度高,故;又因?yàn)榇岁P(guān)系為負(fù)相關(guān),故選:C12.(2022·全國·高三專題練習(xí)(文))在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點(diǎn)圖中,若所有樣本點(diǎn)(xi,yi)(i=1,2,…,n)都在直線y=x+1上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為()A.-1 B.0 C. D.1【答案】D【分析】所有樣本點(diǎn)(xi,yi)(i=1,2,…,n)都在直線上,故這組樣本數(shù)據(jù)完全正相關(guān),故其相關(guān)系數(shù)為1.【詳解】由題設(shè)知,所有樣本點(diǎn)(xi,yi)(i=1,2,…,n)都在直線上,∴這組樣本數(shù)據(jù)完全正相關(guān),故其相關(guān)系數(shù)為1,故選D.根據(jù)樣本相關(guān)系數(shù)的定義可知,當(dāng)所有樣本點(diǎn)都在直線上時(shí),相關(guān)系數(shù)為1.13.(2022·全國·高三專題練習(xí))如圖,5個(gè)數(shù)據(jù),去掉后,下列說法錯(cuò)誤的是()A.相關(guān)系數(shù)r變大 B.殘差平方和變大C.R2變大 D.解釋變量x與預(yù)報(bào)變量y的相關(guān)性變強(qiáng)【答案】B【分析】根據(jù)圖中的點(diǎn),計(jì)算去掉前后的相關(guān)系數(shù)、殘差平方和、,即可判斷各選項(xiàng)的正誤.【詳解】由圖,,,則,,,∴相關(guān)系數(shù).令回歸方程,則,∴,即回歸方程為,可得為,,,,,∴殘差平方和,故,去掉后,,,則,,,∴相關(guān)系數(shù).∴,A、D正確;令回歸方程,則,∴,即回歸方程為,可得為,,,,∴殘差平方和,故,∴,B錯(cuò)誤,C正確;故選:B14.(2022·全國·高三專題練習(xí))某公交公司推出掃碼支付乘車優(yōu)惠活動,活動為期兩周,活動的前五天數(shù)據(jù)如下表:第天12345使用人數(shù)()151734578421333由表中數(shù)據(jù)可得y關(guān)于x的回歸方程為,則據(jù)此回歸模型相應(yīng)于點(diǎn)(2,173)的殘差為()A. B. C.3 D.2【答案】B【分析】先計(jì)算出的值,然后求得估計(jì)值,最后計(jì)算出殘差.【詳解】令,則,1491625使用人數(shù)()151734578421333,,所以,所以,當(dāng)時(shí),,所以殘差為.故選:B【點(diǎn)睛】非線性回歸要先轉(zhuǎn)化為線性回歸來求解,回歸直線方程過樣本中心點(diǎn).15.(2022·全國·高三專題練習(xí))隨著國家二孩政策的全面放開,為了調(diào)查一線城市和非一線城市的二孩生育意愿,某機(jī)構(gòu)用簡單隨機(jī)抽樣方法從不同地區(qū)調(diào)查了100位育齡婦女,結(jié)果如下表.非一線一線總計(jì)愿生452065不愿生132235總計(jì)5842100計(jì)算得,.參照下表,0.0500.0100.0013.8416.63510.828下列結(jié)論正確的是()A.在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為“生育意愿與城市級別有關(guān)”B.在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為“生育意愿與城市級別無關(guān)”C.有以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”D.有以上的把握認(rèn)為“生育意愿與城市級別無關(guān)”【答案】C【分析】根據(jù)的值與臨界值比較即可判斷進(jìn)而可得正確選項(xiàng).【詳解】因?yàn)?,所以有以上的把握認(rèn)為“生育意愿與城市級別有關(guān)”,故選項(xiàng)A、B、D不正確,故選:C.16.(2022·全國·高三專題練習(xí))2018世界特色魅力城市200強(qiáng)新鮮出爐,包括黃山市在內(nèi)的28個(gè)中國城市入選,美麗的黃山風(fēng)景和人文景觀迎來眾多賓客.現(xiàn)在很多人喜歡“自助游”,某調(diào)查機(jī)構(gòu)為了了解“自助游”是否與性別有關(guān),在黃山旅游節(jié)期間,隨機(jī)抽取了100人,得如下所示的列聯(lián)表:贊成“自助游”不贊成“自助游”合計(jì)男性301545女性451055合計(jì)7525100參考公式:,其中.0.150.100.050.0250.0100.0050.001x02.0722.7063.8415.0246.6357.87910.828參照公式,得到的正確結(jié)論是()A.有以上的把握認(rèn)為“贊成‘自助游’與性別無關(guān)”B.有以上的把握認(rèn)為“贊成‘自助游’與性別有關(guān)”C.在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為“贊成‘自助游’與性別無關(guān)”D.在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為“贊成‘自助游’與性別有關(guān)”【答案】D【分析】計(jì)算的值與臨界值比較即可判斷四個(gè)選項(xiàng)的正確性,進(jìn)而可得正確選項(xiàng).【詳解】將列聯(lián)表中的數(shù)據(jù)代入計(jì)算,得,因?yàn)椋栽诜稿e(cuò)誤的概率不超過的前提下,可以認(rèn)為“贊成‘自助游’與性別有關(guān)”.有以上的把握認(rèn)為“贊成‘自助游’與性別有關(guān)”,沒有以上的把握認(rèn)為“贊成‘自助游’與性別有關(guān)”,故選項(xiàng)ABC不正確,故選:D.17.(2022·全國·高三專題練習(xí)(文))為了了解某高中生對電視臺某節(jié)目的態(tài)度,在某中學(xué)隨機(jī)調(diào)查了110名同學(xué),得到如下列聯(lián)表:男女總計(jì)喜歡402060不喜歡203050總計(jì)6050110由算得.參照附表,得到的正確結(jié)論是()A.在犯錯(cuò)誤的概率不超過0.1%的前提下,認(rèn)為“喜歡該節(jié)目與性別有關(guān)”B.在犯錯(cuò)誤的概率不超過0.1%的前提下,認(rèn)為“喜歡該節(jié)目與性別無關(guān)”C.有99%的把握認(rèn)為“喜歡該節(jié)目與性別有關(guān)”D.有99%的把握認(rèn)為“喜歡該節(jié)目與性別無關(guān)”【答案】C【分析】根據(jù)求出的數(shù)據(jù),結(jié)合臨界值表判斷即可【詳解】解:因?yàn)?,所以在犯錯(cuò)誤的概率不超過1%的前提下,認(rèn)為“喜歡該節(jié)目與性別有關(guān)”,或有99%的把握認(rèn)為“喜歡該節(jié)目與性別有關(guān)”,故選:C18.(2022·全國·高三專題練習(xí)(文))為了解某高校學(xué)生使用手機(jī)支付和現(xiàn)金支付的情況,抽取了部分學(xué)生作為樣本,統(tǒng)計(jì)其喜歡的支付方式,并制作出如等高條形圖:根據(jù)圖中的信息,下列結(jié)論中不正確的是()A.樣本中多數(shù)男生喜歡手機(jī)支付B.樣本中的女生數(shù)量少于男生數(shù)量C.樣本中多數(shù)女生喜歡現(xiàn)金支付D.樣本中喜歡現(xiàn)金支付的數(shù)量少于喜歡手機(jī)支付的數(shù)量【答案】C【分析】根據(jù)兩等號條形圖的信息,逐個(gè)分析判斷即可.【詳解】對于A,由右圖可知,樣本中多數(shù)男生喜歡手機(jī)支付,A對;對于B,由左圖可知,樣本中的男生數(shù)量多于女生數(shù)量,B對;對于C,由右圖可知,樣本中多數(shù)女生喜歡手機(jī)支付,C錯(cuò);對于D,由右圖可知,樣本中喜歡現(xiàn)金支付的數(shù)量少于喜歡手機(jī)支付的數(shù)量,D對.故選:C.19.(2021·全國·高三專題練習(xí)(文))現(xiàn)行普通高中學(xué)生在高一時(shí)面臨著選科的問題,學(xué)校抽取了部分男?女學(xué)生意愿的一份樣本,制作出如下兩個(gè)等高堆積條形圖:根據(jù)這兩幅圖中的信息,下列哪個(gè)統(tǒng)計(jì)結(jié)論是不正確的()A.樣本中的女生數(shù)量多于男生數(shù)量B.樣本中有兩理一文意愿的學(xué)生數(shù)量多于有兩文一理意愿的學(xué)生數(shù)量C.樣本中的男生偏愛兩理一文D.樣本中的女生偏愛兩文一理【答案】D【分析】由等高堆積條形圖逐項(xiàng)判斷即可.【詳解】解:由條形圖知女生數(shù)量多于男生數(shù)量,故A正確;有兩理一文意愿的學(xué)生數(shù)量多于有兩文一理意愿的學(xué)生數(shù)量,故B正確;男生偏愛兩理一文,故C正確;女生中有兩理一文意愿的學(xué)生數(shù)量多于有兩文一理意愿的學(xué)生數(shù)量,故D錯(cuò)誤.故選:D.二、多選題20.(2021·山東聊城·三模)對具有相關(guān)關(guān)系的兩個(gè)變量x和y進(jìn)行回歸分析時(shí),經(jīng)過隨機(jī)抽樣獲得成對的樣本點(diǎn)數(shù)據(jù),則下列結(jié)論正確的是()A.若兩變量x,y具有線性相關(guān)關(guān)系,則回歸直線至少經(jīng)過一個(gè)樣本點(diǎn)B.若兩變量x,y具有線性相關(guān)關(guān)系,則回歸直線一定經(jīng)過樣本點(diǎn)中心C.若以模型擬合該組數(shù)據(jù),為了求出回歸方程,設(shè),將其變換后得到線性方程,則a,b的估計(jì)值分別是3和6.D.用來刻畫回歸模型的擬合效果時(shí),若所有樣本點(diǎn)都落在一條斜率為非零實(shí)數(shù)的直線上,則的值為1【答案】BCD【分析】分別根據(jù)線性相關(guān)關(guān)系及擬合曲線關(guān)系對選項(xiàng)一一分析.【詳解】若兩變量x,y具有線性相關(guān)關(guān)系,即滿足,則一定滿足,樣本點(diǎn)不一定在擬合直線上,故A錯(cuò)誤,B正確;若以模型擬合該組數(shù)據(jù),,故,故C正確;用來刻畫回歸模型的擬合效果時(shí),若所有樣本點(diǎn)都落在一條斜率為非零實(shí)數(shù)的直線上,則,即,故D正確;故選:BCD21.(2021·遼寧朝陽·一模)關(guān)于變量、的個(gè)樣本點(diǎn)、、、及其線性回歸方程:,下列說法正確的有()A.若相關(guān)系數(shù)越小,則表示、的線性相關(guān)程度越弱B.若線性回歸方程中的,則表示變量、正相關(guān)C.若殘差平方和越大,則表示線性回歸方程擬合效果越好D.若,,則點(diǎn)一定在回歸直線上【答案】BD【分析】本題可根據(jù)線性相關(guān)系數(shù)的意義判斷出A錯(cuò)誤,然后根據(jù)判斷出B正確,再然后根據(jù)殘差平方和越大擬合效果越差判斷出C錯(cuò)誤,最后根據(jù)樣本中心點(diǎn)一定在回歸直線上判斷出D正確.【詳解】A項(xiàng):根據(jù)線性相關(guān)系數(shù)的意義可知,當(dāng)?shù)慕^對值越接近于0時(shí),兩個(gè)隨機(jī)變量線性相關(guān)越來越弱,A錯(cuò)誤;B項(xiàng):當(dāng)時(shí),結(jié)合易知,變量、正相關(guān),B正確;C項(xiàng):殘差平方和越大,擬合效果越差,C錯(cuò)誤;D項(xiàng):樣本中心點(diǎn)一定在回歸直線上,D正確,故選:BD.22.(2022·江蘇·高三專題練習(xí))則下列說法正確的是()A.在回歸分析中,殘差的平方和越小,模型的擬合效果越好;B.在殘差圖中,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi),說明選用的模型比較合適;C.若數(shù)據(jù),,…,的平均數(shù)為1,則,,…的平均數(shù)為2;D.對分類變量與的隨機(jī)變量的觀測值來說,越小,判斷“與有關(guān)系”的把握越大.【答案】ABC【分析】根據(jù)殘差的意義,可判定AB真命題;根據(jù)數(shù)據(jù)的平均值的計(jì)算公式,可得C真命題;根據(jù)獨(dú)立性檢驗(yàn)中觀測值的幾何意義,可判定D為假命題.【詳解】根據(jù)殘差的意義知,殘差的平方和越小,模型的擬合效果越好,所以A正確;由殘差的意義知,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域內(nèi),說明選用的模型比較合適,所以B正確;若數(shù)據(jù),,…,的平均數(shù)為1,則,,…的平均數(shù)為也擴(kuò)大為原來的2倍,即平均數(shù)為2,所以C正確;對分類變量與的隨機(jī)變量的觀測值來說,應(yīng)該是越大,判斷“與有關(guān)系”的把握越大,所以D不正確.故選:ABC.23.(2022·全國·高三專題練習(xí))針對時(shí)下的“抖音熱”,某校團(tuán)委對“學(xué)生性別和喜歡抖音是否有關(guān)”作了一次調(diào)查,其中被調(diào)查的男女生人數(shù)相同,男生喜歡抖音的人數(shù)占男生人數(shù)的,女生喜歡抖音的人數(shù)占女生人數(shù),若有的把握認(rèn)為是否喜歡抖音和性別有關(guān)則調(diào)查人數(shù)中男生可能有()人附表:0.0500.0103.8416.635附:A.25 B.45 C.60 D.75【答案】BC【分析】設(shè)男生的人數(shù)為,列出列聯(lián)表,計(jì)算出的觀測值,結(jié)合題中條件可得出關(guān)于的不等式,解出的取值范圍,即可得出男生人數(shù)的可能值.【詳解】解:設(shè)男生的人數(shù)為,根據(jù)題意列出列聯(lián)表如下表所示:男生女生合計(jì)喜歡抖音不喜歡抖音合計(jì)則,由于有的把握認(rèn)為是否喜歡抖音和性別有關(guān),則,即,得,,則的可能取值有、、、,因此,調(diào)查人數(shù)中男生人數(shù)的可能值為、50、55或.故選:BC.三、填空題24.(2022·全國·高三專題練習(xí))有人發(fā)現(xiàn),多看手機(jī)容易使人近視,下表是調(diào)查機(jī)構(gòu)對此現(xiàn)象的調(diào)查數(shù)據(jù):近視不近視總計(jì)少看手機(jī)多看手機(jī)總計(jì)則在犯錯(cuò)誤的概率不超過__________的前提下認(rèn)為近視與多看手機(jī)有關(guān)系.附表:參考公式:,其中.【答案】【分析】根據(jù)列聯(lián)表計(jì)算得,進(jìn)而得答案.【詳解】解:根據(jù)列聯(lián)表計(jì)算,所以在犯錯(cuò)誤的概率不超過的前提下認(rèn)為近視與多看手機(jī)有關(guān)系.故答案為:四、解答題25.(2022·全國·高三專題練習(xí)(文))近年來,新能源產(chǎn)業(yè)蓬勃發(fā)展,已成為我市的一大支柱產(chǎn)業(yè).據(jù)統(tǒng)計(jì),我市一家新能源企業(yè)近5個(gè)月的產(chǎn)值如下表:月份5月6月7月8月9月月份代碼12345產(chǎn)值億元1620273037(1)根據(jù)上表數(shù)據(jù),計(jì)算與的線性相關(guān)系數(shù),并說明與的線性相關(guān)性強(qiáng)弱;(,則認(rèn)為與線性相關(guān)性很強(qiáng);,則認(rèn)為與線性相關(guān)性不強(qiáng))(2)求出關(guān)于的線性回歸方程,并預(yù)測10月該企業(yè)的產(chǎn)值.參考公式:;參考數(shù)據(jù):.【答案】(1);相關(guān)系數(shù)較強(qiáng);(2);10月該企業(yè)的產(chǎn)值約為億元【分析】(1)利用表中數(shù)據(jù)求出,再由相關(guān)系數(shù)的求解公式即可求解.(2)利用最小二乘法即可求解.(1),,,因?yàn)?,所以與線性相關(guān)性較強(qiáng).(2)設(shè)線性回歸方程為:;,,即,10月份對應(yīng)的代碼為,,10月該企業(yè)的產(chǎn)值約為億元.26.(2021·江西·模擬預(yù)測(文))某科技公司研發(fā)了一項(xiàng)新產(chǎn)品,經(jīng)過市場調(diào)研,對公司1月份至6月份銷售量及銷售單價(jià)進(jìn)行統(tǒng)計(jì),銷售單價(jià)(千元)和銷售量(千件)之間的一組數(shù)據(jù)如下表所示:月份123456銷售單價(jià)銷售量(1)試根據(jù)1至5月份的數(shù)據(jù),建立關(guān)于的回歸直線方程;(2)若由回歸直線方程得到的估計(jì)數(shù)據(jù)與剩下的檢驗(yàn)數(shù)據(jù)的誤差不超過千元,則認(rèn)為所得到的回歸直線方程是理想的,試問(1)中所得到的回歸直線方程是否理想?參考公式:回歸直線方程,其中.參考數(shù)據(jù):,.【答案】(1);(2)是.【分析】(1)先由表中的數(shù)據(jù)求出,再利用已知的數(shù)據(jù)和公式求出,從而可求出關(guān)于的回歸直線方程;(2)當(dāng)時(shí),求出的值,再與15比較即可得結(jié)論【詳解】(1)因?yàn)椋?,所以,得,于是關(guān)于的回歸直線方程為;(2)當(dāng)時(shí),,則,故可以認(rèn)為所得到的回歸直線方程是理想的.27.(2022·河南·溫縣第一高級中學(xué)高三階段練習(xí)(理))身高體重指數(shù)(BMI)的大小直接關(guān)系到人的健康狀況,某高中高三(1)班班主任為了解該班學(xué)生的身體健康狀況,從該班學(xué)生中隨機(jī)選取5名學(xué)生,測量其身高、體重(數(shù)據(jù)如下表)并進(jìn)行線性回歸分析,得到線性回歸方程為,因?yàn)槟承┰颍?號學(xué)生的體重?cái)?shù)據(jù)丟失.學(xué)生編號12345身高165170175170170體重58626563(1)求表格中的值;(2)已知公式可以用來刻畫回歸的效果,請問學(xué)生的體重差異約有百分之多少是由身高引起的.(注:結(jié)果四舍五入取整數(shù))【答案】(1)(2)88%【分析】(1)根據(jù)樣本中心滿足線性回歸方程得,再根據(jù)平均數(shù)求解即可;(2)根據(jù)回歸方程依次計(jì)算對應(yīng)數(shù)據(jù)的殘差,并列表,再結(jié)合公式計(jì)算即可.(1)解:,∵樣本點(diǎn)的中心滿足線性回歸方程,∴.∴,解得.(2)解:根據(jù)回歸方程,依次計(jì)算各組數(shù)據(jù)的殘差,得如下表:學(xué)生編號12345身高165170175170170體重5862676563殘差20∴,.∴.∴學(xué)生的體重差異約有88%是由身高引起的.28.(2022·全國·高三專題練習(xí))2021年6月17日9時(shí)22分,我國酒泉衛(wèi)星發(fā)射中心用長征遙十二運(yùn)載火箭,成功將神舟十二號載人飛船送入預(yù)定軌道,順利將聶海勝、劉伯明、湯洪波3名航天員送入太空,發(fā)射取得圓滿成功,這標(biāo)志著中國人首次進(jìn)入自己的空間站.某公司負(fù)責(zé)生產(chǎn)的A型材料是神舟十二號的重要零件,該材料應(yīng)用前景十分廣泛.該公司為了將A型材料更好地投入商用,擬對A型材料進(jìn)行應(yīng)用改造、根據(jù)市場調(diào)研與模擬,得到應(yīng)用改造投入x(億元)與產(chǎn)品的直接收益y(億元)的數(shù)據(jù)統(tǒng)計(jì)如下:序號123456789101112x2346810132122232425y1522274048546068.56867.56665當(dāng)時(shí),建立了y與x的兩個(gè)回歸模型:模型①:,模型②:;當(dāng)時(shí),確定y與x滿足的線性回歸方程為.(1)根據(jù)下列表格中的數(shù)據(jù),比較當(dāng)時(shí)模型①,②的相關(guān)指數(shù)的大小,并選擇擬合精度更高、更可靠的模型,預(yù)測對A型材料進(jìn)行應(yīng)用改造的投入為17億元時(shí)的直接收益;回歸模型模型①模型②回歸方程79.1320.2(2)為鼓勵(lì)科技創(chuàng)新,當(dāng)應(yīng)用改造的投入不少于20億元時(shí),國家給予公司補(bǔ)貼5億元,以回歸方程為預(yù)測依據(jù),根據(jù)(1)中選擇的擬合精度更高更可靠的模型,比較投入17億元與20億元時(shí)公司收益(直接收益+國家補(bǔ)貼)的大?。剑嚎坍嫽貧w效果的相關(guān)指數(shù),且當(dāng)越大時(shí),回歸方程的擬合效果越好..用最小二乘法求線性回歸方程的截距:.【答案】(1)模型②擬合精度更高、更可靠,億;(2)投入17億元比投入20億元時(shí)收益小.【分析】(1)根據(jù)公式計(jì)算相關(guān)指數(shù),再根據(jù)大小選擇合適的模型,根據(jù)所得模型可求直接受益.(2)根據(jù)(1)中的公式結(jié)合利潤計(jì)算方法可求公司收益,從而可得兩者的大小關(guān)系.【詳解】(1)對于模型①,對應(yīng)的,故對應(yīng)的,故對應(yīng)的相關(guān)指數(shù),對于模型②,同理對應(yīng)的相關(guān)指數(shù),故模型②擬合精度更高、更可靠.故對A型材料進(jìn)行應(yīng)用改造的投入為17億元時(shí)的直接收益為.(2)當(dāng)時(shí),后五組的,,由最小二乘法可得,故當(dāng)投入20億元時(shí)公司收益(直接收益+國家補(bǔ)貼)的大小為:,故投入17億元比投入20億元時(shí)收益小.29.(2021·河南·一模(文))近年來,政府相關(guān)部門引導(dǎo)鄉(xiāng)村發(fā)展旅游的同時(shí),鼓勵(lì)農(nóng)戶建設(shè)溫室大棚種植高品質(zhì)農(nóng)作物.為了解某農(nóng)作物的大棚種植面積對種植管理成本的影響,甲,乙兩同學(xué)一起收集6家農(nóng)戶的數(shù)據(jù),進(jìn)行回歸分析,得到兩個(gè)回歸摸型:模型①:,模型②:,對以上兩個(gè)回歸方程進(jìn)行殘差分析,得到下表:種植面積(畝)234579每畝種植管理成本(百元)252421221614模型①估計(jì)值25.2723.6221.9717.0213.72殘差-0.270.38-0.97-1.020.28模型②26.8420.1718.8317.3116.46-1.840.833.17-1.31-2.46(1)將以上表格補(bǔ)充完整,并根據(jù)殘差平方和判斷哪個(gè)模型擬合效果更好;(2)視殘差的絕對值超過1.5的數(shù)據(jù)視為異常數(shù)據(jù),針對(1)中擬合效果較好的模型,剔除異常數(shù)據(jù)后,重新求回歸方程.附:,;【答案】(1)表格答案見解析,模型①擬合效果比較好.(2)【分析】(1)令時(shí),求得,,令時(shí),求得,,填入表格即可.根據(jù)殘差平方和公式,分別求得模型①的殘差平方和,模型②的殘差平方和,再比較下結(jié)論.(2)根據(jù)視殘差的絕對值超過1.5的數(shù)據(jù)視為異常數(shù)據(jù),應(yīng)剔除第四組數(shù)據(jù),分別求得,,利用公式進(jìn)而求得,,寫出回歸方程.【詳解】(1)當(dāng)時(shí),,,當(dāng)時(shí),,,完成表格如下:種植面積(畝)234579每畝種植管理成本(百元)252421221614模型①估計(jì)值25.2723.6221.9720.3217.0213.72殘差-0.270.38-0.971.68-1.020.28模型②26.8422.3920.1718.8317.3116.46-1.841.610.833.17-1.31-2.46模型①的殘差平方和為,模型②的殘差平方和為,所以模型①的殘差平方和比模型②的殘差平方和小,所以模型①擬合效果比較好.(2)由題意知,應(yīng)剔除第四組數(shù)據(jù),,,,,∴所求回歸方程為.【點(diǎn)睛】本題考查回歸分析,線性回歸方程模型的建立,還考查了數(shù)據(jù)處理能力和運(yùn)算求解能力,屬于中檔題.30.(2021·全國·模擬預(yù)測)婺源位于江西省東北部,其境內(nèi)古村落遍布鄉(xiāng)野,保存完整,生態(tài)優(yōu)美,物產(chǎn)豐富,擁有著油菜花之鄉(xiāng)的美譽(yù),被譽(yù)為一顆鑲嵌在贛、浙、皖三省交界處的綠色明珠.為了調(diào)查某片實(shí)驗(yàn)田3月份油菜花的生長高度,研究人員在當(dāng)?shù)仉S機(jī)抽取了13株油菜花進(jìn)行高度測量,所得數(shù)據(jù)如下:,,,,,,,,.并通過繪制及觀察散點(diǎn)圖,選用兩種模型進(jìn)行擬合:模型一:,其中令;模型二:,其中令.(1)求模型二的回歸方程;(2)試通過計(jì)算相關(guān)系數(shù)的大小,說明對于所給數(shù)據(jù),哪一種模型更加合適.參考數(shù)據(jù):,,,.附:對于一組數(shù)據(jù),,…,,其回歸方程的斜率和截距的最小二乘估計(jì)分別為,,相關(guān)系數(shù).【答案】(1)(2),,模型二更合適.【分析】(1)模型二,其中令,則y=c+dt,則y和t成線性關(guān)系,由最小二乘法求出c和d即可;(2)計(jì)算兩種模型的相關(guān)系數(shù),相關(guān)系數(shù)絕對值越大,擬合越好,模型更合適.(1)因?yàn)?,,所以模型二的回歸方程為.(2)依題意,模型一的相關(guān)系數(shù),模型二的相關(guān)系數(shù).因?yàn)?,所以用模型建立y與x的回歸方程更合適.31.(2021·陜西·西安中學(xué)高三階段練習(xí)(文))我國為全面建設(shè)社會主義現(xiàn)代化國家,制定了從2021年到2025年的“十四五”規(guī)劃.某企業(yè)為響應(yīng)國家號召,匯聚科研力量,加強(qiáng)科技創(chuàng)新,準(zhǔn)備增加研發(fā)資金,現(xiàn)該企業(yè)為了解年研發(fā)資金投入額x(單位:億元)對年盈利額y(單位:億元)的影響,研究了“十二五”和“十三五”規(guī)劃發(fā)展期間近10年年研發(fā)資金投入額和年盈利額的數(shù)據(jù).通過對比分析,建立了兩個(gè)函數(shù)模型:①;②,其中均為常數(shù),e為自然對數(shù)的底數(shù).令,,經(jīng)計(jì)算得如下數(shù)據(jù):262156526805.36112501302.612(1)請從相關(guān)系數(shù)的角度,分析哪一個(gè)模型擬合程度更好;(2)根據(jù)(1)的選擇及表中數(shù)據(jù),建立y關(guān)于x的回歸方程(回歸系數(shù)精確到0.01).附:相關(guān)系數(shù),線性回歸直線方程,其中附:,.【答案】(1)模型②更好,理由見解析;(2).【分析】(1)根據(jù)已知數(shù)據(jù),結(jié)合函數(shù)模型,分別計(jì)算相關(guān)系數(shù),即可進(jìn)行比較;(2)根據(jù)參考公式和已知數(shù)據(jù),先求得關(guān)于的線性回歸方程,再轉(zhuǎn)化為關(guān)于的回歸方程即可.(1)若選擇模型①,故可得其相關(guān)系數(shù)若選擇模型②,,故可得其相關(guān)系數(shù)則,因此從相關(guān)系數(shù)的角度,模型的擬合程度更好.(2)先建立關(guān)于的線性回歸方程,由得,即.,,故關(guān)于的線性回歸方程為:,故,即,故y關(guān)于x的回歸方程為:.【點(diǎn)睛】本題考察回歸方程的求解,其中第二問中,需要對取對數(shù)得,求得關(guān)于的線性回歸方程,再轉(zhuǎn)化為關(guān)于的回歸方程,是處理本題的難點(diǎn)和關(guān)鍵點(diǎn),屬中檔題.32.(2021·四川·成都七中一模(文))某投資公司2012年至2021年每年的投資金額(單位:萬元)與年利潤增量(單位:萬元)的散點(diǎn)圖如圖:該投資公司為了預(yù)測2022年投資金額為20萬元時(shí)的年利潤增量,建立了關(guān)于的兩個(gè)回歸模型;模型①:由最小二乘公式可求得與的線性回歸方程:;模型②:由圖中樣本點(diǎn)的分布,可以認(rèn)為樣本點(diǎn)集中在由線:的附近,對投資金額做換元,令,則,且有,(1)根據(jù)所給的統(tǒng)計(jì)量,求模型②中關(guān)于的回歸方程;(2)分別利用這兩個(gè)回歸模型,預(yù)測投資金額為20萬元時(shí)的年利潤增量(結(jié)果保留兩位小數(shù));附:樣本的最小乘估計(jì)公式為;參考數(shù)據(jù):.【答案】(1)(2)模型①的年利潤增量的預(yù)測值為(萬元),模型②的年利潤增量的預(yù)測值為(萬元)【分析】(1)結(jié)合已知數(shù)據(jù)和公式求出這兩個(gè)系數(shù)即可得回歸方程;(2)把代入模型①、②的回歸方程,算出即可.(1)由題意,知,可得,又由,則所以,模型②中關(guān)于的回歸方程.(2)當(dāng)時(shí),模型①的年利潤增量的預(yù)測值為(萬元),當(dāng)時(shí),模型②的年利潤增量的預(yù)測值為萬元33.(2021·云南師大附中高三階段練習(xí)(文))近年來,由于耕地面積的緊張,化肥的施用量呈增加趨勢.一方面,化肥的施用對糧食增產(chǎn)增收起到了關(guān)鍵作用,另一方面,也成為環(huán)境污染、空氣污染、土壤污染的重要來源之一如何合理地施用化肥,使其最大程度地促進(jìn)糧食增產(chǎn),減少對周圍環(huán)境的污染成為需要解決的重要問題研究糧食產(chǎn)量與化肥施用量的關(guān)系,成為解決上述問題的前提某研究團(tuán)隊(duì)收集了10組化肥施用量和糧食畝產(chǎn)量的數(shù)據(jù)并對
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 不履行加盟合同范例
- 廚房裝潢施工合同范例
- 分包居間合同范例
- 企業(yè)稅務(wù)代理合同范例
- 加油員勞務(wù)合同范本
- 公司員工勞動合同范例
- 安陽工學(xué)院《內(nèi)科護(hù)理學(xué)2》2023-2024學(xué)年第一學(xué)期期末試卷
- 四川應(yīng)用技術(shù)職業(yè)學(xué)院《法語與國際組織》2023-2024學(xué)年第一學(xué)期期末試卷
- 廣東省梅州市興寧市2025屆小學(xué)六年級數(shù)學(xué)畢業(yè)檢測指導(dǎo)卷含解析
- 忻州師范學(xué)院《物聯(lián)網(wǎng)概論》2023-2024學(xué)年第二學(xué)期期末試卷
- Codesys中文編程手冊
- 教育系統(tǒng)后備干部筆試試題及參考答案
- 《綜合基礎(chǔ)知識》考試題及解析
- 六年級奧數(shù)(學(xué)生版)
- 人工智能導(dǎo)論 課件 項(xiàng)目1、2 人工智能的前世今生、人工智能基礎(chǔ)
- 《電子商務(wù)》專升本考試復(fù)習(xí)考題庫(匯總600題)
- 瘋狂動物城臺詞(配音片段)
- 智慧城市課件
- 高考臨界生輔導(dǎo)一生一策
- 六字訣傳統(tǒng)健身功法
- GB/T 1885-1998石油計(jì)量表
評論
0/150
提交評論