




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第27講統(tǒng)計案例和回歸方程【知識點總結】一、線性回歸線性回歸是研究不具備確定的函數關系的兩個變量之間的關系(相關關系)的方法。對于一組具有線性相關關系的數據(x1,y1),(x2,y2),…,(xn,yn),其回歸方程SKIPIF1<0的求法為SKIPIF1<0其中,SKIPIF1<0,SKIPIF1<0,(SKIPIF1<0,SKIPIF1<0)稱為樣本點的中心。步驟:畫散點圖,如散點圖中的點基本分布在一條直線附近,則這條直線叫這兩個變量的回歸直線,直線斜率k>0,稱兩個變量正相關;k<0,稱兩個變量負相關。二、獨立性獨立性檢驗是判斷兩個分類變量是否存在相關關系的案例分析方法。步驟為列出22列聯表(如表13-8所示),求出SKIPIF1<0,并判斷:A1A2合計B1aca+cB2bdb+d合計a+bc+dn=a+b+c+d若K2>10.828,有99.9%把握稱“A取A1或A2”對“B取B1,B2”有關系;若10.828K2>6.635,有99%把握稱“A取A1或A2”對“B取B1,B2”有關系;若6.635K2>3.841,有95%把握稱“A取A1或A2”對“B取B1,B2”有關系;若K23.841,沒有把握稱A與B相關?!镜湫屠}】例1.(2022·全國·高三專題練習(文))在對兩個變量x,y進行回歸分析時有下列步驟:①對所求出的回歸方程作出解釋;②收集數據(xi,yi),i=1,2,…,n;③求回歸方程;④根據所收集的數據繪制散點圖.則下列操作順序正確的是()A.①②④③ B.③②④① C.②③①④ D.②④③①例2.(2022·全國·高三專題練習)對于數據組SKIPIF1<0,如果由線性回歸方程得到的對應于自變量SKIPIF1<0的估計值是SKIPIF1<0,那么將SKIPIF1<0稱為相應于點SKIPIF1<0的殘差.某工廠為研究某種產品產量SKIPIF1<0(噸)與所需某種原材料SKIPIF1<0噸)的相關性,在生產過程中收集4組對應數據SKIPIF1<0如下表所示:SKIPIF1<03456SKIPIF1<02.534SKIPIF1<0根據表中數據,得出SKIPIF1<0關于SKIPIF1<0的線性回歸方程為SKIPIF1<0,據此計算出樣本點處的殘差為-0.15,則表中SKIPIF1<0的值為()A.3.3 B.4.5 C.5 D.5.5例3.(2022·全國·高三專題練習)據貴州省氣候中心報,2021年6月上旬,我省降水量在15.2-170.3mm之間,畢節(jié)市局地、遵義市北部、銅仁市局地和黔東南州東南部不足50mm,其余均在50mmm以上,局地超過100mm.若我省某地區(qū)2021年端午節(jié)前后3天,每一天下雨的概率均為SKIPIF1<0.通過模擬實驗的方法來估計該地區(qū)這3天中恰好有2天下雨的概率,利用計算機或計算器可以產生0到9之間取整數值的隨機數SKIPIF1<0(SKIPIF1<0,且SKIPIF1<0)表示是否下雨:當SKIPIF1<0時表示該地區(qū)下雨,當SKIPIF1<0時,表示該地區(qū)不下雨.因為是3天,所以每三個隨機數作為一組,從隨機數表中隨機取得20組數如下:332714740945593468491272073445992772951431169332435027898719(1)求出k的值,使得該地區(qū)每一天下雨的概率均為SKIPIF1<0;并根據上述20組隨機數估計該地區(qū)這3天中恰好有2天下雨的概率;(2)2016年到2020年該地區(qū)端午節(jié)當天降雨量(單位:mm)如表:時間2016年2017年2018年2019年2020年年份SKIPIF1<012345降雨量SKIPIF1<02827252322經研究表明:從2016年到2020年,該地區(qū)端午節(jié)有降雨的年份的降雨量SKIPIF1<0與年份SKIPIF1<0具有線性相關關系,求回歸直線方程SKIPIF1<0.并預測該地區(qū)2022年端午節(jié)有降雨的話,降雨量約為多少?參考公式:SKIPIF1<0,SKIPIF1<0.例4.(2022·全國·高三專題練習(理))某企業(yè)新研發(fā)了一種產品,產品的成本由原料成本及非原料成本組成.每件產品的非原料成本SKIPIF1<0(元)與生產該產品的數量SKIPIF1<0(千件)有關,經統(tǒng)計得到如下數據:SKIPIF1<012345678SKIPIF1<011261SKIPIF1<035SKIPIF1<0282524根據以上數據,繪制了散點圖.觀察散點圖,兩個變量不具有線性相關關系,現考慮用反比例函數模型SKIPIF1<0和指數函數模型SKIPIF1<0分別對兩個變量的關系進行擬合.已求得用指數函數模型擬合的回歸方程為SKIPIF1<0與SKIPIF1<0的相關系數SKIPIF1<0.(1)用反比例函數模型求SKIPIF1<0關于SKIPIF1<0的回歸方程;(2)用相關系數判斷上述兩個模型哪一個擬合效果更好(精確到SKIPIF1<0,并用其估計產量為10千件時每件產品的非原料成本.參考數據:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0360SKIPIF1<0SKIPIF1<0SKIPIF1<0參考公式:對于一組數據SKIPIF1<0,其回歸直線SKIPIF1<0的斜率和截距的最小一乘估計分別為:SKIPIF1<0,SKIPIF1<0,相關系數SKIPIF1<0例5.(2022·全國·高三專題練習)如圖是某小區(qū)2020年1月至2021年1月當月在售二手房均價(單位:萬元/平方米)的散點圖.(圖中月份代碼1~13分別對應2020年1月~2021年1月).根據散點圖選擇SKIPIF1<0和SKIPIF1<0兩個模型進行擬合,經過數據處理得到兩個回歸方程分別為SKIPIF1<0和SKIPIF1<0,并得到以下一些統(tǒng)計量的值:SKIPIF1<0SKIPIF1<0殘差平方和SKIPIF1<0SKIPIF1<0SKIPIF1<0總偏差平方和SKIPIF1<0SKIPIF1<0(1)請利用相關指數SKIPIF1<0判斷哪個模型的擬合效果更好;(2)估計該小區(qū)2021年6月份的二手房均價.(精確到SKIPIF1<0萬元/平方米)參考數據:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.參考公式:相關指數SKIPIF1<0.例6.(2022·全國·高三專題練習)近年來,明代著名醫(yī)藥學家李時珍故鄉(xiāng)黃岡市蘄春縣大力發(fā)展大健康產業(yè),蘄艾產業(yè)化種植已經成為該縣脫貧攻堅的主要產業(yè)之一,已知蘄艾的株高y(單位:cm)與一定范圍內的溫度x(單位:℃)有關,現收集了蘄艾的13組觀測數據,得到如下的散點圖:現根據散點圖利用SKIPIF1<0或SKIPIF1<0建立y關于x的回歸方程,令SKIPIF1<0,SKIPIF1<0得到如下數據:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<010.15109.943.040.16SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<013.94-2.111.670.2121.22且(SKIPIF1<0,SKIPIF1<0)與(SKIPIF1<0,SKIPIF1<0)(i=1,2,3,…,13)的相關系數分別為SKIPIF1<0,SKIPIF1<0,且SKIPIF1<0=﹣0.9953.(1)用相關系數說明哪種模型建立y與x的回歸方程更合適;(2)根據(1)的結果及表中數據,建立SKIPIF1<0關于x的回歸方程;(3)已知蘄艾的利潤z與x、y的關系為SKIPIF1<0,當x為何值時,z的預報值最大.參考數據和公式:0.21×21.22=4.4562,11.67×21.22=247.6374,SKIPIF1<0=15.7365,對于一組數據(SKIPIF1<0,SKIPIF1<0)(i=1,2,3,…,n),其回歸直線方程SKIPIF1<0的斜率和截距的最小二乘法估計分別為SKIPIF1<0,SKIPIF1<0,相關系數SKIPIF1<0.例7.(2022·河北張家口·高三期末)已知某區(qū)SKIPIF1<0、SKIPIF1<0兩所初級中學的初一年級在校學生人數之比為SKIPIF1<0,該區(qū)教育局為了解雙減政策的落實情況,用分層抽樣的方法在SKIPIF1<0、SKIPIF1<0兩校初一年級在校學生中共抽取了SKIPIF1<0名學生,調查了他們課下做作業(yè)的時間,并根據調查結果繪制了如下頻率分布直方圖:(1)在抽取的SKIPIF1<0名學生中,SKIPIF1<0、SKIPIF1<0兩所學校各抽取的人數是多少?(2)該區(qū)教育局想了解學生做作業(yè)時間的平均時長(同一組中的數據用該組區(qū)間的中點值作代表)和做作業(yè)時長超過SKIPIF1<0小時的學生比例,請根據頻率分布直方圖,估計這兩個數值;(3)另據調查,這SKIPIF1<0人中做作業(yè)時間超過SKIPIF1<0小時的人中的SKIPIF1<0人來自SKIPIF1<0中學,根據已知條件填寫下面列聯表,并根據列聯表判斷是否有SKIPIF1<0的把握認為“做作業(yè)時間超過SKIPIF1<0小時”與“學?!庇嘘P?做作業(yè)時間超過SKIPIF1<0小時做作業(yè)時間不超過SKIPIF1<0小時合計SKIPIF1<0校SKIPIF1<0校合計附表:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0附:SKIPIF1<0.【技能提升訓練】一、單選題1.(2022·全國·高三專題練習)某工廠的每月各項開支SKIPIF1<0與毛利潤SKIPIF1<0(單位:萬元)之間有如下關系,SKIPIF1<0與SKIPIF1<0的線性回歸方程SKIPIF1<0,則SKIPIF1<0()SKIPIF1<024568SKIPIF1<03040605070A.17.5 B.17 C.15 D.15.52.(2021·重慶南開中學高三階段練習)對兩個變量y和x進行回歸分析,得到一組樣本數據:SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,則下列說法中不正確的是()A.由樣本數據得到的回歸方程SKIPIF1<0必過樣本中心SKIPIF1<0B.殘差平方和越小的模型,擬合的效果越好C.用相關指數R2來刻畫回歸效果,R2越小,說明模型的擬合效果越好D.若變量y和x之間的相關系數為r=-0.9362,則變量y和x之間具有線性相關關系3.(2021·黑龍江·漠河市高級中學高三階段練習(文))某單位為了了解辦公樓用電量SKIPIF1<0(度)與氣溫SKIPIF1<0(℃)之間的關系,隨機統(tǒng)計了四個工作量與當天平均氣溫,并制作了對照表:氣溫(℃)181310-1用電量(度)24343864由表中數據得到線性回歸方程SKIPIF1<0,當氣溫為SKIPIF1<0℃時,預測用電量均為A.68度 B.52度 C.12度 D.28度4.(2022·全國·高三專題練習)關于線性回歸的描述,有下列命題:①回歸直線一定經過樣本中心點;②相關系數SKIPIF1<0的絕對值越大,擬合效果越好;③相關指數SKIPIF1<0越接近1擬合效果越好;④殘差平方和越小,擬合效果越好.其中正確的命題個數為()A.1 B.2 C.3 D.45.(2022·全國·高三專題練習)下列表述中,正確的個數是()①將一組數據中的每一個數據都加上同一個常數后,方差不變;②設有一個回歸方程SKIPIF1<0,變量SKIPIF1<0增加1個單位時,SKIPIF1<0平均增加5個單位;③設具有相關關系的兩個變量SKIPIF1<0,SKIPIF1<0的相關系數為SKIPIF1<0,那么SKIPIF1<0越接近于0,SKIPIF1<0,SKIPIF1<0之間的線性相關程度越高;④在一個SKIPIF1<0列聯表中,根據表中數據計算得到SKIPIF1<0的觀測值SKIPIF1<0,若SKIPIF1<0的值越大,則認為兩個變量間有關的把握就越大.A.0 B.1 C.2 D.36.(2022·全國·高三專題練習(文))對兩個變量y與x進行回歸分析,分別選擇不同的模型,它們的相關系數r如下,其中擬合效果最好的模型是()A.0.2 B.0.8 C.-0.98 D.-0.77.(2022·全國·高三專題練習)對四組數據進行統(tǒng)計,獲得以下散點圖,關于其相關系數的比較,正確的是()A.SKIPIF1<0 B.SKIPIF1<0C.SKIPIF1<0 D.SKIPIF1<08.(2022·全國·高三專題練習(理))如果發(fā)現散點圖中所有的樣本點都落在一條斜率為非0實數的直線上,則下列說法錯誤的是()A.解釋變量和預報變量是一次函數關系 B.相關系數SKIPIF1<0C.相關指數SKIPIF1<0 D.殘差平方和為09.(2022·全國·高三專題練習(理))對四組數據進行統(tǒng)計,獲得如圖所示的散點圖,關于其相關系數的比較,正確的是()
A.SKIPIF1<0 B.SKIPIF1<0C.SKIPIF1<0 D.SKIPIF1<010.(2022·全國·高三專題練習(理))變量x,y的線性相關系數為SKIPIF1<0,變量m,n的線性相關系數為SKIPIF1<0,下列說法錯誤的是()A.若SKIPIF1<0,則說明變量x,y之間線性相關性強B.若SKIPIF1<0,則說明變量x,y之間的線性相關性比變量m,n之間的線性相關性強C.若SKIPIF1<0,則說明變量x,y之間的相關性為正相關D.若SKIPIF1<0,則說明變量x,y之間線性不相關11.(2022·全國·高三專題練習(文))已知相關變量SKIPIF1<0和SKIPIF1<0的散點圖如圖所示,若用SKIPIF1<0與SKIPIF1<0擬合時的相關系數分別為SKIPIF1<0則比較SKIPIF1<0的大小結果為()A.SKIPIF1<0 B.SKIPIF1<0 C.SKIPIF1<0 D.不確定12.(2022·全國·高三專題練習(文))在一組樣本數據(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散點圖中,若所有樣本點(xi,yi)(i=1,2,…,n)都在直線y=SKIPIF1<0x+1上,則這組樣本數據的樣本相關系數為()A.-1 B.0 C.SKIPIF1<0 D.113.(2022·全國·高三專題練習)如圖,5個SKIPIF1<0數據,去掉SKIPIF1<0后,下列說法錯誤的是()A.相關系數r變大 B.殘差平方和變大C.R2變大 D.解釋變量x與預報變量y的相關性變強14.(2022·全國·高三專題練習)某公交公司推出掃碼支付乘車優(yōu)惠活動,活動為期兩周,活動的前五天數據如下表:第SKIPIF1<0天12345使用人數(SKIPIF1<0)151734578421333由表中數據可得y關于x的回歸方程為SKIPIF1<0,則據此回歸模型相應于點(2,173)的殘差為()A.SKIPIF1<0 B.SKIPIF1<0 C.3 D.215.(2022·全國·高三專題練習)隨著國家二孩政策的全面放開,為了調查一線城市和非一線城市的二孩生育意愿,某機構用簡單隨機抽樣方法從不同地區(qū)調查了100位育齡婦女,結果如下表.非一線一線總計愿生452065不愿生132235總計5842100計算得,SKIPIF1<0.參照下表,SKIPIF1<00.0500.0100.001SKIPIF1<03.8416.63510.828下列結論正確的是()A.在犯錯誤的概率不超過SKIPIF1<0的前提下,認為“生育意愿與城市級別有關”B.在犯錯誤的概率不超過SKIPIF1<0的前提下,認為“生育意愿與城市級別無關”C.有SKIPIF1<0以上的把握認為“生育意愿與城市級別有關”D.有SKIPIF1<0以上的把握認為“生育意愿與城市級別無關”16.(2022·全國·高三專題練習)2018世界特色魅力城市200強新鮮出爐,包括黃山市在內的28個中國城市入選,美麗的黃山風景和人文景觀迎來眾多賓客.現在很多人喜歡“自助游”,某調查機構為了了解“自助游”是否與性別有關,在黃山旅游節(jié)期間,隨機抽取了100人,得如下所示的列聯表:贊成“自助游”不贊成“自助游”合計男性301545女性451055合計7525100參考公式:SKIPIF1<0,其中SKIPIF1<0.SKIPIF1<00.150.100.050.0250.0100.0050.001x02.0722.7063.8415.0246.6357.87910.828參照公式,得到的正確結論是()A.有SKIPIF1<0以上的把握認為“贊成‘自助游’與性別無關”B.有SKIPIF1<0以上的把握認為“贊成‘自助游’與性別有關”C.在犯錯誤的概率不超過SKIPIF1<0的前提下,認為“贊成‘自助游’與性別無關”D.在犯錯誤的概率不超過SKIPIF1<0的前提下,認為“贊成‘自助游’與性別有關”17.(2022·全國·高三專題練習(文))為了了解某高中生對電視臺某節(jié)目的態(tài)度,在某中學隨機調查了110名同學,得到如下列聯表:男女總計喜歡402060不喜歡203050總計6050110由SKIPIF1<0算得SKIPIF1<0.SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0參照附表,得到的正確結論是()A.在犯錯誤的概率不超過0.1%的前提下,認為“喜歡該節(jié)目與性別有關”B.在犯錯誤的概率不超過0.1%的前提下,認為“喜歡該節(jié)目與性別無關”C.有99%的把握認為“喜歡該節(jié)目與性別有關”D.有99%的把握認為“喜歡該節(jié)目與性別無關”18.(2022·全國·高三專題練習(文))為了解某高校學生使用手機支付和現金支付的情況,抽取了部分學生作為樣本,統(tǒng)計其喜歡的支付方式,并制作出如等高條形圖:根據圖中的信息,下列結論中不正確的是()A.樣本中多數男生喜歡手機支付B.樣本中的女生數量少于男生數量C.樣本中多數女生喜歡現金支付D.樣本中喜歡現金支付的數量少于喜歡手機支付的數量19.(2021·全國·高三專題練習(文))現行普通高中學生在高一時面臨著選科的問題,學校抽取了部分男?女學生意愿的一份樣本,制作出如下兩個等高堆積條形圖:根據這兩幅圖中的信息,下列哪個統(tǒng)計結論是不正確的()A.樣本中的女生數量多于男生數量B.樣本中有兩理一文意愿的學生數量多于有兩文一理意愿的學生數量C.樣本中的男生偏愛兩理一文D.樣本中的女生偏愛兩文一理二、多選題20.(2021·山東聊城·三模)對具有相關關系的兩個變量x和y進行回歸分析時,經過隨機抽樣獲得成對的樣本點數據SKIPIF1<0,則下列結論正確的是()A.若兩變量x,y具有線性相關關系,則回歸直線至少經過一個樣本點B.若兩變量x,y具有線性相關關系,則回歸直線一定經過樣本點中心SKIPIF1<0C.若以模型SKIPIF1<0擬合該組數據,為了求出回歸方程,設SKIPIF1<0,將其變換后得到線性方程SKIPIF1<0,則a,b的估計值分別是3和6.D.用SKIPIF1<0SKIPIF1<0來刻畫回歸模型的擬合效果時,若所有樣本點都落在一條斜率為非零實數的直線上,則SKIPIF1<0的值為121.(2021·遼寧朝陽·一模)關于變量SKIPIF1<0、SKIPIF1<0的SKIPIF1<0個樣本點SKIPIF1<0、SKIPIF1<0、SKIPIF1<0、SKIPIF1<0及其線性回歸方程:SKIPIF1<0,下列說法正確的有()A.若相關系數SKIPIF1<0越小,則表示SKIPIF1<0、SKIPIF1<0的線性相關程度越弱B.若線性回歸方程中的SKIPIF1<0,則表示變量SKIPIF1<0、SKIPIF1<0正相關C.若殘差平方和越大,則表示線性回歸方程擬合效果越好D.若SKIPIF1<0,SKIPIF1<0,則點SKIPIF1<0一定在回歸直線SKIPIF1<0上22.(2022·江蘇·高三專題練習)則下列說法正確的是()A.在回歸分析中,殘差的平方和越小,模型的擬合效果越好;B.在殘差圖中,殘差點比較均勻地落在水平的帶狀區(qū)域內,說明選用的模型比較合適;C.若數據SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0的平均數為1,則SKIPIF1<0,SKIPIF1<0,…SKIPIF1<0的平均數為2;D.對分類變量SKIPIF1<0與SKIPIF1<0的隨機變量SKIPIF1<0的觀測值SKIPIF1<0來說,SKIPIF1<0越小,判斷“SKIPIF1<0與SKIPIF1<0有關系”的把握越大.23.(2022·全國·高三專題練習)針對時下的“抖音熱”,某校團委對“學生性別和喜歡抖音是否有關”作了一次調查,其中被調查的男女生人數相同,男生喜歡抖音的人數占男生人數的SKIPIF1<0,女生喜歡抖音的人數占女生人數SKIPIF1<0,若有SKIPIF1<0的把握認為是否喜歡抖音和性別有關則調查人數中男生可能有()人附表:SKIPIF1<00.0500.010SKIPIF1<03.8416.635附:SKIPIF1<0A.25 B.45 C.60 D.75三、填空題24.(2022·全國·高三專題練習)有人發(fā)現,多看手機容易使人近視,下表是調查機構對此現象的調查數據:近視不近視總計少看手機SKIPIF1<0SKIPIF1<0SKIPIF1<0多看手機SKIPIF1<0SKIPIF1<0SKIPIF1<0總計SKIPIF1<0SKIPIF1<0SKIPIF1<0則在犯錯誤的概率不超過__________的前提下認為近視與多看手機有關系.附表:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0參考公式:SKIPIF1<0,其中SKIPIF1<0.四、解答題25.(2022·全國·高三專題練習(文))近年來,新能源產業(yè)蓬勃發(fā)展,已成為我市的一大支柱產業(yè).據統(tǒng)計,我市一家新能源企業(yè)近5個月的產值如下表:月份5月6月7月8月9月月份代碼SKIPIF1<012345產值SKIPIF1<0億元1620273037(1)根據上表數據,計算SKIPIF1<0與SKIPIF1<0的線性相關系數SKIPIF1<0,并說明SKIPIF1<0與SKIPIF1<0的線性相關性強弱;(SKIPIF1<0,則認為SKIPIF1<0與SKIPIF1<0線性相關性很強;SKIPIF1<0,則認為SKIPIF1<0與SKIPIF1<0線性相關性不強)(2)求出SKIPIF1<0關于SKIPIF1<0的線性回歸方程,并預測10月該企業(yè)的產值.參考公式:SKIPIF1<0;參考數據:SKIPIF1<0.26.(2021·江西·模擬預測(文))某科技公司研發(fā)了一項新產品SKIPIF1<0,經過市場調研,對公司1月份至6月份銷售量及銷售單價進行統(tǒng)計,銷售單價SKIPIF1<0(千元)和銷售量SKIPIF1<0(千件)之間的一組數據如下表所示:月份SKIPIF1<0123456銷售單價SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0銷售量SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0(1)試根據1至5月份的數據,建立SKIPIF1<0關于SKIPIF1<0的回歸直線方程;(2)若由回歸直線方程得到的估計數據與剩下的檢驗數據的誤差不超過SKIPIF1<0千元,則認為所得到的回歸直線方程是理想的,試問(1)中所得到的回歸直線方程是否理想?參考公式:回歸直線方程SKIPIF1<0,其中SKIPIF1<0.參考數據:SKIPIF1<0,SKIPIF1<0.27.(2022·河南·溫縣第一高級中學高三階段練習(理))身高體重指數(BMI)的大小直接關系到人的健康狀況,某高中高三(1)班班主任為了解該班學生的身體健康狀況,從該班學生中隨機選取5名學生,測量其身高、體重(數據如下表)并進行線性回歸分析,得到線性回歸方程為SKIPIF1<0,因為某些原因,3號學生的體重數據丟失.學生編號12345身高SKIPIF1<0165170175170170體重SKIPIF1<05862SKIPIF1<06563(1)求表格中的SKIPIF1<0值;(2)已知公式SKIPIF1<0可以用來刻畫回歸的效果,請問學生的體重差異約有百分之多少是由身高引起的.(注:結果四舍五入取整數)28.(2022·全國·高三專題練習)2021年6月17日9時22分,我國酒泉衛(wèi)星發(fā)射中心用長征SKIPIF1<0遙十二運載火箭,成功將神舟十二號載人飛船送入預定軌道,順利將聶海勝、劉伯明、湯洪波3名航天員送入太空,發(fā)射取得圓滿成功,這標志著中國人首次進入自己的空間站.某公司負責生產的A型材料是神舟十二號的重要零件,該材料應用前景十分廣泛.該公司為了將A型材料更好地投入商用,擬對A型材料進行應用改造、根據市場調研與模擬,得到應用改造投入x(億元)與產品的直接收益y(億元)的數據統(tǒng)計如下:序號123456789101112x2346810132122232425y1522274048546068.56867.56665當SKIPIF1<0時,建立了y與x的兩個回歸模型:模型①:SKIPIF1<0,模型②:SKIPIF1<0;當SKIPIF1<0時,確定y與x滿足的線性回歸方程為SKIPIF1<0.(1)根據下列表格中的數據,比較當SKIPIF1<0時模型①,②的相關指數SKIPIF1<0的大小,并選擇擬合精度更高、更可靠的模型,預測對A型材料進行應用改造的投入為17億元時的直接收益;回歸模型模型①模型②回歸方程SKIPIF1<0SKIPIF1<0SKIPIF1<079.1320.2(2)為鼓勵科技創(chuàng)新,當應用改造的投入不少于20億元時,國家給予公司補貼5億元,以回歸方程為預測依據,根據(1)中選擇的擬合精度更高更可靠的模型,比較投入17億元與20億元時公司收益(直接收益+國家補貼)的大?。剑嚎坍嫽貧w效果的相關指數SKIPIF1<0,且當SKIPIF1<0越大時,回歸方程的擬合效果越好.SKIPIF1<0.用最小二乘法求線性回歸方程SKIPIF1<0的截距:SKIPIF1<0.29.(2021·河南·一模(文))近年來,政府相關部門引導鄉(xiāng)村發(fā)展旅游的同時,鼓勵農戶建設溫室大棚種植高品質農作物.為了解某農作物的大棚種植面積對種植管理成本的影響,甲,乙兩同學一起收集6家農戶的數據,進行回歸分析,得到兩個回歸摸型:模型①:SKIPIF1<0,模型②:SKIPIF1<0,對以上兩個回歸方程進行殘差分析,得到下表:種植面積SKIPIF1<0(畝)234579每畝種植管理成本SKIPIF1<0(百元)252421221614模型①估計值SKIPIF1<025.2723.6221.9717.0213.72殘差SKIPIF1<0-0.270.38-0.97-1.020.28模型②SKIPIF1<026.8420.1718.8317.3116.46SKIPIF1<0-1.840.833.17-1.31-2.46(1)將以上表格補充完整,并根據殘差平方和判斷哪個模型擬合效果更好;(2)視殘差SKIPIF1<0的絕對值超過1.5的數據視為異常數據,針對(1)中擬合效果較好的模型,剔除異常數據后,重新求回歸方程.附:SKIPIF1<0,SKIPIF1<0;SKIPIF1<030.(2021·全國·模擬預測)婺源位于江西省東北部,其境內古村落遍布鄉(xiāng)野,保存完整,生態(tài)優(yōu)美,物產豐富,擁有著油菜花之鄉(xiāng)的美譽,被譽為一顆鑲嵌在贛、浙、皖三省交界處的綠色明珠.為了調查某片實驗田3月份油菜花的生長高度,研究人員在當地隨機抽取了13株油菜花進行高度測量,所得數據如下:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.并通過繪制及觀察散點圖,選用兩種模型進行擬合:模型一:SKIPIF1<0,其中令SKIPIF1<0;模型二:SKIPIF1<0,其中令SKIPIF1<0.(1)求模型二的回歸方程;(2)試通過計算相關系數的大小,說明對于所給數據,哪一種模型更加合適.參考數據:SKIPIF1<0,SKIPIF1<0,SKIPIF1<0,SKIPIF1<0.附:對于一組數據SKIPIF1<0,SKIPIF1<0,…,SKIPIF1<0,其回歸方程SKIPIF1<0的斜率和截距的最小二乘估計分別為SKIPIF1<0,SKIPIF1<0,相關系數SKIPIF1<0.31.(2021·陜西·西安中學高三階段練習(文))我國為全面建設社會主義現代化國家,制定了從2021年到2025年的“十四五”規(guī)劃.某企業(yè)為響應國家號召,匯聚科研力量,加強科技創(chuàng)新,準備增加研發(fā)資金,現該企業(yè)為了解年研發(fā)資金投入額x(單位:億元)對年盈利額y(單位:億元)的影響,研究了“十二五”和“十三五”規(guī)劃發(fā)展期間近10年年研發(fā)資金投入額SKIPIF1<0和年盈利額SKIPIF1<0的數據.通過對比分析,建立了兩個函數模型:①SKIPIF1<0;②SKIPIF1<0,其中SKIPIF1<0均為常數,e為自然對數的底數.令SKIPIF1<0,SKIPIF1<0,經計算得如下數據:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0262156526805.36SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0112501302.612(1)請從相關系數的角度,分析哪一個模型擬合程度更好;(2)根據(1)的選擇及表中數據,建立y關于x的回歸方程(回歸系數精確到0.01).附:相關系數SKIPIF1<0,線性回歸直線方程SKIPIF1<0,其中附:SKIPIF1<0,SKIPIF1<0.32.(2021·四川·成都七中一模(文))某投資公司2012年至2021年每年的投資金額SKIPIF1<0(單位:萬元)與年利潤增量SKIPIF1<0(單位:萬元)的散點圖如圖:該投資公司為了預測2022年投資金額為20萬元時的年利潤增量,建立了SKIPIF1<0關于SKIPIF1<0的兩個回歸模型;模型①:由最小二乘公式可求得SKIPIF1<0與SKIPIF1<0的線性回歸方程:SKIPIF1<0;模型②:由圖中樣本點的分布,可以認為樣本點集中在由線:SKIPIF1<0的附近,對投資金額SKIPIF1<0做換元,令SKIPIF1<0,則SKIPIF1<0,且有SKIPIF1<0,(1)根據所給的統(tǒng)計量,求模型②中SKIPIF1<0關于SKIPIF1<0的回歸方程;(2)分別利用這兩個回歸模型,預測投資金額為20萬元時的年利潤增量(結果保留兩位小數);附:樣本SKIPIF1<0的最小乘估計公式為SKIPIF1<0;參考數據:SKIPIF1<0.33.(2021·云南師大附中高三階段練習(文))近年來,由于耕地面積的緊張,化肥的施用量呈增加趨勢.一方面,化肥的施用對糧食增產增收起到了關鍵作用,另一方面,也成為環(huán)境污染、空氣污染、土壤污染的重要來源之一如何合理地施用化肥,使其最大程度地促進糧食增產,減少對周圍環(huán)境的污染成為需要解決的重要問題研究糧食產量與化肥施用量的關系,成為解決上述問題的前提某研究團隊收集了10組化肥施用量和糧食畝產量的數據并對這些數據作了初步處理,得到了如圖所示的散點圖及一些統(tǒng)計量的值化肥施用量為SKIPIF1<0(單位:公斤),糧食畝產量為SKIPIF1<0(單位:百公斤).參考數據:SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<065091.552.51478.630.5151546.5表中SKIPIF1<0.(1)根據散點圖判斷,SKIPIF1<0與SKIPIF1<0,哪一個適宜作為糧食畝產量SKIPIF1<0關于化肥施用量SKIPIF1<0的回歸方程類型(給出判斷即可,不必說明理由);(2)根據(1)的判斷結果及表中數據,建立SKIPIF1<0關于SKIPIF1<0的回歸方程;(3)根據(2)的回歸方程,并預測化肥施用量為27公斤時,糧食畝產量SKIPIF1<0的值;附:①對于一組數據SKIPIF1<0,其回歸直線SKIPIF1<0的斜率和截距的最小二乘估計分別為SKIPIF1<0;②取SKIPIF1<0.34.(2021·河北·高三階段練習)《2021新銳品牌數字化運營白皮書》中,我國提出了新銳品牌的概念,全稱是國貨新銳品牌.對這個名稱進行拆解:國貨?新?銳.新有兩個層面,一是針對企業(yè)本身,指2011年后成立的品牌.二是針對消費者本身,開拓了新的消費場景(需求),形成了細分化的品類.銳:是在短期內實現大大高于傳統(tǒng)品牌的爆發(fā)式增長,并且占據了一定的消費者心智.如圖是11月份中國某信息網發(fā)布的我國SKIPIF1<0市2021年上半年新銳品牌人群用戶(新銳品牌人群,指在指定周期內瀏覽新銳品牌相關內容以及商品詳情頁的人群)性別分析數據.SKIPIF1<0市對購買家電類新銳品牌人群中隨機調查了100位男性顧客和100位女性顧客,統(tǒng)計出每位顧客購買家電消費金額,根據這些數據得到如下的頻數分布表:消費金額(元)SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0SKIPIF1<0女性顧客人數50301064男性顧客人數204024106(1)若以我國SKIPIF1<0市2021年上半年新銳品牌人群用戶性別分析數據作為SKIPIF1<0市抽取新銳品牌人群中性別概率,從SKIPIF1<0市新銳品牌人群中隨機抽取四人,SKIPIF1<0為四人中男性的人數,求SKIPIF1<0的概率分布列和期望.(2)根據SKIPIF1<0市統(tǒng)計購買家電消費金額數據頻數分布表,完成下列SKIPIF1<0列聯表,并根據列聯表,判斷是否有99%的把握認為購買家電類新銳品牌人群消費金額千元以上與性別有關?不超千元千元以上合計女性顧客男性顧客合計附:SKIPIF1<0,SKIPIF1<0SKIPIF1<00.0500.0100.001SKIPIF1<03.8416.63510.82835.(2022·全國·高三專題練習)某中學隨機抽查了SKIPIF1<0
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論