版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
專題5回歸分析例1.已知回歸方程y?A.﹣2 B.1 C.2 D.5例2.研究變量x,y得到一組樣本數據,進行回歸分析,有以下結論①殘差平方和越小的模型,擬合的效果越好;②用相關指數R2來刻畫回歸效果,R2越小說明擬合效果越好;③在回歸直線方程y?=?0.2x+0.8中,當解釋變量x每增加1個單位時,預報變量④若變量y和x之間的相關系數為r=﹣0.9462,則變量y和x之間的負相關很強.以上正確說法的是.例3.下列命題中,正確的命題有.①回歸直線y?=b?x+a②用相關指數R2來刻畫回歸效果,表示預報變量對解釋變量變化的貢獻率,R2越接近于1說明模型的擬合效果越好;③殘差圖中殘差點比較均勻的落在水平的帶狀區(qū)域中,說明選用的模型比較合適;④兩個模型中殘差平方和越大的模型的擬合效果越好.例4.下列命題:①相關指數R2越小,則殘差平方和越大,模型的擬合效果越好.②對分類變量X與Y的隨機變量K2的觀測值k來說,k越小,“X與Y有關系”可信程度越大.③殘差點比較均勻地落在水平帶狀區(qū)域內,帶狀區(qū)域越寬,說明模型擬合精度越高.④兩個隨機變量相關性越強,則相關系數的絕對值越接近0.其中錯誤命題的個數為.例5.垃圾是人類日常生活和生產中產生的廢棄物,由于排出量大,成分復雜多樣,且具有污染性,所以需要無害化、減量化處理.某市為調査產生的垃圾數量,采用簡單隨機抽樣的方法抽取20個縣城進行了分析,得到樣本數據(xi,yi)(i=1,2,……,20),其中xi和yi分別表示第i個縣城的人口(單位:萬人)和該縣年垃圾產生總量(單位:噸),并計算得i=120xi=80,i=120yi=4000,i=120(xi?x)2=80,i=120(y(1)請用相關系數說明該組數據中y與x之間的關系可用線性回歸模型進行擬合;(2)求y關于x的線性回歸方程;(3)某科研機構研發(fā)了兩款垃圾處理機器,如表是以往兩款垃圾處理機器的使用年限(整年)統(tǒng)計表:使用年限臺數款式1年2年3年4年5年甲款520151050乙款152010550某環(huán)保機構若考慮購買其中一款垃圾處理器,以使用年限的頻率估計概率.根據以往經驗估計,該機構選擇購買哪一款垃圾處理機器,才能使用更長久?參考公式:相關系數r=i=1對于一組具有線性相關關系的數據(xi,yi)(i=1,2,……,n),其回歸直線y?=b?x+a例6.某基地蔬菜大棚采用水培、無土栽培方式種植各類蔬菜.據統(tǒng)計該基地的西紅柿增加量y(百斤)與使用某種液體肥料x(千克)之間對應數據為如圖所示的折線圖.(1)依據數據的折線圖,請計算相關系數r(精確到0.01),并以此判定是否可用線性回歸模型擬合y與x的關系?若是請求出回歸直線方程,若不是請說明理由;(2)過去50周的資料顯示,該地周光照量X(小時)都在30小時以上,其中不足50小時的周數有5周,不低于50小時且不超過70小時的周數有35周,超過70小時的周數有10周.蔬菜大棚對光照要求較大,某光照控制儀商家為該基地提供了部分光照控制儀,但每周光照控制儀最多可運行臺數受周光照量X限制,并有如表關系:周光照量X(單位:小時)30<X<5050≤X≤70n≥2光照控制儀最多可運行臺數542若某臺光照控制儀運行,則該臺光照控制儀周利潤為3000元;若某臺光照控制儀未運行,則該臺光照控制儀周虧損1000元.若商家安裝了5臺光照控制儀,求商家在過去50周每周利潤的平均值.附:對于一組數據(x1,y1),(x2,y2),……,(xn,yn),其相關系數公式r=i=1n(xi?x)(yi例7.湖南省從2021年開始將全面推行“3+1+2”的新高考模式,新高考對化學、生物、地理和政治等四門選考科目,制定了計算轉換T分(即記入高考總分的分數)的“等級轉換賦分規(guī)則”(詳見附1和附2),具體的轉換步驟為:①原始分Y等級轉換;②原始分等級內等比例轉換賦分.某校的一次年級統(tǒng)考中,政治、生物兩選考科目的原始分分布如表:等級ABCDE比例約15%約35%約35%約13%約2%政治學科各等級對應的原始分區(qū)間[81,98][72,80][66,71][63,65][60,62]生物學科各等級對應的原始分區(qū)間[90,100][77,89][69,76][66,68][63,65]現從政治、生物兩學科中分別隨機抽取了20個原始分成績數據,作出莖葉圖:(1)根據莖葉圖,分別求出政治成績的中位數和生物成績的眾數;(2)該校的甲同學選考政治學科,其原始分為82分,乙同學選考生物學科,其原始分為91分,根據賦分轉換公式,分別求出這兩位同學的轉化分;(3)根據生物成績在等級B的6個原始分和對應的6個轉化分,得到樣本數據(Yi,Ti),請計算生物原始分Yi與生物轉換分Ti之間的相關系數,并根據這兩個變量的相關系數談談你對新高考這種“等級轉換賦分法”的看法.附1:等級轉換的等級人數占比與各等級的轉換分賦分區(qū)間等級ABCDE原始分從高到低排序的等級人數占比約15%約35%約35%約13%約2%轉換分T的賦分區(qū)間[86,100][71,85][56,70][41,55][30,40]附2:計算轉換分T的等比例轉換賦分公式:Y2?YY?Y1=T2?TT?T1.(其中:Y1,Y附3:i=16(Yi?Y)(Ti?T)=74,i=1例8.某市房管局為了了解該市市民2018年1月至2019年1月期間買二手房情況,首先隨機抽樣其中200名購房者,并對其購房面積m(單位:平方米,60≤m≤130)進行了一次調查統(tǒng)計,制成了如圖1所示的頻率分布直方圖,接著調查了該市2018年1月至2019年1月期間當月在售二手房均價y(單位:萬元/平方米),制成了如圖2所示的散點圖(圖中月份代碼1﹣13分別對應2018年1月至2019年1月).(Ⅰ)試估計該市市民的購房面積的中位數m0;(Ⅱ)現采用分層抽樣的方法從購房面積位于[110,130]的40位市民中隨機抽取4人,再從這4人中隨機抽取2人,求這2人的購房面積恰好有一人在[120,130]的概率;(Ⅲ)根據散點圖選擇y?=a?+b?y?y?i=1130.0005910.000164i=1130.006050請利用相關指數R2判斷哪個模型的擬合效果更好,并用擬合效果更好的模型預測出2019年12月份的二手房購房均價(精確到0.001).【參考數據】ln2≈0.69,ln3≈1.10,ln23≈3.14,ln25≈3.22,2≈141,3≈1.73,【參考公式】R2例9.某汽車公司擬對“東方紅”款高端汽車發(fā)動機進行科技改造,根據市場調研與模擬,得到科技改造投入x(億元)與科技改造直接收益y(億元)的數據統(tǒng)計如表:x2346810132122232425y1322314250565868.56867.56666當0<x≤16時,建立了y與x的兩個回歸模型:模型①:y?=4.1x+11.8;模型②:y?=21.3x?14.4;當x>16時,確定(Ⅰ)根據下列表格中的數據,比較當0<x≤16時模型①、②的相關指數R2,并選擇擬合精度更高、更可靠的模型,預測對“東方紅”款汽車發(fā)動機科技改造的投入為16億元時的直接收益.回歸模型模型①模型②回歸方程y?y?i=17182.479.2(附:刻畫回歸效果的相關指數R2=1?i=1(Ⅱ)為鼓勵科技創(chuàng)新,當科技改造的投入不少于20億元時,國家給予公司補貼收益10億元,以回歸方程為預測依據,比較科技改造投入16元與20億元時公司實際收益的大小;(附:用最小二乘法求線性回歸方程y?=b?x+(Ⅲ)科技改造后,“東方紅”款汽車發(fā)動機的熱效率X大幅提高,X服從正態(tài)分布N(0.52,0.012),公司對科技改造團隊的獎勵方案如下:若發(fā)動機的熱效率不超過50%但不超過53%,不予獎勵;若發(fā)動機的熱效率超過50%但不超過53%,每臺發(fā)動機獎勵2萬元;若發(fā)動機的熱效率超過53%,每臺發(fā)動機獎勵4萬元.求每臺發(fā)動機獲得獎勵的數學期望.(附:隨機變量ξ服從正態(tài)分布N(μ,σ2),則P(μ﹣σ<ξ<μ+σ)=0.6827,P(μ﹣2σ<ξ<μ+2σ)=0.9545.)例10.某高中數學建模興趣小組的同學為了研究所在地區(qū)男高中生的身高與體重的關系,從若干個高中男學生中抽取了1000個樣本,得到如下數據.數據一:身高在[170,180)(單位:cm)的體重頻數統(tǒng)計體重(kg)[50,55)[55,60)[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人數206010010080201010數據二:身高所在的區(qū)間含樣本的個數及部分數據身高x(cm)[140,150)[150,160)[160﹣170)[170﹣180)[180﹣190)平均體重y(kg)4553.66075(Ⅰ)依據數據一將下面男高中生身高在[170﹣180)(單位:cm)體重的頻率分布直方圖補充完整,并利用頻率分布直方圖估計身高在[170﹣180)(單位:cm)的中學生的平均體重;(保留小數點后一位)(Ⅱ)依據數據一、二,計算身高(取值為區(qū)間中點)和體重的相關系數約為0.99,能否用線性回歸直線來刻畫中學生身高與體重的相關關系,請說明理由;若能,求出該回歸直線方程;(Ⅲ)說明殘差平方和或相關指數R2與線性回歸模型擬合效果之間關系.(只需寫出結論,不需要計算)參考公式:b?=i=1參考數據:(1)145×45+155×53.6+165×60+185×75=38608;(2)1452+1552+1652+1752+1852﹣5×1652=1000.(3)663×175=116025,664×175=116200,665×175=116375.(4)728×165=120120.例11.2019年的“金九銀十”變成“銅九鐵十”,國各地房價“跳水”嚴重,但某地二手房交易卻“逆市”而行.如圖是該地某小區(qū)2018年11月至2019年1月間,當月在售二手房均價(單位:萬元/平方米)的散點圖.(圖中月份代碼1~13分別對應2018年11月~2019年11月)根據散點圖選擇y=a+bx和y=c+dlnx兩個模型進行擬合,經過數據處理得到兩個回歸方程分別為y^=0.9369+0.0285y^y^i=1130.0005910.000164i=1130.006050(1)請利用相關指數R2判斷哪個模型的擬合效果更好;(2)某位購房者擬于2020年4月購買這個小區(qū)m(70≤m≤160)平方米的二手房(欲購房為其家庭首套房).若購房時該小區(qū)所有住房的房產證均已滿2但未滿5年,請你利用(1)中擬合效果更好的模型解決以下問題:(i)估算該購房者應支付的購房金額;(購房金額=房款+稅費,房屋均價精確到0.001萬元/平方米)(ii)若該購房者擬用不超過100萬元的資金購買該小區(qū)一套二手房,試估算其可購買的最大面積.(精確到1平方米)附注:根據有關規(guī)定,二手房交易需要繳納若干項稅費,稅費是按房屋的計稅價格(計稅價格=房款)進行征收的.房產證滿2年但未滿5年的征收方式如下:首套面積90平方米以內(含90平方米)為1%;首套面積90平方米以上且140平方米以內(含140平方米)1.5%;首套面積140平方米以上或非首套為3%.參考數據:ln2≈0.69,ln3≈1.10,ln17≈2.83,ln19≈2.94,2≈1.41,3≈1.73,17≈4.12參考公式:相關指數R2例12.某新興科技公司為了確定新研發(fā)的產品下一季度的營銷計劃,需了解月宣傳費x(單位:萬元)對月銷售量y(單位:千件)的影響,收集了2020年3月至2020年8月共6個月的月宣傳費x和月銷售量y的數據如表:月份345678宣傳費x5678910月銷售量y0.43.55.27.08.610.7現分別用模型①y?=b?(模型①和模型②的殘差分別為e?1和x5678910y0.43.55.37.08.610.7e?﹣0.60.540.280.12﹣0.24﹣0.1e?﹣0.631.712.101.63﹣0.7﹣5.42(1)根據上表的殘差數據,應選擇哪個模型來擬合月宣傳費x與月銷售量y的關系較為合適,簡要說明理由;(2)為了優(yōu)化模型,將(1)中選擇的模型殘差絕對值最大所對應的一組數據(x,y)剔除,根據剩余的5組數據,求該模型的回歸方程,并預測月宣傳費為12萬元時,該公司的月銷售量.(剔除數據前的參考數據:x=7.5,y=5.9,i=16xiyi=299.8,i=16xi2參考公式:b?=i=1例13.新型冠狀病毒肺炎COVID﹣19疫情發(fā)生以來,在世界各地逐漸蔓延.在全國人民的共同努力和各級部門的嚴格管控下,我國的疫情已經得到了很好的控制.然而,小王同學發(fā)現,每個國家在疫情發(fā)生的初期,由于認識不足和措施不到位,感染人數都會出現快速的增長.如表是小王同學記錄的某國連續(xù)8天每日新型冠狀病毒感染確診的累計人數.日期代碼x12345678累計確診人數y481632517197122為了分析該國累計感染人數的變化趨勢,小王同學分別用兩種模型:①y?②y?=dx+c對變量x和y的關系進行擬合,得到相應的回歸方程并進行殘差分析,殘差圖如下(注:殘差ei=yi?yi):經過計算得它i=18((1)根據殘差圖,比較模型①,②的擬合效果,應該選擇哪個模型?并簡要說明理由;(2)根據(1)問選定的模型求出相應的回歸方程(系數均保留兩位小數);(3)由于時差,該國截止第9天新型冠狀病毒感染確診的累計人數尚未公布.小王同學認為,如果防疫形勢沒有得到明顯改善,在數據公布之前可以根據他在(2)問求出的回歸方程來對感染人數做出預測,那么估計該地區(qū)第9天新型冠狀病毒感染確診的累計人數是多少?附:回歸直線的斜率和截距的最小二乘估計公式分別為:b?=i=1例14.H市某企業(yè)堅持以市場需求為導向,合理配置生產資源,不斷改革、探索銷售模式.下表是該企業(yè)每月生產的一種核心產品的產量x(噸)與相應的生產總成本y(萬元)的五組對照數據.產量x(件)12345生產總成本y(萬元)3781012(Ⅰ)根據上達數據,若用最小二乘法進行線性模擬,試求y關于x的線性回歸方程y?參考公式:b?=i=1(Ⅱ)記第(Ⅰ)問中所求y與x的線性回歸方程y?=b?x+a?為模型①,同時該企業(yè)科研人員利用計算機根據數據又建立了y與x請完成模型①的殘差表與殘差圖,并根據殘差圖,判斷哪一個模型更適宜作為y關于x的回歸方程?并說明理由;(Ⅲ)根據模型①中y與x的線性回歸方程,預測產量為6噸時生產總成本為多少萬元?例15.為了解某企業(yè)生產的某產品的年利潤與年廣告投入的關系,該企業(yè)對最近一些相關數據進行了調查統(tǒng)計,得出相關數據見表:年廣告投入x(萬元)23456年利潤y(十萬元)346811根據以上數據,研究人員分別借助甲.乙兩種不同的回歸模型,得到兩個回歸方程,方程甲:方程甲:y?(1)=b?(x﹣1)2+2.75,方程乙:y?(1)求b?(結果精確到0.01)與c(2)為了評價兩種模型的擬合效果,完成以下任務.①完成下表(備注:ei=yi?yi,ei稱為相應于點(x年廣告投入x(萬元)23456年利潤y(十萬元)346811模型甲估計值yi殘差ei模型乙估計值yi殘差ei②分別計算模型甲與模型乙的殘差平方和Q1及Q2,并通過比較Q1,Q2的大小,判斷哪個模型擬合效果更好.專題5回歸分析例1.已知回歸方程y?A.﹣2 B.1 C.2 D.5【解析】解:當x=1時,y?=5∴方程在樣本(1,4)處的殘差是4﹣6=﹣2.故選:A.例2.研究變量x,y得到一組樣本數據,進行回歸分析,有以下結論①殘差平方和越小的模型,擬合的效果越好;②用相關指數R2來刻畫回歸效果,R2越小說明擬合效果越好;③在回歸直線方程y?=?0.2x+0.8中,當解釋變量x每增加1個單位時,預報變量④若變量y和x之間的相關系數為r=﹣0.9462,則變量y和x之間的負相關很強.以上正確說法的是①③④.【解析】解:①可用殘差平方和判斷模型的擬合效果,殘差平方和越小,模型的擬合效果越好,故①正確;②用相關指數R2來刻畫回歸效果,R2越大說明擬合效果越好,故②錯誤;③在回歸直線方程y?=?0.2x+0.8中中,當解釋變量x每增加1個單位時,預報變量y?④若變量y和x之間的相關系數為r=﹣0.9462,r的絕對值趨向于1,則變量y和x之間的負相關很強,故④正確.故答案為:①③④.例3.下列命題中,正確的命題有②③.①回歸直線y?=b?x+a②用相關指數R2來刻畫回歸效果,表示預報變量對解釋變量變化的貢獻率,R2越接近于1說明模型的擬合效果越好;③殘差圖中殘差點比較均勻的落在水平的帶狀區(qū)域中,說明選用的模型比較合適;④兩個模型中殘差平方和越大的模型的擬合效果越好.【解析】解:①回歸直線y?=b?x+a?恒過樣本點中心(②用相關指數R2來刻畫回歸效果,表示預報變量對解釋變量變化的貢獻率,R2越接近于1說明模型的擬合效果越好,正確;③殘差圖中殘差點比較均勻的落在水平的帶狀區(qū)域中,說明選用的模型比較合適,正確;④兩個模型中殘差平方和越大的模型的擬合效果越差.故④錯誤,故正確的是②③,故答案為:②③例4.下列命題:①相關指數R2越小,則殘差平方和越大,模型的擬合效果越好.②對分類變量X與Y的隨機變量K2的觀測值k來說,k越小,“X與Y有關系”可信程度越大.③殘差點比較均勻地落在水平帶狀區(qū)域內,帶狀區(qū)域越寬,說明模型擬合精度越高.④兩個隨機變量相關性越強,則相關系數的絕對值越接近0.其中錯誤命題的個數為4.【解析】解:對于①,相關指數R2越小,則殘差平方和越大,此時模型的擬合效果越差,所以①錯誤;對于②,對分類變量X與Y的隨機變量K2的觀測值k來說,k越小,“X與Y有關系”可信程度越小,所以②錯誤;對于③,殘差點比較均勻地落在水平帶狀區(qū)域內,帶狀區(qū)域越寬,說明模型擬合精度越低,所以③錯誤;對于④,兩個隨機變量相關性越強,則相關系數的絕對值越接近1,所以④錯誤.綜上知,錯誤命題的序號是①②③④,共4個.故答案為:4.例5.垃圾是人類日常生活和生產中產生的廢棄物,由于排出量大,成分復雜多樣,且具有污染性,所以需要無害化、減量化處理.某市為調査產生的垃圾數量,采用簡單隨機抽樣的方法抽取20個縣城進行了分析,得到樣本數據(xi,yi)(i=1,2,……,20),其中xi和yi分別表示第i個縣城的人口(單位:萬人)和該縣年垃圾產生總量(單位:噸),并計算得i=120xi=80,i=120yi=4000,i=120(xi?x)2=80,i=120(y(1)請用相關系數說明該組數據中y與x之間的關系可用線性回歸模型進行擬合;(2)求y關于x的線性回歸方程;(3)某科研機構研發(fā)了兩款垃圾處理機器,如表是以往兩款垃圾處理機器的使用年限(整年)統(tǒng)計表:使用年限臺數款式1年2年3年4年5年甲款520151050乙款152010550某環(huán)保機構若考慮購買其中一款垃圾處理器,以使用年限的頻率估計概率.根據以往經驗估計,該機構選擇購買哪一款垃圾處理機器,才能使用更長久?參考公式:相關系數r=i=1對于一組具有線性相關關系的數據(xi,yi)(i=1,2,……,n),其回歸直線y?=b?x+a【解析】解:(1)由題意知相關系數r=i=1因為y與x的相關系數接近1,所以y與x之間具有較強的線性相關關系,可用線性回歸模型進行擬合.(2)由題意可得,b?=i=1所以y?(3)以頻率估計概率,購買一臺甲款垃圾處理機器節(jié)約政府支持的垃圾處理費用X(單位:萬元)的分布列為X﹣50050100P0.10.40.30.2E(X)=﹣50×0.1+0×0.4+50×0.3+100×0.2=30(萬元)購買一臺乙款垃圾處理機器節(jié)約政府支持的垃圾處理費用Y(單位:萬元)的分布列為:Y﹣302070120P0.30.40.20.1E(Y)=﹣30×0.3+20×0.4+70×0.2+120×0.1=25(萬元)因為E(X)>E(Y),所以該縣城選擇購買一臺甲款垃圾處理機器更劃算.例6.某基地蔬菜大棚采用水培、無土栽培方式種植各類蔬菜.據統(tǒng)計該基地的西紅柿增加量y(百斤)與使用某種液體肥料x(千克)之間對應數據為如圖所示的折線圖.(1)依據數據的折線圖,請計算相關系數r(精確到0.01),并以此判定是否可用線性回歸模型擬合y與x的關系?若是請求出回歸直線方程,若不是請說明理由;(2)過去50周的資料顯示,該地周光照量X(小時)都在30小時以上,其中不足50小時的周數有5周,不低于50小時且不超過70小時的周數有35周,超過70小時的周數有10周.蔬菜大棚對光照要求較大,某光照控制儀商家為該基地提供了部分光照控制儀,但每周光照控制儀最多可運行臺數受周光照量X限制,并有如表關系:周光照量X(單位:小時)30<X<5050≤X≤70n≥2光照控制儀最多可運行臺數542若某臺光照控制儀運行,則該臺光照控制儀周利潤為3000元;若某臺光照控制儀未運行,則該臺光照控制儀周虧損1000元.若商家安裝了5臺光照控制儀,求商家在過去50周每周利潤的平均值.附:對于一組數據(x1,y1),(x2,y2),……,(xn,yn),其相關系數公式r=i=1n(xi?x)(yi【解析】解:(1)由已知數據可得x=2+4+5+6+85因為i=15i=15i=15所以相關系數r=i=1因為r>0.75,所以可用線性回歸模型擬合y與x的關系,因為b?=i=1n(x(2)記商家周總利潤為Y元,由條件可得在過去50周里:X>70時,共有10周,只有2臺光照控制儀運行,周總利潤Y=2×3000﹣3×1000=3000元,當50≤X≤70時,共有35周,有4臺光照控制儀運行,周總利潤Y=4×3000﹣1×1000=11000元,當X<50時,共有5周,5臺光照控制儀都運行,周總利潤Y=5×3000=15000元,所以過去50周每周利潤的平均值Y=所以商家在過去50周每周利潤的平均值為9800元.例7.湖南省從2021年開始將全面推行“3+1+2”的新高考模式,新高考對化學、生物、地理和政治等四門選考科目,制定了計算轉換T分(即記入高考總分的分數)的“等級轉換賦分規(guī)則”(詳見附1和附2),具體的轉換步驟為:①原始分Y等級轉換;②原始分等級內等比例轉換賦分.某校的一次年級統(tǒng)考中,政治、生物兩選考科目的原始分分布如表:等級ABCDE比例約15%約35%約35%約13%約2%政治學科各等級對應的原始分區(qū)間[81,98][72,80][66,71][63,65][60,62]生物學科各等級對應的原始分區(qū)間[90,100][77,89][69,76][66,68][63,65]現從政治、生物兩學科中分別隨機抽取了20個原始分成績數據,作出莖葉圖:(1)根據莖葉圖,分別求出政治成績的中位數和生物成績的眾數;(2)該校的甲同學選考政治學科,其原始分為82分,乙同學選考生物學科,其原始分為91分,根據賦分轉換公式,分別求出這兩位同學的轉化分;(3)根據生物成績在等級B的6個原始分和對應的6個轉化分,得到樣本數據(Yi,Ti),請計算生物原始分Yi與生物轉換分Ti之間的相關系數,并根據這兩個變量的相關系數談談你對新高考這種“等級轉換賦分法”的看法.附1:等級轉換的等級人數占比與各等級的轉換分賦分區(qū)間等級ABCDE原始分從高到低排序的等級人數占比約15%約35%約35%約13%約2%轉換分T的賦分區(qū)間[86,100][71,85][56,70][41,55][30,40]附2:計算轉換分T的等比例轉換賦分公式:Y2?YY?Y1=T2?TT?T1.(其中:Y1,Y附3:i=16(Yi?Y)(Ti?T)=74,i=1【解析】解:(1)根據莖葉圖知,政治成績的中位數為72,生物成績的眾數為73;(2)甲同學選考政治學科的等級為A,由轉換賦分公式:98?8282?81=100?T乙同學選考生物學科的等級為A,由賦分轉換公式:100?9191?90=100?T所以甲、乙兩位同學的轉換分都是87分.(3)由題意知,r=i=1說法1:等級轉換賦分公平,因為相關系數十分接近1,接近函數關系,因此高考這種“等級轉換賦分”具有公平性與合理性.說法2:等級轉換賦分法不公平,在同一等級內,原始分與轉化分是確定的函數關系,理論上原始分與轉化分的相關系數為1,在實際賦分過程中由于數據的四舍五入,使得實際的轉化分與應得的轉化分有一定的誤差,極小部分同學賦分后會出現偏高或偏低的現象.(只要說法有道理,都可以得分).例8.某市房管局為了了解該市市民2018年1月至2019年1月期間買二手房情況,首先隨機抽樣其中200名購房者,并對其購房面積m(單位:平方米,60≤m≤130)進行了一次調查統(tǒng)計,制成了如圖1所示的頻率分布直方圖,接著調查了該市2018年1月至2019年1月期間當月在售二手房均價y(單位:萬元/平方米),制成了如圖2所示的散點圖(圖中月份代碼1﹣13分別對應2018年1月至2019年1月).(Ⅰ)試估計該市市民的購房面積的中位數m0;(Ⅱ)現采用分層抽樣的方法從購房面積位于[110,130]的40位市民中隨機抽取4人,再從這4人中隨機抽取2人,求這2人的購房面積恰好有一人在[120,130]的概率;(Ⅲ)根據散點圖選擇y?=a?+b?y?y?i=1130.0005910.000164i=1130.006050請利用相關指數R2判斷哪個模型的擬合效果更好,并用擬合效果更好的模型預測出2019年12月份的二手房購房均價(精確到0.001).【參考數據】ln2≈0.69,ln3≈1.10,ln23≈3.14,ln25≈3.22,2≈141,3≈1.73,【參考公式】R2【解析】解:(I)由頻率分布直方圖,可得,前三組頻率和為0.05+0.1+0.2=0.35,前四組頻率和為0.05+0.1+0.2+025=0.6,故中位數出現在第四組,且m0(Ⅱ)設從位于[110,120)的市民中抽取x人,從位于[120,130]的市民中抽取y人,由分層抽樣可知:440=x30=在抽取的4人中,記3名位于[11,120)的市民為A1,A2,A3,位于[120,130]的市民為B則所有抽樣情況為:(A1,A2),(A1,A3),(A1,B),(A2,A3),(A2,B),(A3,B)共6種.而其中恰有一人在位于購房面積[120,130]的情況共有3種,故所求概率P=3(III)設模型y?=0.9369+0.0285x和y?=0.955+0.0306lnx則R12=1?顯然R1故模型y?由2019年12月份對應的代碼為24,則y?例9.某汽車公司擬對“東方紅”款高端汽車發(fā)動機進行科技改造,根據市場調研與模擬,得到科技改造投入x(億元)與科技改造直接收益y(億元)的數據統(tǒng)計如表:x2346810132122232425y1322314250565868.56867.56666當0<x≤16時,建立了y與x的兩個回歸模型:模型①:y?=4.1x+11.8;模型②:y?=21.3x?14.4;當x>16時,確定(Ⅰ)根據下列表格中的數據,比較當0<x≤16時模型①、②的相關指數R2,并選擇擬合精度更高、更可靠的模型,預測對“東方紅”款汽車發(fā)動機科技改造的投入為16億元時的直接收益.回歸模型模型①模型②回歸方程y?y?i=17182.479.2(附:刻畫回歸效果的相關指數R2=1?i=1(Ⅱ)為鼓勵科技創(chuàng)新,當科技改造的投入不少于20億元時,國家給予公司補貼收益10億元,以回歸方程為預測依據,比較科技改造投入16元與20億元時公司實際收益的大??;(附:用最小二乘法求線性回歸方程y?=b?x+(Ⅲ)科技改造后,“東方紅”款汽車發(fā)動機的熱效率X大幅提高,X服從正態(tài)分布N(0.52,0.012),公司對科技改造團隊的獎勵方案如下:若發(fā)動機的熱效率不超過50%但不超過53%,不予獎勵;若發(fā)動機的熱效率超過50%但不超過53%,每臺發(fā)動機獎勵2萬元;若發(fā)動機的熱效率超過53%,每臺發(fā)動機獎勵4萬元.求每臺發(fā)動機獲得獎勵的數學期望.(附:隨機變量ξ服從正態(tài)分布N(μ,σ2),則P(μ﹣σ<ξ<μ+σ)=0.6827,P(μ﹣2σ<ξ<μ+2σ)=0.9545.)【解析】解:(Ⅰ)由表格中的數據,有182.4>79.2,即182.4i=1∴模型①的R2小于模型②的R2,說明模型②的刻畫效果更好.∴當x=16億元時,科技改造直接收益的預測值為y?(Ⅱ)由已知可得,x?20=0.5+2+3.5+4+55y?60=8.5+8+7.5+6+65∴a?∴當x>16億元時,y與x滿足線性回歸方程y?當x=20億元時,科技改造直接收益的預測值為y?∴當x=20億元時,實際收益的預測值為69.3+10=79.3億元>70.8億元.∴科技改造投入20億元時,公司的實際收益更大;(Ⅲ)∵P(0.52﹣0.02<X<0.52+0.02)=0.9545,∴P(X>0.50)=1+0.95452=0.97725,P(X∵P(0.52﹣0.01<X<0.52+0.01)=0.6827,∴P(X>0.53)=1?0.6827∴P(0.50<X≤0.53)=0.97725﹣0.15865=0.8186.設每臺發(fā)動機獲得的獎勵為Y(萬元),則Y的分布列為:Y024P0.022750.81860.15865∴每臺發(fā)動機獲得的獎勵的數學期望為:E(Y)=0×0.02275+2×0.8186+4×0.15865=2.2718(萬元).例10.某高中數學建模興趣小組的同學為了研究所在地區(qū)男高中生的身高與體重的關系,從若干個高中男學生中抽取了1000個樣本,得到如下數據.數據一:身高在[170,180)(單位:cm)的體重頻數統(tǒng)計體重(kg)[50,55)[55,60)[60,65)[65,70)[70,75)[75,80)[80,85)[85,90)人數206010010080201010數據二:身高所在的區(qū)間含樣本的個數及部分數據身高x(cm)[140,150)[150,160)[160﹣170)[170﹣180)[180﹣190)平均體重y(kg)4553.66075(Ⅰ)依據數據一將下面男高中生身高在[170﹣180)(單位:cm)體重的頻率分布直方圖補充完整,并利用頻率分布直方圖估計身高在[170﹣180)(單位:cm)的中學生的平均體重;(保留小數點后一位)(Ⅱ)依據數據一、二,計算身高(取值為區(qū)間中點)和體重的相關系數約為0.99,能否用線性回歸直線來刻畫中學生身高與體重的相關關系,請說明理由;若能,求出該回歸直線方程;(Ⅲ)說明殘差平方和或相關指數R2與線性回歸模型擬合效果之間關系.(只需寫出結論,不需要計算)參考公式:b?=i=1參考數據:(1)145×45+155×53.6+165×60+185×75=38608;(2)1452+1552+1652+1752+1852﹣5×1652=1000.(3)663×175=116025,664×175=116200,665×175=116375.(4)728×165=120120.【解析】解:(1)身高在[170,180)的總人數為:20+60+100+100+80+20+10+10=400,體重在[55﹣60)的頻率為:60400體重在[70﹣75)的頻率為:80400平均體重為:52.5×0.05+57.5×0.15+62.5×0.25+67.5×0.25+72.5×0.2+77.5×0.05+82.5×0.025+87.5×0.025≈66.4,(2)因為r=0.99→1,線性相關很強,故可以用線性回歸直線來刻畫中學生身高與體重的相關,x=145+155+165+175+1855b?a?所以回歸直線方程為:y?(3)殘差平方和越小或相關指數R2越接近于1,線性回歸模型擬合效果越好.例11.2019年的“金九銀十”變成“銅九鐵十”,國各地房價“跳水”嚴重,但某地二手房交易卻“逆市”而行.如圖是該地某小區(qū)2018年11月至2019年1月間,當月在售二手房均價(單位:萬元/平方米)的散點圖.(圖中月份代碼1~13分別對應2018年11月~2019年11月)根據散點圖選擇y=a+bx和y=c+dlnx兩個模型進行擬合,經過數據處理得到兩個回歸方程分別為y^=0.9369+0.0285y^y^i=1130.0005910.000164i=1130.006050(1)請利用相關指數R2判斷哪個模型的擬合效果更好;(2)某位購房者擬于2020年4月購買這個小區(qū)m(70≤m≤160)平方米的二手房(欲購房為其家庭首套房).若購房時該小區(qū)所有住房的房產證均已滿2但未滿5年,請你利用(1)中擬合效果更好的模型解決以下問題:(i)估算該購房者應支付的購房金額;(購房金額=房款+稅費,房屋均價精確到0.001萬元/平方米)(ii)若該購房者擬用不超過100萬元的資金購買該小區(qū)一套二手房,試估算其可購買的最大面積.(精確到1平方米)附注:根據有關規(guī)定,二手房交易需要繳納若干項稅費,稅費是按房屋的計稅價格(計稅價格=房款)進行征收的.房產證滿2年但未滿5年的征收方式如下:首套面積90平方米以內(含90平方米)為1%;首套面積90平方米以上且140平方米以內(含140平方米)1.5%;首套面積140平方米以上或非首套為3%.參考數據:ln2≈0.69,ln3≈1.10,ln17≈2.83,ln19≈2.94,2≈1.41,3≈1.73,17≈4.12參考公式:相關指數R2【解析】解:(1)模型一中,y?相關指數為R2模型二中,y?相關指數為R2∴相關指數較大的模型二擬合效果好些.(2)通過散點圖確定2020年4月對應的x=18,代入(1)中擬合效果更好的模型二,代入計算y?=0.9554+0.0306×(ln2+2ln3)=0.9554+0.0306×(0.69+2×1.10)≈1.044(萬元/平方米),則2020年4月份二手房均價的預測值為1.044(萬元/平方米).(i)設該購房者應支付的購房金額h萬元,因為稅費中淵方只需繳納契稅,①當70?m?90時,契稅為計稅價格的1%,故h=m×1.044×(1%+1)=1.05444m;②當90<m?144時,契稅為計稅價格的1.5%,故h=m×1.044×(1.5%+1)=1.05966m;③當144<m?160時,契稅為計稅價格的3%,故h=m×1.044×(3%+1)=1.07532m;∴?=1.05444m,70?m?90∴當70?m?90時購房金額為1.05444m萬元,當90<m?144時購房金額為1.05966m萬元,當144<m?160時購房金額為1.07532m萬元.(ii)設該購房者可購買該小區(qū)二手房的最大面積為t平方米,由(i)知,當70?m?90時,應支付的購房金額為1.05444t,又1.05444t?1.05444×90<100,又因為房屋均價約為1.044萬元/平方米,所以t<100,所以90?t<100,由1.05966t?100,解得t?1001.05966,且所以該購房者可購買該小區(qū)二手房的最大面積為94平方米.例12.某新興科技公司為了確定新研發(fā)的產品下一季度的營銷計劃,需了解月宣傳費x(單位:萬元)對月銷售量y(單位:千件)的影響,收集了2020年3月至2020年8月共6個月的月宣傳費x和月銷售量y的數據如表:月份345678宣傳費x5678910月銷售量y0.43.55.27.08.610.7現分別用模型①y?=b?(模型①和模型②的殘差分別為e?1和x5678910y0.43.55.37.08.610.7e?﹣0.60.540.280.12﹣0.24﹣0.1e?﹣0.631.712.101.63﹣0.7﹣5.42(1)根據上表的殘差數據,應選擇哪個模型來擬合月宣傳費x與月銷售量y的關系較為合適,簡要說明理由;(2)為了優(yōu)化模型,將(1)中選擇的模型殘差絕對值最大所對應的一組數據(x,y)剔除,根據剩余的5組數據,求該模型的回歸方程,并預測月宣傳費為12萬元時,該公司的月銷售量.(剔除數據前的參考數據:x=7.5,y=5.9,i=16xiyi=299.8,i=16xi2參考公式:b?=i=1【解析】解:(1)應選擇模型①,因為模型①每組數據對應的殘差絕對值都比模型②的小,殘差波動小,殘差點比較均勻地落在水平的帶狀區(qū)域內,說明擬合精度高.(2)由(1)知,需剔除第一組數據,則剔除后的x=7.5×6?555xy=280i=15x∴b?=i=1得①的回歸方程為y?則當x=12時,y?故月宣傳費為12萬元時,該公司的月銷售量為14.12千件.例13.新型冠狀病毒肺炎COVID﹣19疫情發(fā)生以來,在世界各地逐漸蔓延.在全國人民的共同努力和各級部門的嚴格管控下,我國的疫情已經得到了很好的控制.然而,小王同學發(fā)現,每個國家在疫情發(fā)生的初期,由于認識不足和措施不到位,感染人數都會出現快速的增長.如表是小王同學記錄的某國連續(xù)8天每日新型冠狀病毒感染確診的累計人數.日期代
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度運輸管理實訓課程實施合同3篇
- 新學期教師工作計劃范文10篇
- 2022年《春節(jié)的習俗》6年級作文
- 2021公司員工個人述職報告大全三篇
- 簡歷自我評價集合15篇
- 航天火箭公司評估報告(上網)
- 大學金工實習報告模板匯編9篇
- 商務會議邀請函范文集合八篇
- 社會實踐的自我鑒定集錦15篇
- 人民日報評論網絡暴力素材-人民日報評治理網絡暴力
- 工程光學-物理光學智慧樹知到期末考試答案章節(jié)答案2024年北京航空航天大學
- 注銷稅務授權委托書范本
- 小數數學1000以內數字乘法計算練習題500道(五)
- 《聲聲慢(尋尋覓覓)》課件 統(tǒng)編版高中語文必修上冊
- 初中物理-:八年級上學期競賽題
- 風電項目工程施工合同
- 2024年1月廣東省高中學業(yè)水平考試物理試題(附答案)
- 汽車電器DFMEA-車載終端
- 安全教育年度計劃養(yǎng)老院
- 機電一體化技術《智能煤礦采掘設備操作與檢修》課程標準
- 支座更換綜合項目施工專項方案
評論
0/150
提交評論