專題8-6獨(dú)立性檢驗(yàn)與回歸方程14類題型_第1頁
專題8-6獨(dú)立性檢驗(yàn)與回歸方程14類題型_第2頁
專題8-6獨(dú)立性檢驗(yàn)與回歸方程14類題型_第3頁
專題8-6獨(dú)立性檢驗(yàn)與回歸方程14類題型_第4頁
專題8-6獨(dú)立性檢驗(yàn)與回歸方程14類題型_第5頁
已閱讀5頁,還剩62頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

專題86獨(dú)立性檢驗(yàn)與回歸方程14類題型TOC\o"13"\n\h\z\u題型一獨(dú)立性檢驗(yàn)題型二獨(dú)立性檢驗(yàn)與超幾何分布題型三獨(dú)立性檢驗(yàn)與二項(xiàng)式分布題型四獨(dú)立性檢驗(yàn)與正態(tài)分布題型五樣本中心的計(jì)算及應(yīng)用題型六相關(guān)系數(shù)的計(jì)算題型七求線性回歸直線方程(結(jié)合相關(guān)系數(shù)與二項(xiàng)式分布,超幾何分布,正態(tài)分布)題型八殘差分析題型九相關(guān)指數(shù)題型十求非線性回歸方程:冪函數(shù)方程擬合題型十一求非線性回歸方程:指數(shù)函數(shù)方程擬合題型十二求非線性回歸方程:對數(shù)函數(shù)方程擬合題型十三回歸方程與獨(dú)立性檢驗(yàn)題型十四相關(guān)系數(shù)與獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)獨(dú)立性檢驗(yàn)的基本步驟

(1)提出零假設(shè):X和Y相互獨(dú)立(即X和Y無關(guān))

(2)根據(jù)聯(lián)表給出的數(shù)據(jù)算出(其中),得到隨機(jī)變量,并與臨界值xα比較.

(3)根據(jù)實(shí)際問題需要的可信程度(小概率值α)確定臨界值“X與Y有關(guān)系”,這種推斷犯錯(cuò)誤的概率不超過,即成立;否則就說沒有的把握認(rèn)為“X與Y有關(guān)系”,即不成立.(4)下表給出了產(chǎn)獨(dú)立性檢驗(yàn)中幾個(gè)常用的小概率值和相應(yīng)的臨界值0.10.050.010.0050.0012.7063.8416.6357.87910.828(5)臨界值統(tǒng)計(jì)量也可以用來作相關(guān)性的度量,越小說明變量之間越獨(dú)立,越大說明變量之間越相關(guān).忽略的實(shí)際分布與該近似分布的誤差后,對于任何小概率值,可以找到相應(yīng)的正實(shí)數(shù),使得成立,我們稱為的臨界值,這個(gè)臨界值就可作為判斷大小的標(biāo)準(zhǔn).線性回歸方程解答線性回歸問題,應(yīng)通過散點(diǎn)圖來分析兩變量間的關(guān)系是否線性相關(guān),然后再利用求回歸方程的公式求解回歸方程,并利用殘差圖來分析函數(shù)模型的擬合效果,在此基礎(chǔ)上,借助回歸方程對實(shí)際問題進(jìn)行分析.最小二乘法將eq\o(y,\s\up6(^))=eq\o(b,\s\up6(^))x+eq\o(a,\s\up6(^))稱為Y關(guān)于x的經(jīng)驗(yàn)回歸方程,也稱經(jīng)驗(yàn)回歸函數(shù)或經(jīng)驗(yàn)回歸公式,其圖形稱為經(jīng)驗(yàn)回歸直線,這種求經(jīng)驗(yàn)回歸方程的方法叫做最小二乘法,求得的eq\o(b,\s\up6(^)),eq\o(a,\s\up6(^))叫做b,a的最小二乘估計(jì),其中,eq\o(a,\s\up6(^))=eq\x\to(y)-eq\o(b,\s\up6(^))eq\x\to(x).回歸模型的處理方法冪函數(shù)型:(n為常數(shù),a,x,y均取正值),兩邊取常用對數(shù),即,令,,原方程變?yōu)椋缓蟀淳€型回歸模型求出,.指數(shù)函數(shù)方程:1.直接設(shè)指數(shù)求解;2.取對數(shù)化簡,再設(shè)對數(shù)求解對數(shù)函數(shù)方程:1.直接設(shè)對數(shù)求解;2.對指數(shù)型取對數(shù)殘差與殘差分析(1)殘差對于響應(yīng)變量Y,通過觀測得到的數(shù)據(jù)稱為觀測值,通過經(jīng)驗(yàn)回歸方程得到的eq\o(y,\s\up6(^))稱為預(yù)測值,觀測值減去預(yù)測值稱為殘差.(2)殘差分析殘差是隨機(jī)誤差的估計(jì)結(jié)果,通過對殘差的分析可以判斷模型刻畫數(shù)據(jù)的效果,以及判斷原始數(shù)據(jù)中是否存在可疑數(shù)據(jù)等,這方面工作稱為殘差分析.通過觀察殘差圖可以直觀判斷模型是否滿足一元線性回歸模型中對隨機(jī)誤差的假設(shè),那殘差應(yīng)是均值為0,方差為σ2的隨機(jī)變量的觀測值(3)殘差計(jì)算思路∶先求出回歸方程y=bx+a(b,a直接套公式即可),然后把表格中每一個(gè)x值通過方程算出對應(yīng)的每一個(gè)y值,最后與表格中的y值對應(yīng)相減即可。數(shù)據(jù)點(diǎn)和它在回歸直線上相應(yīng)位置的差異yi-yi是隨機(jī)誤差的效應(yīng),稱ei=y(tǒng)i-殘差計(jì)算公式∶實(shí)際觀察值與估計(jì)值(擬合值)之間的差(4)殘差圖作圖時(shí)縱坐標(biāo)為殘差,橫坐標(biāo)可以選為樣本編號(hào),或身高數(shù)據(jù),或體重估計(jì)值等,這樣作出的圖形稱為殘差圖.在殘差圖中,殘差點(diǎn)比較均勻地落在水平的帶狀區(qū)域中,說明選用的模型比較合適,這樣的帶狀區(qū)域的寬度越窄,說明模型擬合精度越高,回歸方程的預(yù)報(bào)精度越高.(5)殘差平方和法殘差平方和越小,模型的擬合效果越好.(6)R2在回歸分析中,可以用來刻畫回歸的效果,它表示解釋變量對于預(yù)報(bào)變量變化的貢獻(xiàn)率,R2越接近于1,表示回歸的效果越好.模型的擬合效果用相關(guān)指數(shù)來表示,,表達(dá)式中,與經(jīng)驗(yàn)回歸方程無關(guān),殘差平方和與經(jīng)驗(yàn)回歸方程有關(guān),因此,越大,意味著殘差平方和越小,即模型的擬合效果越好;越小,殘差平方和越大,即模型的擬合效果越差注:決定系數(shù)與相關(guān)系數(shù)的聯(lián)系與區(qū)別①相關(guān)系數(shù)反映兩個(gè)變量的相關(guān)關(guān)系的強(qiáng)弱及正相關(guān)或負(fù)相關(guān),決定系數(shù)反映回歸模型的擬合效果.②在含有一個(gè)解釋變量的線性模型中,決定系數(shù)的數(shù)值是相關(guān)系數(shù)的平方,其變化范圍為,而相關(guān)系數(shù)的變化范圍為.③當(dāng)相關(guān)系數(shù)接近于1時(shí),說明兩變量的相關(guān)性較強(qiáng),當(dāng)接近于0時(shí),說明兩變量的相關(guān)性較弱;而當(dāng)接近于1時(shí),說明經(jīng)驗(yàn)回歸方程的擬合效果較好.重點(diǎn)題型·歸類精重點(diǎn)題型·歸類精練題型一獨(dú)立性檢驗(yàn)?zāi)承榱搜芯繉W(xué)生的性別和對待某一活動(dòng)的態(tài)度(支持與不支持)的關(guān)系,運(yùn)用列聯(lián)表進(jìn)行獨(dú)立性檢驗(yàn).經(jīng)計(jì)算,則所得到的統(tǒng)計(jì)學(xué)結(jié)論是:有(

)的把握認(rèn)為“學(xué)生性別與支持該活動(dòng)有系”.0.1000.0500.0250.0100.0012.7063.8415.0246.63510.828A. B. C. D.【答案】C【分析】將的值與表中數(shù)據(jù)比較大小可知,由此確定出相應(yīng)的把握有多少.【詳解】因?yàn)?,對照表格:,因?yàn)?,所以有把握認(rèn)為“學(xué)生性別與是否支持該活動(dòng)有關(guān)系”.故選:C.足球運(yùn)動(dòng)是深受學(xué)生喜愛的一項(xiàng)體育運(yùn)動(dòng),為了研究是否喜愛足球運(yùn)動(dòng)與學(xué)生性別的關(guān)系,從某高校男女生中各隨機(jī)抽取80名學(xué)生進(jìn)行調(diào)查問卷,得到如下數(shù)據(jù)():喜愛不喜愛男生女生若有90%以上的把握認(rèn)為是否喜愛足球運(yùn)動(dòng)與學(xué)生性別有關(guān),則m的最小值為(

)附:.其中.0.250.100.050.001k2.0722.7063.8416.635A.17 B.15 C.13 D.11【答案】B【分析】由列聯(lián)表計(jì)算觀測值,根據(jù)有90%以上的把握認(rèn)為是否喜愛足球運(yùn)動(dòng)與學(xué)生性別有關(guān)列出不等式,求出m的最小值.【詳解】因?yàn)橛?0%以上的把握認(rèn)為是否喜愛足球運(yùn)動(dòng)與學(xué)生性別有關(guān),所以,即,因?yàn)樵冢瑫r(shí)單調(diào)遞增,且,,所以m的最小值為15.“村BA”后,貴州“村超”又火出圈!所謂“村超”,其實(shí)是目前火爆全網(wǎng)的貴州鄉(xiāng)村體育賽事一一榕江(三寶侗寨)和美鄉(xiāng)村足球超級(jí)聯(lián)賽,被大家簡稱為“村超”.“村超”的民族風(fēng)?鄉(xiāng)土味?歡樂感,讓每個(gè)人盡情享受著足球帶來的快樂.某校為了豐富學(xué)生課余生活,組建了足球社團(tuán).足球社團(tuán)為了解學(xué)生喜歡足球是否與性別有關(guān),隨機(jī)抽取了男?女同學(xué)各50名進(jìn)行調(diào)查,部分?jǐn)?shù)據(jù)如表所示:喜歡足球不喜歡足球合計(jì)男生20女生15合計(jì)100附:χ2α0.10.050.010.0050.001x2.7063.8416.6357.87910.828(1)根據(jù)所給數(shù)據(jù)完成上表,依據(jù)α=0.005的獨(dú)立性檢驗(yàn),能否有99.5%(2)社團(tuán)指導(dǎo)老師從喜歡足球的學(xué)生中抽取了2名男生和1名女生示范定點(diǎn)射門.據(jù)統(tǒng)計(jì),這兩名男生進(jìn)球的概率均為23,這名女生進(jìn)球的概率為12,每人射門一次,假設(shè)各人進(jìn)球相互獨(dú)立,求3人進(jìn)球總次數(shù)X【答案】(1)有99.5%(2)分布列見解析,E【分析】(1)根據(jù)男女生各50名及表中數(shù)據(jù)即可填寫2×2列聯(lián)表,然后根據(jù)計(jì)算χ2=(2)根據(jù)題意可知X的所有可能取值為0,1,2,3,列出分布列,計(jì)算出期望從而求解.【詳解】(1)依題意,2×2列聯(lián)表如下:喜歡足球不喜歡足球合計(jì)男生302050女生153550合計(jì)4555100零假設(shè)H0χ2的觀測值為χ9.091>7.879=x0.005,根據(jù)小概率值α=0.005的獨(dú)立性檢驗(yàn),推斷所以有99.5%的把握認(rèn)為該中學(xué)學(xué)生喜歡足球與性別有關(guān)(2)依題意,X的所有可能取值為0,1,2,3,PX=0P所以X的分布列為:X0123P1542數(shù)學(xué)期EX題型二獨(dú)立性檢驗(yàn)與超幾何分布民族要復(fù)興,鄉(xiāng)村要振興,合作社助力鄉(xiāng)村產(chǎn)業(yè)振興,農(nóng)民專業(yè)合作社已成為新型農(nóng)業(yè)經(jīng)營主體和現(xiàn)代農(nóng)業(yè)建設(shè)的中堅(jiān)力量,為實(shí)施鄉(xiāng)村振興戰(zhàn)略作出了巨大的貢獻(xiàn).已知某主要從事手工編織品的農(nóng)民專業(yè)合作社共有100名編織工人,該農(nóng)民專業(yè)合作社為了鼓勵(lì)工人,決定對“編織巧手”進(jìn)行獎(jiǎng)勵(lì),為研究“編織巧手”是否與年齡有關(guān),現(xiàn)從所有編織工人中抽取40周歲以上(含40周歲)的工人24名,40周歲以下的工人16名,得到的數(shù)據(jù)如表所示.“編織巧手”非“編織巧手”總計(jì)年齡≥40歲19__________年齡<40歲_____10_____總計(jì)__________40(1)請完成答題卡上的2×2列聯(lián)表,并根據(jù)小概率值α=0.010的獨(dú)立性檢驗(yàn),分析“編織巧手”與“年齡”是否有關(guān);(2)為進(jìn)一步提高編織效率,培養(yǎng)更多的“編織巧手”,該農(nóng)民專業(yè)合作社決定從上表中的非“編織巧手”的工人中采用分層抽樣的方法抽取6人參加技能培訓(xùn),再從這6人中隨機(jī)抽取2人分享心得,求這2人中恰有1人的年齡在40周歲以下的概率.參考公式:,其中.參考數(shù)據(jù):α0.1000.0500.0100.005xα2.7063.8416.6357.879【答案】(1)列聯(lián)表見解析,認(rèn)為“編織巧手”與“年齡”有關(guān),此推斷犯錯(cuò)的概率不大于0.010;(2)【分析】(1)由題意及表中數(shù)據(jù)可完成列聯(lián)表,先假設(shè)“編織巧手”與“年齡”無關(guān)聯(lián).再由獨(dú)立性檢驗(yàn)公式求值,比較與的大小,最后作出相應(yīng)判斷即可;(2)根據(jù)分層抽樣比例分配得抽取各層人數(shù),再由古典概型概率公式求解概率.【詳解】(1)年齡在40周歲以上(含40周歲)的非“編織巧手”有5人,年齡在40周歲以下的“編織巧手”有6人.列聯(lián)表如下:“編織巧手”非“編織巧手”總計(jì)年齡40歲19524年齡40歲61016總計(jì)251540零假設(shè)為H0:“編織巧手”與“年齡”無關(guān)聯(lián).根據(jù)列聯(lián)表中的數(shù)據(jù),經(jīng)計(jì)算得到,根據(jù)小概率值α=0.010的獨(dú)立性檢驗(yàn),我們推斷H0不成立,即認(rèn)為“編織巧手”與“年齡”有關(guān),此推斷犯錯(cuò)的概率不大于0.010;(2)由題意可得表中非“編織巧手”的工人共有人,采用分層抽樣的方法抽取6人參加技能培訓(xùn),設(shè)人中40周歲以上(含40周歲)的人數(shù)為,年齡在40周歲以下的人數(shù)為,則由,解得.即這6人中年齡在40周歲以上(含40周歲)的人數(shù)是2;年齡在40周歲以下的人數(shù)是4.從這6人中隨機(jī)抽取2人的情況有種,其中符合條件2人中恰有1人的年齡在40周歲以下的情況有種,則由古典概型概率公式得,故所求這2人中恰有1人的年齡在40周歲以下的概率為.2023年實(shí)行新課標(biāo)新高考改革的省市共有29個(gè),選科分類是高級(jí)中學(xué)在校學(xué)生生涯規(guī)劃的重要課題,某高級(jí)中學(xué)為了解學(xué)生選科分類是否與性別有關(guān),在該校隨機(jī)抽取100名學(xué)生進(jìn)行調(diào)查.統(tǒng)計(jì)整理數(shù)據(jù)得到如下的2×2列聯(lián)表:選物理類選歷史類合計(jì)男生3515女生2525合計(jì)100(1)依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),能否據(jù)此推斷選科分類與性別有關(guān)聯(lián)?(2)在以上隨機(jī)抽取的女生中,按不同選擇類別同比例分層抽樣,共抽取6名女生進(jìn)行問卷調(diào)查,然后在被抽取的6名女生中再隨機(jī)抽取4名女生進(jìn)行面對面訪談.設(shè)面對面訪談的女生中選擇歷史類的人數(shù)為隨機(jī)變量X,求隨機(jī)變量X的分布列和數(shù)學(xué)期望.附:χ2=nα0.100.050.0250.0100.0050.001x2.7063.8415.0246.6357.87910.828【答案】(1)選科分類與性別有關(guān)聯(lián)(2)分布列見解析,2【分析】(1)計(jì)算卡方即可由獨(dú)立性檢驗(yàn)求解,(2)根據(jù)超幾何分布的概率公式求解概率,即可求解分布列以及期望.【詳解】(1)2×2列聯(lián)表補(bǔ)充如下:選物理類選歷史類合計(jì)男生351550女生252550合計(jì)6040100零假設(shè)為H0因?yàn)棣?根據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),推斷H0即認(rèn)為選科分類與性別有關(guān)聯(lián),此推斷犯錯(cuò)誤的概率不大于0.05.(2)由已知,50名女學(xué)生中選擇物理類和選擇歷史類的比例為1:1,因此抽取6名女生中,選擇物理類和選擇歷史類的人數(shù)均為3名.所以隨機(jī)變量X的取值為1,2,3.PX=1所以隨機(jī)變量X的分布列如下表:X123P131所以EX2023年9月23日第19屆亞運(yùn)會(huì)在杭州開幕,本屆亞運(yùn)會(huì)共設(shè)40個(gè)競賽大項(xiàng),包括31個(gè)奧運(yùn)項(xiàng)目和9個(gè)非奧運(yùn)項(xiàng)目.為研究不同性別學(xué)生對杭州亞運(yùn)會(huì)項(xiàng)目的了解情況,某學(xué)校進(jìn)行了一次抽樣調(diào)查,分別抽取男生和女生各50名作為樣本,設(shè)事件A=“了解亞運(yùn)會(huì)項(xiàng)目”,B=“學(xué)生為女生”,據(jù)統(tǒng)計(jì)PAB=附:χ2=nα0.0500.0100.001x3.8416.63510.828(1)根據(jù)已知條件,填寫下列2×2列聯(lián)表,并依據(jù)α=0.001的獨(dú)立性檢驗(yàn),能否認(rèn)為該校學(xué)生對亞運(yùn)會(huì)項(xiàng)目的了解情況與性別有關(guān)?了解不了解合計(jì)男生女生合計(jì)(2)現(xiàn)從該校了解亞運(yùn)會(huì)項(xiàng)目的學(xué)生中,采用分層隨機(jī)抽樣的方法隨機(jī)抽取9名學(xué)生,再從這9名學(xué)生中隨機(jī)抽取4人,設(shè)抽取的4人中男生的人數(shù)為X,求X的分布列和數(shù)學(xué)期望.【答案】(1)列聯(lián)表見解析,該校學(xué)生對杭州亞運(yùn)會(huì)項(xiàng)目的了解情況與性別無關(guān)(2)分布列見解析,數(shù)學(xué)期望為4【分析】(1)根據(jù)題中所給條件填寫表格,寫出零假設(shè),根據(jù)列聯(lián)表中數(shù)據(jù)計(jì)算出χ2值,與xα(2)根據(jù)題意知其服從超幾何分布,列出分布列,求出數(shù)學(xué)期望即可.【詳解】(1)因?yàn)镻AB=所以對杭州亞運(yùn)會(huì)項(xiàng)目了解的女生為35×50=30,了解亞運(yùn)會(huì)項(xiàng)目的學(xué)生為結(jié)合男生和女生各50名,填寫2×2列聯(lián)表為:了解不了解合計(jì)男生153550女生302050合計(jì)4555100零假設(shè)H0根據(jù)列聯(lián)表中的數(shù)據(jù)χ2依據(jù)α=0.001的獨(dú)立性檢驗(yàn),可以推斷H0即該校學(xué)生對杭州亞運(yùn)會(huì)項(xiàng)目的了解情況與性別無關(guān).(2)由(1)知,采用分層隨機(jī)抽樣的方法隨機(jī)抽取9名學(xué)生,其中男生人數(shù)為1515+30女生人數(shù)為3015+30由題意可得,隨機(jī)變量X的所有可能取值為0,1,2,3.PX=0=CPX=2=C隨機(jī)變量X的分布列如下:X0123P51051則EX杭州第19屆亞運(yùn)會(huì)又稱“2022年杭州亞運(yùn)會(huì)”,是繼1990年北京亞運(yùn)會(huì)、2010年廣州亞運(yùn)會(huì)之后,中國第三次舉辦亞洲最高規(guī)格的國際綜合性體育賽事.某高校部分學(xué)生十分關(guān)注杭州亞運(yùn)會(huì),若將累計(jì)關(guān)注杭州亞運(yùn)會(huì)賽事消息50次及以上的學(xué)生稱為“亞運(yùn)會(huì)達(dá)人”,未達(dá)到50次的學(xué)生稱為“非亞運(yùn)會(huì)達(dá)人”.現(xiàn)從該校隨機(jī)抽取100名學(xué)生,得到數(shù)據(jù)如表所示:亞運(yùn)會(huì)達(dá)人非亞運(yùn)會(huì)達(dá)人合計(jì)男生4056女生24合計(jì)(1)補(bǔ)全列聯(lián)表,并判斷能否有99%的把握認(rèn)為是否為“亞運(yùn)會(huì)達(dá)人”與性別有關(guān)?(2)現(xiàn)從樣本的“亞運(yùn)會(huì)達(dá)人”中按性別采用分層抽樣的方法抽取6人,然后從這6人中隨機(jī)抽取3人,記這3人中女生的人數(shù)為X,求X的分布列和數(shù)學(xué)期望.附:,.0.0500.0100.005k3.8416.6357.879【答案】(1)表格見解析,有99%的把握認(rèn)為是否為“亞運(yùn)會(huì)達(dá)人”與性別有關(guān)(2)分布列見解析,1【分析】(1)根據(jù)題意,補(bǔ)全的列聯(lián)表,求得,結(jié)合附表,即可得到結(jié)論;(2)根據(jù)題意,得到隨機(jī)變量X的所有可能取值為0,1,2,求得相應(yīng)的概率,列出分布列,結(jié)合期望的公式,即可求解.【詳解】(1)解:根據(jù)題意,補(bǔ)全的列聯(lián)表如表所示:亞運(yùn)會(huì)達(dá)人非亞運(yùn)會(huì)達(dá)人合計(jì)男生401656女生202444合計(jì)6040100根據(jù)表中的數(shù)據(jù)可得,因?yàn)?,所以?9%的把握認(rèn)為是否為“亞運(yùn)會(huì)達(dá)人”與性別有關(guān).(2)解:從樣本的“亞運(yùn)會(huì)達(dá)人”中按性別采用分層抽樣的方法抽取6人,其中男生有4人,女生有2人,故X的所有可能取值為0,1,2,則,,,所以的分布列為X012P所以期望為X的數(shù)學(xué)期望.題型三獨(dú)立性檢驗(yàn)與二項(xiàng)式分布2023年9月23日第19屆亞運(yùn)會(huì)在中國杭州舉行,其中電子競技第一次列為正式比賽項(xiàng)目.某中學(xué)對該校男女學(xué)生是否喜歡電子競技進(jìn)行了調(diào)查,隨機(jī)調(diào)查了男女生人數(shù)各200人,得到如下數(shù)據(jù):男生女生合計(jì)喜歡120100220不喜歡80100180合計(jì)200200400(1)根據(jù)表中數(shù)據(jù),采用小概率值的獨(dú)立性檢驗(yàn),能否認(rèn)為該校學(xué)生對電子競技的喜歡情況與性別有關(guān)?(2)為弄清學(xué)生不喜歡電子競技的原因,采用分層抽樣的方法從調(diào)查的不喜歡電子競技的學(xué)生中隨機(jī)抽取9人,再從這9人中抽取3人進(jìn)行面對面交流,求“至少抽到一名男生”的概率;(3)將頻率視為概率,用樣本估計(jì)總體,從該校全體學(xué)生中隨機(jī)抽取10人,記其中對電子競技喜歡的人數(shù)為,求的數(shù)學(xué)期望.參考公式及數(shù)據(jù):,其中.0.150.100.050.0250.012.0722.7063.8415.0246.635【答案】(1)采用小概率值的獨(dú)立性檢驗(yàn),能認(rèn)為該校學(xué)生對電子競技的喜歡情況與性別有關(guān)(2)(3)【分析】(1)根據(jù)已知條件,結(jié)合獨(dú)立性檢驗(yàn)公式,即可求解.(2)根據(jù)已知條件,結(jié)合分層抽樣的定義,以及對立事件概率和為1,即可求解.(3)結(jié)合二項(xiàng)分布的期望公式,即可求解.【詳解】(1)列聯(lián)表如下表所示:男生女生合計(jì)喜歡不喜歡合計(jì)零假設(shè)該校學(xué)生對電子競技的喜歡情況與性別無關(guān),,,采用小概率值的獨(dú)立性檢驗(yàn),可推斷不成立,即能認(rèn)為該校學(xué)生對電子競技的喜歡情況與性別有關(guān),(2)采用分層抽樣的方法從抽取的不喜歡電子競技的學(xué)生中隨機(jī)抽取9人,這9人中男生的人數(shù)為4,女生的人數(shù)為5,再從這9人中抽取3人進(jìn)行面對面交流,“至少抽到一名男生”的概率為.(3)由題意可知喜歡電子競技的概率為,所以,故.為學(xué)習(xí)貫徹中央農(nóng)村工作會(huì)議精神“強(qiáng)國必先強(qiáng)農(nóng),農(nóng)強(qiáng)方能國強(qiáng)”,某市在某村積極開展香菇種植,助力鄉(xiāng)村振興.香菇的生產(chǎn)可能受場地?基料?水分?菌種等因素的影響,現(xiàn)已知香菇有菌種甲和菌種乙兩個(gè)品種供挑選,菌種甲在溫度時(shí)產(chǎn)量為28噸/畝,在溫度30℃時(shí)產(chǎn)量為20噸/畝;菌種乙在溫度20℃時(shí)產(chǎn)量為22噸/畝,在氣溫時(shí)產(chǎn)量為30噸/畝.(1)請補(bǔ)充完整2×2列聯(lián)表,根據(jù)2×2列聯(lián)表和小概率值的獨(dú)立性檢驗(yàn),判斷菌種甲?乙的產(chǎn)量與溫度是否有關(guān)?合計(jì)菌種甲菌種乙合計(jì)(2)某村選擇菌種甲種植,已知菌種甲在氣溫為時(shí)的發(fā)芽率為,從菌種甲中任選3個(gè),若設(shè)為菌種甲發(fā)芽的個(gè)數(shù),求的分布列及數(shù)學(xué)期望.附:參考公式:,其中.臨界值表:0.100.050.012.7063.8416.635【答案】(1)表格見解析,無關(guān)(2)分布列見解析,【分析】(1)由題中數(shù)據(jù)先完善列聯(lián)表,然后根據(jù)卡方計(jì)算公式進(jìn)行獨(dú)立性檢驗(yàn)即可.(2)由二項(xiàng)分布的概率計(jì)算公式即可得相應(yīng)的概率,從而得分布列,根據(jù)期望公式計(jì)算即可求解.【詳解】(1)合計(jì)菌種甲282048菌種乙223052合計(jì)5050100零假設(shè):菌種甲?乙的產(chǎn)量與溫度沒有關(guān)系,根據(jù)表中數(shù)據(jù),計(jì)算得,根據(jù)小概率值的獨(dú)立性檢驗(yàn),我們沒有充分的證據(jù)推斷不成立,因此可以認(rèn)為成立,即認(rèn)為菌種甲?乙的產(chǎn)量與溫度無關(guān).(2)由題意可知,的可能取值有,由公式可得,,所以的分布列為0123所以.某市某部門為了了解全市中學(xué)生的視力情況,采用比例分配的分層隨機(jī)抽樣方法抽取了該市120名中學(xué)生,已知該市中學(xué)生男女人數(shù)比例為7:5,他們的視力情況統(tǒng)計(jì)結(jié)果如表所示:性別視力情況合計(jì)近視不近視男生30女生40合計(jì)120(1)請把表格補(bǔ)充完整,并根據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),判斷近視是否與性別有關(guān);(2)如果用這120名中學(xué)生中男生和女生近視的頻率分別代替該市中學(xué)生中男生和女生近視的概率,且每名同學(xué)是否近視相互獨(dú)立.現(xiàn)從該市中學(xué)生中任選4人,設(shè)隨機(jī)變量X表示4人中近視的人數(shù),求X的分布列及均值.附:χ2=nad-bcα0.10.050.01xα2.7063.8416.635【答案】(1)表格見解析,近視與性別有關(guān)(2)分布列見解析,4【分析】(1)根據(jù)已知條件即可完成2×2的列聯(lián)表,根據(jù)表中數(shù)據(jù)計(jì)算觀測值,對照臨界值即可求解;(2)根據(jù)已知條件得出隨機(jī)變量X服從二項(xiàng)分布,進(jìn)而可以得出隨機(jī)變量X的分布列,再結(jié)合二項(xiàng)分布隨機(jī)變量X的期望公式即可求解.【詳解】(1)∵該市中學(xué)生男女人數(shù)比例為7:5,∴抽取的120名學(xué)生中男生有70人,女生有50人,2×2列聯(lián)表如下:性別視力情況合計(jì)近視不近視男生304070女生104050合計(jì)4080120零假設(shè)為H0根據(jù)列聯(lián)表中的數(shù)據(jù)得,χ2∴根據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),我們推斷H0(2)∵用這120名中學(xué)生中男生和女生近視的頻率分別代替該市中學(xué)生中男生和女生近視的概率,∴每名學(xué)生近視的概率為30+10120由題意可得,X的所有可能取值為0,1,2,3,4,且隨機(jī)變量X~B4,PX=0=CPX=2=CPX=4∴X的分布列為:X01234P1632881EXsinαcosβ=12sinα+β+sinα-β,cosαsinβ=12sinα+β-sin合格不合格合計(jì)高三年級(jí)的學(xué)生54高一年級(jí)的學(xué)生16合計(jì)100(1)請完成2×2列聯(lián)表,依據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),分析“對公式的掌握情況”與“學(xué)生所在年級(jí)”是否有關(guān)?(2)以頻率估計(jì)概率,從該校高一年級(jí)學(xué)生中抽取3名學(xué)生,記合格的人數(shù)為X,求X的分布列和數(shù)學(xué)期望.附:χ2=α0.1000.0500.0100.001x2.7063.8416.63510.828【答案】(1)列聯(lián)表見解析,認(rèn)為“對公式的掌握情況”與“學(xué)生所在年級(jí)”有關(guān)(2)分布列見解析,9【分析】(1)根據(jù)卡方的計(jì)算與臨界值比較即可求解,(2)利用二項(xiàng)分布的概率公式即可求解概率以及期望公式求解.【詳解】(1)由100名學(xué)生中高三年級(jí)的學(xué)生占35,可知高三年級(jí)的學(xué)生有60人,高一年級(jí)的學(xué)生有40人補(bǔ)充完整的列聯(lián)表,如下:合格不合格合計(jì)高三年級(jí)的學(xué)生54660高一年級(jí)的學(xué)生241640合計(jì)7822100提出零假設(shè)H0:“對公式的掌握情況”與“學(xué)生所在年級(jí)”無關(guān)根據(jù)列聯(lián)表中的數(shù)據(jù),得χ2根據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),我們推斷H?不成立,即認(rèn)為“對公式的掌握情況”與“學(xué)生所在年級(jí)”有關(guān),此推斷犯錯(cuò)誤的概率不大于0.001.(2)由(1)得,高一年級(jí)的學(xué)生對公式的掌握情況合格的頻率為2440依題意,得X~B3,3則PX=0=1-PX=2=C所以X的分布列為X0123P8365427EX隨著科技的發(fā)展,網(wǎng)絡(luò)已逐漸融入了人們的生活.網(wǎng)購是非常方便的購物方式,為了了解網(wǎng)購在我市的普及情況,某調(diào)查機(jī)構(gòu)進(jìn)行了有關(guān)網(wǎng)購的調(diào)查問卷,并從參與調(diào)查的市民中隨機(jī)抽取了男女各100人進(jìn)行分析,從而得到表(單位:人):經(jīng)常網(wǎng)購偶爾或不用網(wǎng)購合計(jì)男性45100女性65100合計(jì)(1)完成如表;對于以上數(shù)據(jù),采用小概率值α=0.01的獨(dú)立性檢驗(yàn),能否認(rèn)為我市市民網(wǎng)購與性別有關(guān)聯(lián)?(2)①現(xiàn)從所抽取的女市民中利用分層抽樣的方法抽取20人,再從這20人中隨機(jī)選取3人贈(zèng)送優(yōu)惠券,求選取的3人中至少有2人經(jīng)常網(wǎng)購的概率;②將頻率視為概率,從我市所有參與調(diào)查的市民中隨機(jī)抽取20人贈(zèng)送禮品,記其中經(jīng)常網(wǎng)購的人數(shù)為X,求隨機(jī)變量X的數(shù)學(xué)期望和方差.參考公式:χ2α0.1500.1000.0500.0250.0100.0050.001x2.0722.7063.8415.0246.6357.87910.828【答案】(1)能,理由見解析(2)①208285;②EX【分析】(1)完善列聯(lián)表,計(jì)算出χ2(2)①所抽取的20名女市民中,經(jīng)常網(wǎng)購的有20×65100=13②分析可知,X~B20,1120,利用二項(xiàng)分布的期望和方差公式可求得EX【詳解】(1)解:完善列聯(lián)表如下表所示(單位:人):經(jīng)常網(wǎng)購偶爾或不用網(wǎng)購合計(jì)男性4555100女性6535100合計(jì)11090200零假設(shè)H0由列聯(lián)表得,χ2根據(jù)小概率值α=0.01的獨(dú)立性檢驗(yàn),推斷H0不成立,即認(rèn)為我市市民網(wǎng)購與性別有關(guān)聯(lián)(2)解:①由題意可知,所抽取的20名女市民中,經(jīng)常網(wǎng)購的有20×65偶爾或不用網(wǎng)購的有20×35所以,選取的3人中至少有2人經(jīng)常網(wǎng)購的概率為P=C②由2×2列聯(lián)表可知,抽到經(jīng)常網(wǎng)購的市民的頻率為110200將頻率視為概率,所以,從我市市民中任意抽取一人,恰好抽到經(jīng)常網(wǎng)購市民的概率為1120由題意可知,X~B20,1120,所以,E某中醫(yī)研究所研制了一種治療A疾病的中藥,為了解其對A疾病的作用,要進(jìn)行雙盲實(shí)驗(yàn).把60名患有A疾病的志愿者隨機(jī)平均分成兩組,甲組正常使用這種中藥,乙組用安慰劑代替中藥,全部療期后,統(tǒng)計(jì)甲、乙兩組的康復(fù)人數(shù)分別為20和5.(1)根據(jù)所給數(shù)據(jù),完成下面2×2列聯(lián)表,并判斷是否有99.9%的把握認(rèn)為使用這種中藥與A康復(fù)未康復(fù)合計(jì)甲組2030乙組530合計(jì)(2)若將乙組未用藥(用安慰劑代替中藥)而康復(fù)的頻率視為這種疾病的自愈概率,現(xiàn)從患有A疾病的人群中隨機(jī)抽取3人,記其中能自愈的人數(shù)為X,求X的分布列和數(shù)學(xué)期望.附表:α0.1000.050.010.0050.001x2.7063.8416.6357.87910.828附:χ2=n注:雙盲實(shí)驗(yàn):是指在實(shí)驗(yàn)過程中,測驗(yàn)者與被測驗(yàn)者都不知道被測者所屬的組別,(實(shí)驗(yàn)組或?qū)φ战M),分析者在分析資料時(shí),通常也不知道正在分析的資料屬于哪一組.旨在消除可能出現(xiàn)在實(shí)驗(yàn)者和參與者意識(shí)當(dāng)中的主觀偏差和介入偏好.安慰劑:是指沒有藥物治療作用,外形與真藥相像的片、丸、針劑.【答案】(1)列聯(lián)表答案見解析,認(rèn)為中藥與A疾病康復(fù)有關(guān)聯(lián)(2)分布列見解析,E【分析】(1)根據(jù)題意列出2×2列聯(lián)表,利用公式求得χ2(2)由題意求得患有A疾病的自愈概率為16,結(jié)合隨機(jī)變量X~B3,【詳解】(1)依題意,列出2×2列聯(lián)表如下:單位:人康復(fù)末康復(fù)合計(jì)甲組201030乙組52530合計(jì)253560零假設(shè)為H0:組別與康復(fù)相互獨(dú)立,即中藥與A則χ2根據(jù)小概率值α=0.001的獨(dú)立性檢驗(yàn),我們推斷H0即有99.9%的把握認(rèn)為中藥與A疾病康復(fù)有關(guān)聯(lián)(2)由題意,乙組末用藥而康復(fù)的頻率為530所以患有A疾病的自愈概率為16隨機(jī)變量X的可能取值為0,1,2,3,由題意得,隨機(jī)變量X~B3,所以PX=0PX=1=C31所以X的分布列為:X0123P12575151所以X的數(shù)學(xué)期望EX某企業(yè)生產(chǎn)的產(chǎn)品按質(zhì)量分為一等品和二等品,該企業(yè)計(jì)劃對現(xiàn)有生產(chǎn)設(shè)備進(jìn)行改造,為了分析設(shè)備改造前后的效果,現(xiàn)從設(shè)備改造前后生產(chǎn)的大量產(chǎn)品中各抽取200件產(chǎn)品作為樣本,產(chǎn)品的質(zhì)量情況統(tǒng)計(jì)如下表:一等品二等品合計(jì)設(shè)備改造前12080200設(shè)備改造后15050200合計(jì)270130400附:(1)判斷能否在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為該企業(yè)生產(chǎn)的這種產(chǎn)品的質(zhì)量與設(shè)備改造有關(guān);(2)按照分層抽樣的方法,從設(shè)備改造前的產(chǎn)品中取得了5件產(chǎn)品,其中有3件一等品和2件二等品.現(xiàn)從這5件產(chǎn)品中任選3件,記所選的一等品件數(shù)為,求的分布列及均值;(3)根據(jù)市場調(diào)查,企業(yè)每生產(chǎn)一件一等品可獲利100元,每生產(chǎn)一件二等品可獲利60元,在設(shè)備改造后,用先前所取的200個(gè)樣本的頻率估計(jì)總體的概率,記生產(chǎn)1000件產(chǎn)品企業(yè)所獲得的總利潤為,求的均值.【答案】(1)能在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為該企業(yè)生產(chǎn)的這種產(chǎn)品的質(zhì)量指標(biāo)值與設(shè)備改造有關(guān);(2)分布列見解析,(3)元【分析】(1)計(jì)算,與臨界值比較得出結(jié)論;(2)由題意,根據(jù)超幾何分布計(jì)算概率,列出分布列,計(jì)算期望即可;(3)由計(jì)算期望,再由期望的性質(zhì)求.【詳解】(1)零假設(shè)為:質(zhì)量指標(biāo)值與設(shè)備改造無關(guān).,不成立,故能在犯錯(cuò)誤的概率不超過的前提下,認(rèn)為該企業(yè)生產(chǎn)的這種產(chǎn)品的質(zhì)量指標(biāo)值與設(shè)備改造有關(guān);(2)由題意.,,,的分布列為:123.(3)設(shè)生產(chǎn)的一等品有件,則二等品有件,由題意,,,元.題型四獨(dú)立性檢驗(yàn)與正態(tài)分布新型冠狀病毒的傳染主要是人與人之間進(jìn)行傳播,感染人群年齡大多數(shù)是50歲以上人群,該病毒進(jìn)入人體后有潛伏期.潛伏期是指病原體侵入人體至最早出現(xiàn)臨床癥狀的這段時(shí)間,潛伏期越長,感染到他人的可能性越高,現(xiàn)對400個(gè)病例的潛伏期(單位:天)進(jìn)行調(diào)查,統(tǒng)計(jì)發(fā)現(xiàn)潛伏期平均數(shù)為7.2,方差為,如果認(rèn)為超過8天的潛伏期屬于“長潛伏期”,按照年齡統(tǒng)計(jì)樣本,50歲以上人數(shù)占70%,長期潛伏人數(shù)占25%,其中50歲以上長期潛伏者有60人.(1)請根據(jù)以上數(shù)據(jù)完成列聯(lián)表,并根據(jù)小概率的獨(dú)立性檢驗(yàn),是否可以認(rèn)為“長期潛伏”與年齡有關(guān);單位:人50歲以下(含50歲)50歲以上總計(jì)長期潛伏非長期潛伏總計(jì)(2)假設(shè)潛伏期X服從正態(tài)分布,其中近似為樣本平均數(shù),近似為樣本方差,現(xiàn)在很多省市對入境旅客一律要求隔離14天,請結(jié)合原則通過計(jì)算概率解釋其合理性.附:,其中.0.10.050.0102.7063.8416.635若,,,.【答案】(1)列聯(lián)表見解析,可以認(rèn)為“長期潛伏”與年齡有關(guān)(2)答案見解析【分析】(1)完善列聯(lián)表,計(jì)算出卡方,與3.841比較后得到結(jié)論;(2)得到,,根據(jù)正態(tài)分布原則得到,為小概率事件,得到14天是合理的.【詳解】(1)列聯(lián)表補(bǔ)充如下:單位:人50歲以下(含50歲)50歲以上總計(jì)長期潛伏4060100非長期潛伏80220300總計(jì)120280400零假設(shè):“長期潛伏”與年齡無關(guān),則,∴根據(jù)小概率的獨(dú)立性檢驗(yàn),可以認(rèn)為“長期潛伏”與年齡有關(guān).(2),故,所以,所以潛伏期超過14天的概率很低,因此14天是合理的.某校體育鍛煉時(shí)間準(zhǔn)備提供三項(xiàng)體育活動(dòng)供學(xué)生選擇.為了解該校學(xué)生對“三項(xiàng)體育活動(dòng)中要有籃球”這種觀點(diǎn)的態(tài)度(態(tài)度分為同意和不同意),隨機(jī)調(diào)查了200名學(xué)生,數(shù)據(jù)如下:單位:人男生女生合計(jì)同意7050120不同意305080合計(jì)100100200(1)能否有的把握認(rèn)為學(xué)生對“三項(xiàng)體育活動(dòng)中要有籃球”這種觀點(diǎn)的態(tài)度與性別有關(guān)?(2)現(xiàn)有足球、籃球、跳繩供學(xué)生選擇.①若甲、乙兩名學(xué)生從這三項(xiàng)運(yùn)動(dòng)中隨機(jī)選一種,且他們的選擇情況相互獨(dú)立互不影響.已知在甲學(xué)生選擇足球的前提下,兩人的選擇不同的概率為.記事件為“甲學(xué)生選擇足球”,事件B為“甲、乙兩名學(xué)生的選擇不同”,判斷事件、是否獨(dú)立,并說明理由.②若該校所有學(xué)生每分鐘跳繩個(gè)數(shù).根據(jù)往年經(jīng)驗(yàn),該校學(xué)生經(jīng)過訓(xùn)練后,跳繩個(gè)數(shù)都有明顯進(jìn)步.假設(shè)經(jīng)過訓(xùn)練后每人每分鐘跳繩個(gè)數(shù)比開始時(shí)個(gè)數(shù)增加10,該校有1000名學(xué)生,預(yù)估經(jīng)過訓(xùn)練后該校每分鐘跳182個(gè)以上人數(shù)(結(jié)果四舍五入到整數(shù)).參考公式和數(shù)據(jù):,其中;0.0250.0100.0055.0246.6357.879若,則,,.【答案】(1)有的把握認(rèn)為,學(xué)生對該觀點(diǎn)的態(tài)度與性別有關(guān)(2)①事件獨(dú)立,理由見解析;②841.【分析】(1)計(jì)算出卡方,即可判斷;(2)①求出,,即可得到,從而得到,即可判斷;②由已知,經(jīng)過訓(xùn)練后每人每分鐘跳繩個(gè)數(shù),根據(jù)正態(tài)分布的性質(zhì)求出,從而估計(jì)出人數(shù).【詳解】(1)提出假設(shè):學(xué)生對該問題的態(tài)度與性別無關(guān).根據(jù)列聯(lián)表中的數(shù)據(jù)可求得,.因?yàn)楫?dāng)成立時(shí),的概率約為,所以有的把握認(rèn)為,學(xué)生對該觀點(diǎn)的態(tài)度與性別有關(guān).(2)①事件、獨(dú)立.理由如下:因?yàn)?,,所以,所以,即事件、?dú)立.②記經(jīng)過訓(xùn)練后每人每分鐘跳繩個(gè)數(shù)為,由已知,經(jīng)過訓(xùn)練后每人每分鐘跳繩個(gè)數(shù).因?yàn)?,所以.所以(人).所以?jīng)過訓(xùn)練后該校每分鐘跳個(gè)以上人數(shù)約為.為調(diào)查學(xué)生數(shù)學(xué)建模能力的總體水平,某地區(qū)組織10000名學(xué)生(其中男生4000名,女生6000名)參加數(shù)學(xué)建模能力競賽活動(dòng).(1)若將成績在70,85的學(xué)生定義為“有潛力的學(xué)生”,經(jīng)統(tǒng)計(jì),男生中有潛力的學(xué)生有2500名,女生中有潛力的學(xué)生有3500名,完成下面的2×2列聯(lián)表,并判斷是否有99.9%的把握認(rèn)為學(xué)生是否有潛力與性別有關(guān)?是否有潛力性別合計(jì)男生女生有潛力沒有潛力合計(jì)(2)經(jīng)統(tǒng)計(jì),男生成績的均值為80,方差為49,女生成績的均值為75,方差為64.(ⅰ)求全體參賽學(xué)生成績的均值μ及方差σ2(ⅱ)若參賽學(xué)生的成績X服從正態(tài)分布Nμ,σ2,試估計(jì)成績在參考數(shù)據(jù):①P0.10.050.010.0050.001k2.7063.8416.6357.87910.828②若X~Nμ,σ2,則Pμ-σ≤X≤μ+σ=0.6827參考公式:K2=n【答案】(1)列聯(lián)表見解析,有99.9%的把握認(rèn)為學(xué)生是否有潛力與性別有關(guān)(2)(ⅰ)μ=77,σ2=64(ⅱ)【分析】(1)根據(jù)條件填寫二聯(lián)表,并根據(jù)卡方公式計(jì)算判斷即可;(2)(i)根據(jù)分層抽樣的均值與方差計(jì)算公式計(jì)算即可;(ii)根據(jù)正態(tài)分布的三段區(qū)間公式計(jì)算并估計(jì)即可.【詳解】(1)2×2列聯(lián)表如下:是否有潛力性別合計(jì)男生女生有潛力250035006000沒有潛力150025004000合計(jì)4000600010000零假設(shè)為H0根據(jù)列聯(lián)表中的數(shù)據(jù),得K=625我們推斷H0不成立,即有99.9%的把握認(rèn)為學(xué)生是否有潛力與性別有關(guān)(2)(?。┘僭O(shè)男生成績?yōu)閤i1≤i≤4000,女生成績?yōu)閯tμ=80×0.4+75×0.6=77.因?yàn)?9=1即i=14000同理64=16000i=1所以σ===(或者直接用公式計(jì)算:σ2(ⅱ)由X~N77,82所以這次考試中成績在61,93的學(xué)生大約有0.9545×10000=9545人.某學(xué)校號(hào)召學(xué)生參加“每天鍛煉1小時(shí)”活動(dòng),為了了解學(xué)生參與活動(dòng)的情況,隨機(jī)調(diào)查了100名學(xué)生一個(gè)月(30天)完成鍛煉活動(dòng)的天數(shù),制成如下頻數(shù)分布表:天數(shù)[0,5](5,10](10,15](15,20](20,25](25,30]人數(shù)4153331116(1)由頻數(shù)分布表可以認(rèn)為,學(xué)生參加體育鍛煉天數(shù)X近似服從正態(tài)分布Nμ,σ2,其中μ近似為樣本的平均數(shù)(每組數(shù)據(jù)取區(qū)間的中間值),且σ=6.1,若全校有3000名學(xué)生,求參加“每天鍛煉1小時(shí)”活動(dòng)超過21(2)調(diào)查數(shù)據(jù)表明,參加“每天鍛煉1小時(shí)”活動(dòng)的天數(shù)在(15,30]的學(xué)生中有30名男生,天數(shù)在[0,15]的學(xué)生中有20名男生,學(xué)校對當(dāng)月參加“每天鍛煉1小時(shí)”活動(dòng)超過15天的學(xué)生授予“運(yùn)動(dòng)達(dá)人”稱號(hào).請?zhí)顚懴旅媪新?lián)表:性別活動(dòng)天數(shù)合計(jì)[0,15](15,30]男生女生合計(jì)并依據(jù)小概率值α=0.05的獨(dú)立性檢驗(yàn),能否認(rèn)為學(xué)生性別與獲得“運(yùn)動(dòng)達(dá)人”稱號(hào)有關(guān)聯(lián).如果結(jié)論是有關(guān)聯(lián),請解釋它們之間如何相互影響.附:參考數(shù)據(jù):Pμ-σ≤X≤μ+σ=0.6827;Pμ-2σ≤X≤μ+2σ=0.9545α0.10.050.010.0050.001x2.7063.8416.6357.87910.828【答案】(1)476人(2)答案見解析【分析】(1)利用頻數(shù)分布表,求得樣本的平均數(shù),從而寫出X近似服從正態(tài)分布X-N(14.9,6.12),利用參考數(shù)據(jù)求得參加“每天鍛煉1小時(shí)”(2)根據(jù)頻數(shù)分布表和已知條件,完善列聯(lián)表,根據(jù)獨(dú)立性檢驗(yàn)的公式,求出學(xué)生性別與獲得“運(yùn)動(dòng)達(dá)人”稱號(hào)是否有關(guān)聯(lián)和它們之間如何相互影響.【詳解】(1)由頻數(shù)分布表知μ=4×2.5+15×7.5+33×12.5+31×17.5+11×22.5+6×27.5100=14.9,則X-N(14.9,∴P(X>21)=P(X>14.9+6.1)=1-0.6827∴3000×0.15865=475.95≈476,∴參加“每天鍛煉1小時(shí)”活動(dòng)超過21天的人數(shù)約為476人.(2)由頻數(shù)分布表知,鍛煉活動(dòng)的天數(shù)在[0,15]的人數(shù)為:4+15+33=52,∵參加“每天鍛煉1小時(shí)”活動(dòng)的天數(shù)在[0,15]的學(xué)生中有20名男生,∴參加“每天鍛煉1小時(shí)”活動(dòng)的天數(shù)在[0,15]的學(xué)生中有女生人數(shù):52-20=32由頻數(shù)分布表知,鍛煉活動(dòng)的天數(shù)在(15,30]的人數(shù)為31+11+6=48,∵參加“每天鍛煉1小時(shí)”活動(dòng)的天數(shù)在(15,30]的學(xué)生中有30名男生,∴參加“每天鍛煉1小時(shí)”活動(dòng)的天數(shù)在[0,15]的學(xué)生中有女生人數(shù):48-30=18列聯(lián)表如下:性別活動(dòng)天數(shù)合計(jì)[0,15](15,30]男生203050女生321850合計(jì)5248100零假設(shè)為H0:學(xué)生性別與獲得“運(yùn)動(dòng)達(dá)人”χ依據(jù)α=0.05的獨(dú)立性檢驗(yàn),我們推斷H0不成立,即:可以認(rèn)為學(xué)生性別與獲得“運(yùn)動(dòng)達(dá)人”而且此推斷犯錯(cuò)誤的概率不大于0.05,根據(jù)列聯(lián)表中的數(shù)據(jù)得到,男生、女生中活動(dòng)天數(shù)超過15天的頻率分別為:3050=0.6和1850=0.36,可見男生中獲得“運(yùn)動(dòng)達(dá)人”稱號(hào)的頻率是女生中獲得“運(yùn)動(dòng)達(dá)人”的稱號(hào)頻率的0.60.36≈1.67題型五樣本中心的計(jì)算及應(yīng)用如果記錄了,的幾組數(shù)據(jù)分別為,,,,那么y關(guān)于x的經(jīng)驗(yàn)回歸直線必過點(diǎn)(

)A. B. C. D.【答案】D【分析】求出得中心點(diǎn),即為所求.【詳解】由已知,,所以回歸直線必過點(diǎn).故選:D.下列說法中正確的有(填正確說法的序號(hào)).①回歸直線恒過點(diǎn),且至少過一個(gè)樣本點(diǎn);②若樣本數(shù)據(jù)的方差為4,則數(shù)據(jù)的標(biāo)準(zhǔn)差為4;③已知隨機(jī)變量,且,則;④若線性相關(guān)系數(shù)越接近1,則兩個(gè)變量的線性相關(guān)性越弱;⑤是用來判斷兩個(gè)分類變量是否相關(guān)的隨機(jī)變量,當(dāng)?shù)闹岛苄r(shí)可以推斷兩個(gè)變量不相關(guān).【答案】②③【分析】根據(jù)線性回歸方程的概念可以判斷①,根據(jù)方差的性質(zhì)可以判斷②,根據(jù)正態(tài)分布的性質(zhì)可以判斷③,根據(jù)相關(guān)系數(shù)的概念可以判斷④,根據(jù)獨(dú)立性檢驗(yàn)的基本概念可以判斷⑤.【詳解】因?yàn)榛貧w直線可以不過樣本點(diǎn),所以①錯(cuò)誤;由于,所以數(shù)據(jù)的方差為16,故標(biāo)準(zhǔn)差為4,因此②正確;根據(jù)正態(tài)分布的概念,,故,即,故,因此③正確;根據(jù)相關(guān)系數(shù)的概念,若線性相關(guān)系數(shù)越接近1,則兩個(gè)變量的線性相關(guān)性越強(qiáng),故④錯(cuò)誤;的值很小時(shí)只能說明兩個(gè)變量的相關(guān)性不強(qiáng),故⑤錯(cuò)誤.故答案為:②③已知兩個(gè)變量和之間存在線性相關(guān)關(guān)系,某興趣小組收集了一組,的樣本數(shù)據(jù)如下表所示:123450.50.611.41.5根據(jù)表中數(shù)據(jù)利用最小二乘法得到的回歸方程是(

)A. B.C. D.【答案】C【分析】求出,,由回歸直線必過樣本中心,將點(diǎn)(,)依次代入各項(xiàng)檢驗(yàn)是否成立可得結(jié)果.【詳解】∵,∴回歸直線必過樣本中心(3,1),而A、B、D項(xiàng)中的回歸直線方程不過點(diǎn)(3,1),C項(xiàng)的回歸直線方程過點(diǎn)(3,1),故選:C.已知變量x和y的統(tǒng)計(jì)數(shù)據(jù)如表:x12345y55668根據(jù)上表可得回歸直線方程,據(jù)此可以預(yù)測當(dāng)時(shí),(

).A.9.2 B.9.5 C.9.9 D.10.1【答案】B【分析】計(jì)算出樣本中心點(diǎn)的坐標(biāo),代入回歸直線方程求得的值,然后在回歸直線方程中,令可求得結(jié)果.【詳解】由表格中的數(shù)據(jù)可得,,由于回歸直線過樣本的中心點(diǎn),,解得,所以,回歸直線方程為,當(dāng)時(shí),.故選:B.近年來,“考研熱”持續(xù)升溫,2022年考研報(bào)考人數(shù)官方公布數(shù)據(jù)為457萬,相比于2021年增長了80萬之多,增長率達(dá)到21%以上.考研人數(shù)急劇攀升原因較多,其中,本科畢業(yè)生人數(shù)增多、在職人士考研比例增大,是兩大主要因素.據(jù)統(tǒng)計(jì),某市各大高校近幾年的考研報(bào)考總?cè)藬?shù)如下表:年份20182019202020212022年份序號(hào)x12345報(bào)考人數(shù)y(萬人)1.11.622.5m根據(jù)表中數(shù)據(jù),可求得y關(guān)于x的線性回歸方程為,則m的值為___________.【答案】2.8【分析】求出的值,以及用表示出,代入線性回歸方程得到關(guān)于的方程,解出即可.【詳解】,,,,解得.故答案為:2.8.(多選)為了研究y關(guān)于x的線性相關(guān)關(guān)系,收集了5組樣本數(shù)據(jù)(見下表):x12345y0.50.811.21.5假設(shè)經(jīng)驗(yàn)回歸方程為,則(

)A.B.當(dāng)時(shí),y的預(yù)測值為2.2C.樣本數(shù)據(jù)y的40%分位數(shù)為0.8D.去掉樣本點(diǎn)后,x與y的樣本相關(guān)系數(shù)r不變【答案】ABD【分析】對于A選項(xiàng):根據(jù)回歸直線必過點(diǎn)解得;對于B選項(xiàng):結(jié)合經(jīng)驗(yàn)回歸方程的性質(zhì)即可求解;對于C選項(xiàng):結(jié)合百分位數(shù)的定義即可求解;對于D選項(xiàng):根據(jù)相關(guān)系數(shù)的性質(zhì)即可判斷;【詳解】對于A選項(xiàng):線性回歸方程必過點(diǎn),,,解得,所以選項(xiàng)A正確;對于B選項(xiàng):當(dāng)時(shí),可以的出y的預(yù)測值為2.2,所以B選項(xiàng)正確;對于C選項(xiàng):從小到大排列共有5個(gè)數(shù)據(jù),則是整數(shù),則第40百分位數(shù)為從小到大排列的第3個(gè)數(shù)據(jù),即第40百分位數(shù)為3,所以C選項(xiàng)錯(cuò)誤;對于D選項(xiàng):因?yàn)橄嚓P(guān)系數(shù)為,5組樣本數(shù)據(jù)的相關(guān)系數(shù)為:,去掉樣本中心點(diǎn)后相關(guān)系數(shù)為,所以相關(guān)系數(shù)r不變,所以D選項(xiàng)正確;故選:ABD.題型六相關(guān)系數(shù)的計(jì)算(多選)對于樣本相關(guān)系數(shù),下列說法正確的是(

)A.的取值范圍是B.越大,相關(guān)程度越弱C.越接近于0,成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng)D.越接近于1,成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng)【答案】AD【分析】根據(jù)已知條件,結(jié)合相關(guān)系數(shù)的定義,即可依次求解.【詳解】對于樣本相關(guān)系數(shù),取值范圍是,越大,越接近于1,成對樣本數(shù)據(jù)的線性相關(guān)程度越強(qiáng);越小,越接近于0,成對樣本數(shù)據(jù)的線性相關(guān)程度越弱.故選:AD(多選)已知關(guān)于變量x,y的4組數(shù)據(jù)如表所示:x681012ya1064根據(jù)表中數(shù)據(jù)計(jì)算得到x,y之間的線性回歸方程為,x,y之間的相關(guān)系數(shù)為r(參考公式:),則(

)A. B.變量x,y正相關(guān) C. D.【答案】AC【分析】根據(jù)回歸直線必過點(diǎn)解得,所以選項(xiàng)A正確;由回歸方程和表格可知選項(xiàng)B錯(cuò)誤;利用相關(guān)系數(shù)求出,所以選項(xiàng)C正確,選項(xiàng)D錯(cuò)誤.【詳解】回歸直線必過點(diǎn),,,解得,所以選項(xiàng)A正確;由回歸方程和表格可知,變量x,y負(fù)相關(guān),所以選項(xiàng)B錯(cuò)誤;,所以選項(xiàng)C正確,選項(xiàng)D錯(cuò)誤.故選:AC題型七求線性回歸直線方程(結(jié)合相關(guān)系數(shù)與二項(xiàng)式分布,超幾何分布,正態(tài)分布)近年來,“直播帶貨”成為一種常見的銷售方式,某果農(nóng)2018年至2022年通過直播銷售水果的年利潤(單位:萬元)如表所示:年份20182019202020212022年份代碼t12345年利潤/萬元2.42.74.16.47.9(1)由表中的數(shù)據(jù)判斷,能否用線性回歸模型擬合與的關(guān)系?請用相關(guān)系數(shù)加以說明(精確到0.01);(2)建立關(guān)于的線性回歸方程,并預(yù)測2025年該果農(nóng)通過直播銷售水果的利潤.參考數(shù)據(jù):,,.參考公式:相關(guān)系數(shù),回歸方程中斜率和截距的最小二乘估計(jì)公式分別為,.【答案】(1)答案見解析(2);萬元【分析】(1)結(jié)合參考數(shù)據(jù),求出相關(guān)系數(shù),進(jìn)而可以得出結(jié)論;(2)根據(jù)參考公式計(jì)算出,,然后寫出線性回歸方程.【詳解】(1)由題知,,又,,,所以,因?yàn)榕c的相關(guān)系數(shù)近似為,非常接近,所以與的線性相關(guān)程度很高,可以用線性回歸模型擬合與的關(guān)系.(2),,故關(guān)于的線性回歸方程為.易知年對應(yīng)的年份代碼,當(dāng)時(shí),,所以預(yù)測年該果農(nóng)通過直播銷售水果的利潤為萬元.比亞迪,這個(gè)在中國乘用車市場嶡露頭角的中國品牌,如今已經(jīng)在全球汽車品牌銷量前十中占據(jù)一席之地.這一成就不僅是比亞迪的里程硨,更是中國新能源汽車行業(yè)的里程碑,標(biāo)志著中國已經(jīng)在全球范圍內(nèi)成為了新能源汽車領(lǐng)域的強(qiáng)國.比亞迪旗下的宋plus自2020年9月上市以來,在SUV車型中的月銷量遙遙領(lǐng)先,現(xiàn)統(tǒng)計(jì)了自上市以來截止到2023年8月的宋plus的月銷量數(shù)據(jù).(1)通過調(diào)查研究發(fā)現(xiàn),其他新能源汽車的崛起、購置稅減免政策的頒布等,影響了汽車的月銷量,現(xiàn)將殘差過大的數(shù)據(jù)剔除掉,得到2022年8月至2023年8月部分月份月銷量(單位:萬輛)和月份編號(hào)的成對樣本數(shù)據(jù)統(tǒng)計(jì).月份2022.82022.92022.122023.12023.22023.32023.42023.62023.7202.8月份編號(hào)12345678910月銷量(單位:萬輛)4.254.594.993.53.783.012.462.723.023.28請用樣本相關(guān)系數(shù)說明與之間的關(guān)系可否用一元線性回歸模型擬合?若能,求出關(guān)于的經(jīng)驗(yàn)回歸方程;若不能,請說明理由.(運(yùn)算過程及結(jié)果均精確到0.01)(若,則線性相關(guān)程度很高,可用一元線性回歸模型擬合)(2)為慶祝2023年“雙節(jié)”(中秋節(jié)和國慶節(jié)),某地店特推出抽獎(jiǎng)優(yōu)惠活動(dòng),獎(jiǎng)項(xiàng)共設(shè)一、二、三等獎(jiǎng)三個(gè)獎(jiǎng)項(xiàng),其中一等獎(jiǎng)、二等獎(jiǎng)、三等獎(jiǎng)分別獎(jiǎng)勵(lì)1萬元、5千元、2千元,抽中一等獎(jiǎng)、二等獎(jiǎng)、三等獎(jiǎng)的概率分別為.現(xiàn)有甲、乙兩人參加了抽獎(jiǎng)活動(dòng)(每人只有一次抽獎(jiǎng)機(jī)會(huì)),假設(shè)他們是否中獎(jiǎng)相互獨(dú)立,求兩人所獲獎(jiǎng)金總額超過1萬元的概率.參考公式:樣本相關(guān)系數(shù),.參考數(shù)據(jù):,.【答案】(1)能,(2)【分析】(1)利用公式計(jì)算出相關(guān)系數(shù),從而得解;(2)分析所求概率甲、乙兩人的獲獎(jiǎng)情況,從而得解.【詳解】(1)依題意,,因?yàn)?,所以,因?yàn)椋?,所以,則,故y與t的線性相關(guān)程度很高,可以用線性回歸模型擬合,此時(shí),則,所以關(guān)于的經(jīng)驗(yàn)回歸方程為.(2)依題意,甲、乙兩人所獲獎(jiǎng)金總額超過1萬元必須兩人中至少有一人獲得一等獎(jiǎng),所以甲、乙兩人所獲獎(jiǎng)金總額超過1萬元的概率為.已知某綠豆新品種發(fā)芽的適宜溫度在6℃~22℃之間,一農(nóng)學(xué)實(shí)驗(yàn)室研究人員為研究溫度(℃)與綠豆新品種發(fā)芽數(shù)(顆)之間的關(guān)系,每組選取了成熟種子50顆,分別在對應(yīng)的8℃~14℃的溫度環(huán)境下進(jìn)行實(shí)驗(yàn),得到如下散點(diǎn)圖:(1)由折線統(tǒng)計(jì)圖看出,可用線性回歸模型擬合與的關(guān)系,請用相關(guān)系數(shù)加以說明;(2)建立關(guān)于的回歸方程,并預(yù)測在19℃的溫度下,種子發(fā)芽的顆數(shù).參考數(shù)據(jù):,,,.參考公式:相關(guān)系數(shù),回歸直線方程中斜率和截距的最小二乘估計(jì)公式分別為,.【答案】(1)答案見解析;(2)44.【分析】(1)直接套公式求出系數(shù)r,即可判斷;(2)套公式求出回歸方程,把代入,即可求解.【詳解】(1)由題意可知:..又,所以相關(guān)系數(shù).因?yàn)橄嚓P(guān)系數(shù),所以與的線性相關(guān)性較高,可以利用線性回歸模型擬合與的關(guān)系.(2)由(1)知,,,.所以,所以.所以與的回歸直線為.當(dāng)時(shí),.即在19℃的溫度下,種子發(fā)芽的顆數(shù)為44.某騎行愛好者近段時(shí)間在專業(yè)人士指導(dǎo)下對騎行情況進(jìn)行了統(tǒng)計(jì),各次騎行期間的身體綜合指標(biāo)評(píng)分與對應(yīng)用時(shí)(單位:小時(shí))如下表:身體綜合指標(biāo)評(píng)分()12345用時(shí)(/小時(shí))108.5876.5(1)由上表數(shù)據(jù)看出,可用線性回歸模型擬合與的關(guān)系,請用相關(guān)系數(shù)如以說明;(2)建立關(guān)于的回歸方程.參考數(shù)據(jù)和參考公式:相關(guān)系數(shù),,,.【答案】(1)答案見解析(2)【分析】(1)根據(jù)表格數(shù)據(jù)可分別計(jì)算出與的平均值,再代入計(jì)算可得相關(guān)系數(shù)近似為,即可知與相關(guān)程度較高;(2)根據(jù)(1)中的計(jì)算結(jié)果可得,代入計(jì)算可得,即可求得關(guān)于的回歸方程.【詳解】(1)由題意得,,,,,因此相關(guān)系數(shù).即相關(guān)系數(shù)近似為,與負(fù)相關(guān),且相關(guān)程度相當(dāng)高,從而可用線性回歸模型擬合與的關(guān)系;(2)由(1)中數(shù)據(jù),得,,所以關(guān)于的回歸方程為.火車晚點(diǎn)是人們在旅行過程中最常見的問題之一,針對這個(gè)問題,許多人都會(huì)打進(jìn)行投訴.某市火車站為了解每年火車的正點(diǎn)率對每年顧客投訴次數(shù)(單位:次)的影響,對近8年(2015年~2022年)每年火車正點(diǎn)率和每年顧客投訴次數(shù)的數(shù)據(jù)作了初步處理,得到下面的一些統(tǒng)計(jì)量的值.60059243837.293.8(1)求關(guān)于的經(jīng)驗(yàn)回歸方程;若預(yù)計(jì)2024年火車的正點(diǎn)率為,試估算2024年顧客對火車站投訴的次數(shù);(2)根據(jù)顧客對火車站投訴的次數(shù)等標(biāo)準(zhǔn),該火車站這8年中有6年被評(píng)為“優(yōu)秀”,2年為“良好”,若從這8年中隨機(jī)抽取3年,記其中評(píng)價(jià)“良好”的年數(shù)為,求的分布列和數(shù)學(xué)期望.附:經(jīng)驗(yàn)回歸直線的斜率和截距的最小二乘法估計(jì)公式分別為:,【答案】(1),20次;(2)分布列見解析,.【分析】(1)應(yīng)用最小二乘法求回歸直線,再代入估算2024年顧客對火車站投訴的次數(shù);(2)根據(jù)題意寫出的可能取值,應(yīng)用超幾何概率公式求對應(yīng)概率,即得分布列,進(jìn)而求期望.【詳解】(1)由題設(shè),,則,所以,所以;當(dāng)時(shí),代入,得到,所以2024年顧客對該市火車站投訴的次數(shù)約為20次.(2)由題意,服從超幾何分布,可取0,1,2,,,,012所以.直播帶貨是一種直播和電商相結(jié)合的銷售手段,目前已被廣大消費(fèi)者所接受.針對這種現(xiàn)狀,某公司決定逐月加大直播帶貨的投入,直播帶貨銷售金額穩(wěn)步提升,以下是該公司2023年前6個(gè)月的帶貨金額:月份123456帶貨金額萬元25435445495416542054(1)根據(jù)統(tǒng)計(jì)表中的數(shù)據(jù),計(jì)算變量與的樣本相關(guān)系數(shù),并判斷兩個(gè)變量與的相關(guān)程度(若,則認(rèn)為相關(guān)程度較強(qiáng);否則沒有較強(qiáng)的相關(guān)程度,精確到0.01);(2)若與的相關(guān)關(guān)系擬用線性回歸模型表示,試求關(guān)于的經(jīng)驗(yàn)回歸方程,并據(jù)此預(yù)測2023年10月份該公司的直播帶貨金額(精確到整數(shù)).附:經(jīng)驗(yàn)回歸方程,其中,樣本相關(guān)系數(shù);參考數(shù)據(jù):.【答案】(1),與相關(guān)程度較強(qiáng),且正相關(guān);(2),預(yù)測2023年10月份該公司的直播帶貨金額為3443萬元.【分析】(1)直接代入相關(guān)系數(shù)方程即可.(2)求出線性回歸方程,再將代入計(jì)算即可.【詳解】(1)由已知可得.又,所以,則樣本相關(guān)系數(shù)因?yàn)闃颖鞠嚓P(guān)系數(shù),所以與相關(guān)程度較強(qiáng),且正相關(guān).(2)設(shè)關(guān)于的經(jīng)驗(yàn)回歸方程為,其中,,所以關(guān)于的經(jīng)驗(yàn)回歸方程為.把代入得(萬元).所以預(yù)測2023年10月份該公司的直播帶貨金額為3443萬元.為助力四川新冠疫情后的經(jīng)濟(jì)復(fù)蘇,某電商平臺(tái)為某工廠的產(chǎn)品開設(shè)直播帶貨專場.為了對該產(chǎn)品進(jìn)行合理定價(jià),用不同的單價(jià)在平臺(tái)試銷,得到如下數(shù)據(jù):單價(jià)x(元/件)88.28.48.68.89銷量y(萬件)908483807568(1)根據(jù)以上數(shù)據(jù),求y關(guān)于x的線性回歸方程;(2)若該產(chǎn)品成本是4元/件,假設(shè)該產(chǎn)品全部賣出,預(yù)測把單價(jià)定為多少時(shí),工廠獲得最大利潤?(參考公式:回歸方程,其中,).【答案】(1)(2)單價(jià)定為8.25元時(shí),工廠獲得利潤最大【分析】(1)求出,代入公式求出,得到線性回歸方程;(2)設(shè)獲得的利潤為L萬元,表達(dá)出利潤關(guān)于的關(guān)系式,配方后得到最大利潤.【詳解】(1),.,,∴,∴,所以回歸直線方程為(2)設(shè)工廠獲得的利潤為L萬元,則,所以該產(chǎn)品的單價(jià)定為8.25元時(shí),工廠獲得利潤最大.人工智能教育是將人工智能與傳統(tǒng)教育相結(jié)合,借助人工智能和大數(shù)據(jù)技術(shù)打造的智能化教育生態(tài).為了解我國人工智能教育發(fā)展?fàn)顩r,通過中國互聯(lián)網(wǎng)數(shù)據(jù)平臺(tái)得到我國2015年-2020年人工智能教育市場規(guī)模統(tǒng)計(jì)圖.如圖所示,若用x表示年份代碼(2015年用1表示,2016年用2表示,依次類推),用y表示市場規(guī)模(單位:億元),試回答:(1)根據(jù)條形統(tǒng)計(jì)圖中數(shù)據(jù),計(jì)算變量y與x的相關(guān)系數(shù)r,并用r判斷兩個(gè)變量y與x相關(guān)關(guān)系的強(qiáng)弱(精確到小數(shù)點(diǎn)后2位);(2)若y與x的相關(guān)關(guān)系擬用線性回歸模型表示,試求y關(guān)于x的線性回歸方程,并據(jù)此預(yù)測2022年中國人工智能教育市場規(guī)模(精確到1億元).附:線性回歸方程y=bx+相關(guān)系數(shù)r=i=1參考數(shù)據(jù):i=16【答案】(1)r≈0.96,正相關(guān)很強(qiáng).(2)y=382.86x-386.01,2677億元【分析】(1)根據(jù)統(tǒng)計(jì)圖中數(shù)據(jù)計(jì)算x,y,i=1(2)根據(jù)統(tǒng)計(jì)圖中數(shù)據(jù)結(jié)合公式即可求出線性回歸方程,將x=8代入線性回歸方程即可預(yù)測2022年中國人工智能教育市場規(guī)模.【詳解】(1)∵x=16i=16xi∴相關(guān)系數(shù)r=6700∵相關(guān)系數(shù)r≈0.96>0.75,∴y與x具有線性相關(guān)關(guān)系,且正相關(guān)很強(qiáng).(2)設(shè)y關(guān)于x的線性回歸方程為y=其中b=a=∴y關(guān)于x的線性回歸方程為y=382.86x-386.01把x=8代入得y≈2677(億元)故據(jù)此預(yù)測2022年中國人工智能教育市場規(guī)模將達(dá)到約2677億元.網(wǎng)上購物就是通過互聯(lián)網(wǎng)檢索商品信息,并通過電子訂購單發(fā)出購物請求,廠商通過郵購的方式發(fā)貨或通過快遞公司送貨上門,貨到后通過銀行轉(zhuǎn)賬?微信或支付寶支付等方式在線匯款,根據(jù)2019年中國消費(fèi)者信息研究,超過40%的消費(fèi)者更加頻繁地使用網(wǎng)上購物,使得網(wǎng)上購物和送貨上門的需求量激增,越來越多的消費(fèi)者也首次通過第三方APP?品牌官方網(wǎng)站和微信社群等平臺(tái)進(jìn)行購物,某天貓專營店統(tǒng)計(jì)了2020年8月5日至9日這5天到該專營店購物的人數(shù)yi和時(shí)間第xx12345y75849398100由表中給出的數(shù)據(jù)是否可用線性回歸模型擬合人數(shù)y與時(shí)間x之間的關(guān)系?若可用,估計(jì)8月10日到該專營店購物的人數(shù)(人數(shù)用四舍五入法取整數(shù);若|r|>0.75,則線性相關(guān)程度很高,可用線性回歸模型擬合,計(jì)算r時(shí)精確到0.01).參考數(shù)據(jù):4340≈65.88.附:相關(guān)系數(shù)r=i=1nxi【答案】可用線性回歸模型擬合人數(shù)y與天數(shù)x之間的關(guān)系,8月10日到該專營店購物的人數(shù)約為109;【分析】利用題中所給數(shù)據(jù)和公式,求出相關(guān)系數(shù)r的值,由此判斷變量y與x具有很強(qiáng)的線性相關(guān)性,再求出b和a,得線性回歸方程,令x=6代入即可求解;【詳解】解:由表中數(shù)據(jù)可得x=3,y=90,i=1,i=15所以r=i=1所以可用線性回歸模型擬合人數(shù)y與天數(shù)x之間的關(guān)系.而b=則a=所以y=6.4x+70.8令x=6,可得y=109.2答:8月10日到該專營店購物的人數(shù)約為109.題型八殘差分析已知變量x和y的統(tǒng)計(jì)數(shù)據(jù)如下表:x678910y3.5455.57如果由表中數(shù)據(jù)可得經(jīng)驗(yàn)回歸直線方程為,那么,當(dāng)時(shí),殘差為______.(注:殘差=觀測值預(yù)測值)【答案】/【分析】先求出回歸方程,再根據(jù)回歸方程求出預(yù)測值,最后計(jì)算殘差即可.【詳解】,所以,所以時(shí),,所以殘差為.故答案為:.已知回歸方程,而試驗(yàn)中的一組數(shù)據(jù)是,,,則其殘差平方和是______.【答案】0.03【分析】利用殘差的定義求解,求得的殘差平方后求和即可.【詳解】殘差,當(dāng)時(shí),,當(dāng)時(shí),,當(dāng)時(shí),,殘差平方和為故答案為:0.03.經(jīng)驗(yàn)表明,樹高與胸徑具有線性關(guān)系,為了解回歸方程的擬合效果,利用下列數(shù)據(jù)計(jì)算殘差,用來繪制殘差圖.胸徑x/cm18.219.122.324.526.2樹高的觀測值y/m18.919.420.822.824.8樹高的預(yù)測值18.619.321.523.024.4則殘差的最大值和最小值分別是(

)A.0.4,1.8 B.1.8,0.4 C.0.4,0.7 D.0.7,0.4【答案】C【分析】根據(jù)表內(nèi)數(shù)據(jù)進(jìn)行分析,計(jì)算各組數(shù)據(jù)殘差值,找出最大及最小即可.【詳解】解:由表可得,各組數(shù)據(jù)的殘差為:,,,,,故殘差最大值為0.4,最小值為0.7.故選:C某工廠為研究某種產(chǎn)品的產(chǎn)量x(噸)與所需某種原材料y(噸)的相關(guān)性,在生產(chǎn)過程中收集了對應(yīng)數(shù)據(jù)如表所示:x3456y235根據(jù)表中數(shù)據(jù),得出y關(guān)于x的經(jīng)驗(yàn)回歸方程為.據(jù)此計(jì)算出在樣本處的殘差為,則表中m的值為__________.【答案】/【分析】先由樣本處的殘差求得,再由樣本中心落在回歸直線上得到關(guān)于的方程,解之即可.【詳解】因?yàn)榛貧w方程為,在樣本處的殘差為,所以,得,故回歸方程為,因?yàn)椋?,所以,解得,故m的值為.故答案為:.(多選)對具有相關(guān)關(guān)系的兩個(gè)變量x和y進(jìn)行回歸分析時(shí),經(jīng)過隨機(jī)抽樣獲得成對的樣本點(diǎn)數(shù)據(jù),則下列結(jié)論正確的是(

)A.若兩變量x,y具有線性相關(guān)關(guān)系,則回歸直線至少經(jīng)過一個(gè)樣本點(diǎn)B.若兩變量x,y具有線性相關(guān)關(guān)系,則回歸直線一定經(jīng)過樣本點(diǎn)中心C.若以模型擬合該組數(shù)據(jù),為了求出回歸方程,設(shè),將其變換后得到線性方程,則a,h的估計(jì)值分別是3和6D.回歸分析中常用殘差平方和來刻畫擬合效果好壞,殘差平方和越小,擬合效果越好【答案】BCD【分析】根據(jù)回歸方程的性質(zhì)判斷A,B,比較列方程確定a,h的估計(jì)值判斷C,根據(jù)殘差和的意義判斷D.【詳解】對于A,若兩變量x,y具有線性相關(guān)關(guān)系,則所有樣本點(diǎn)都可能不在回歸直線上,A錯(cuò)誤;對于B,若兩變量x,y具有線性相關(guān)關(guān)系,則回歸直線一定經(jīng)過樣本點(diǎn)中心,B正確;對于C,因?yàn)椋?,即,又,所以a,h的估計(jì)值分別是3和6,C正確;對于D,殘差平方和越小,擬合效果越好,D正確;故選:BCD.題型九相關(guān)指數(shù)關(guān)于線性回歸的描述,下列命題錯(cuò)誤的是(

)A.回歸直線一定經(jīng)過樣本點(diǎn)的中心 B.殘差平方和越小,擬合效果越好C.決定系數(shù)越接近1,擬合效果越好 D.殘差平方和越小,決定系數(shù)越小【答案】D【分析】根據(jù)線性回歸的性質(zhì)判斷即可【詳解】對A,回歸直線一定經(jīng)過樣本點(diǎn)的中心正確;對B,殘差平方和越小,擬合效果越好正確;對C,決定系數(shù)越接近1,擬合效果越好正確;對D,殘差平方和越小,擬合效果越好,決定系數(shù)越接近1,故D錯(cuò)誤(多選)進(jìn)入21世紀(jì)以來,全球二氧化碳排放量增長迅速,自2000年至今,全球二氧化碳排放量增加了約40%,我國作為發(fā)展中國家,經(jīng)濟(jì)發(fā)展仍需要大量的煤炭能源消耗.下圖是2016—2020年中國二氧化碳排放量的統(tǒng)計(jì)圖表(以2016年為第1年).利用圖表中數(shù)據(jù)計(jì)算可得,采用某非線性回歸模型擬合時(shí),;采用一元線性回歸模型擬合時(shí),線性回歸方程為,.則下列說法正確的是(

)A.由圖表可知,二氧化碳排放量y與時(shí)間x正相關(guān)B.由決定系數(shù)可以看出,線性回歸模型的擬合程度更好C.利用線性回歸方程計(jì)算2019年所對應(yīng)的樣本點(diǎn)的殘差為0.30D.利用線性回歸方程預(yù)計(jì)2025年中國二氧化碳排放量為107.24億噸【答案】ABD【分析】根據(jù)散點(diǎn)圖即可判斷A;根據(jù)決定系數(shù)越接近于1,擬合效果越好即可判斷B;求出2019年所對應(yīng)的樣本點(diǎn)的殘差即可判斷C;由回歸方程求出當(dāng)時(shí)的估計(jì)值即可判斷D.【詳解】解:由散點(diǎn)圖可得二氧化碳排放量y與時(shí)間x正相關(guān),故A正確;因?yàn)椋跃€性回歸模型的擬合程度更好,故B正確;當(dāng)時(shí),,而,故C錯(cuò)誤;當(dāng)時(shí),,即利用線性回歸方程預(yù)計(jì)2025年中國二氧化碳排放量為107.24億噸,故D正確.故選:ABD.某種農(nóng)作物可以生長在灘涂和鹽堿地,它的灌溉是將海水稀釋后進(jìn)行灌溉.某實(shí)驗(yàn)基地為了研究海水濃度(%)對畝產(chǎn)量(噸)的影響,通過在試驗(yàn)田的種植實(shí)驗(yàn),測得了該農(nóng)作物的畝產(chǎn)量與海水濃度的數(shù)據(jù)如下表.海水濃度(%)34567畝產(chǎn)量(噸)0.570.530.440.360.30殘差0.010.02mn0繪制散點(diǎn)圖發(fā)現(xiàn),可以用線性回歸模型擬合畝產(chǎn)量(噸)與海水濃度(%)之間的相關(guān)關(guān)系,用最小二乘法計(jì)算得與之間的線性回歸方程為.(1)求的值;(參考公式:)(2)統(tǒng)計(jì)學(xué)中常用相關(guān)指數(shù)來刻畫回歸效果,越大,回歸效果越好,如假設(shè),就說明預(yù)報(bào)變量的差異有是解釋變量引起的.請計(jì)算相關(guān)指數(shù)(精確到0.01),并指出畝產(chǎn)量的變化多大程度上是由灌溉海水濃度引起的?附殘差相關(guān)指數(shù)其中【答案】(1)0;0.01(2)0.99,畝產(chǎn)量的變化有是由灌溉海水濃度引起的.【分析】(1)計(jì)算代入回歸方程可得,利用殘差求解方法可得的值;(2)利用相關(guān)指數(shù)的公式求解出相關(guān)指數(shù)的值,結(jié)合結(jié)果可得判斷.【詳解】(1)因?yàn)椋?/p>

所以,即,所以線性回歸方程為,

所以,.

,.(2),所以相關(guān)指數(shù).故畝產(chǎn)量的變化有是由灌溉海水濃度引起的.題型十求非線性回歸方程:冪函數(shù)方程擬合為了加快實(shí)現(xiàn)我國高水平科技自立自強(qiáng),某科技公司逐年加大高科技研發(fā)投入.下圖1是該公司2013年至2022年的年份代碼x和年研發(fā)投入y(單位:億元)的散點(diǎn)圖,其中年份代碼1~10分別對應(yīng)年份2013~2022.根據(jù)散點(diǎn)圖,分別用模型①,②作為年研發(fā)投入y(單位:億元)關(guān)于年份代碼x的經(jīng)驗(yàn)回歸方程模型,并進(jìn)行殘差分析,得到圖2所示的殘差圖.結(jié)合數(shù)據(jù),計(jì)算得到如下表所示的一些統(tǒng)計(jì)量的值:752.2582.54.512028.35表中,.(1)根據(jù)殘差圖,判斷模型①和模型②哪一個(gè)更適宜作為年研發(fā)投入y(單位:億元)關(guān)于年份代碼x的經(jīng)驗(yàn)回歸方程模型?并說明理由;(2)(i)根據(jù)(1)中所選模型,求出y關(guān)于x的經(jīng)驗(yàn)回歸方程;(ii)設(shè)該科技公司的年利潤(單位:億元)和年研發(fā)投入y(單位:億元)滿足(且),問該科技公司哪一年的年利潤最大?附:對于一組數(shù)據(jù),,…,,其經(jīng)驗(yàn)回歸直線的斜率和截距的最小二乘估計(jì)分別為,.【答案】(1)選擇模型②更適宜,理由見解析(2)(i);(ii)該公司2028年的年利潤最大【分析】(1)根據(jù)殘差圖確定;(2)根據(jù)最小二乘法求非線性回歸方程即可求解;【詳解】(1)根據(jù)圖2可知,模型①的殘差波動(dòng)性很大,說明擬合關(guān)系較差;模型②的殘差波動(dòng)性很小,基本分布在0的附近,說明擬合關(guān)系很好,所以選擇模型②更適宜.(2)(i)設(shè),所以,所以,,所以關(guān)于的經(jīng)驗(yàn)回歸方程為(ii)由題設(shè)可得,當(dāng)取對稱軸即,即時(shí),年利潤L有最大值,故該公司2028年的年利潤最大.某縣依托種植特色農(nóng)產(chǎn)品,推進(jìn)產(chǎn)業(yè)園區(qū)建設(shè),致富一方百姓.已知該縣近年人均可支配收入如下表所示,記年為,年為,…以此類推.年份年份代號(hào)人均可支配收入(萬元)(1)使用兩種模型:①;②的相關(guān)指數(shù)分別約為,,請選擇一個(gè)擬合效果更好的模型,并說明理由;(2)根據(jù)(1)中選擇的模型,試建立關(guān)于的回歸方程.(保留位小數(shù))附:回歸方程中斜率和截距的最小二乘估計(jì)公式分別為,.參考數(shù)據(jù):,令,.【答案】(1)應(yīng)選擇(2)【分析】(1)根據(jù)越大,模型擬合效果越好,可確定所選模型;(2)令,利用最小二乘法可求得,進(jìn)而得到回歸方程.【詳解】(1),根據(jù)統(tǒng)計(jì)學(xué)知識(shí)可知:越大,模型擬合效果越好,應(yīng)選擇模型.(2)令,,,,又,,,關(guān)于的回歸方程為.為幫助鄉(xiāng)村脫貧,某勘探隊(duì)計(jì)劃了解當(dāng)?shù)氐V脈某金屬的分布情況,測得了平均金屬含量y(單位:gm3)與樣本對原點(diǎn)的距離x(單位:m)的數(shù)據(jù),并作了初步處理,得到了下面的一些統(tǒng)計(jì)理的值.(表中uixyui=1i=1i=1i=1i=1697.900.21600.1414.1226.13-1.40(1)利用樣本相關(guān)系數(shù)的知識(shí),判斷y=a+bx與y=c+dx哪一個(gè)更適宜作為平均金屬含量y關(guān)于樣本對原點(diǎn)的距離(2)根據(jù)(1)的結(jié)果回答下列問題:①建立y關(guān)于x的回歸方程;②樣本對原點(diǎn)的距離x=20時(shí),金屬含量的預(yù)報(bào)值是多少?附:對于一組數(shù)據(jù)t1,s1,t2,s【答案】(1)y=c+d(2)①y=100-10x;【分析】(1)分別求出y=a+bx與y=c+dx所對應(yīng)的線性相關(guān)系數(shù)r(2)根據(jù)數(shù)據(jù)和公式即可求得y關(guān)于x的回歸方程,根據(jù)回歸方程代入x=20,即可求出金屬含量的預(yù)報(bào)值.【詳解】(1)由題y=a+bx的線性相關(guān)系數(shù)r1y=c+dx的線性相關(guān)系數(shù)因?yàn)閞1r2所以y=c+dx更適宜作為平均金屬含量y關(guān)于樣本對原點(diǎn)的距離x(2)①由(1)y=c+dx,令ui則y=d所以d=i=1n則y=100-10u=100-10即y=100-10②當(dāng)x=20時(shí),金屬含量的預(yù)報(bào)值y=100-數(shù)獨(dú)是源自18世紀(jì)瑞士的一種數(shù)學(xué)游戲,玩家需要根據(jù)9×9盤面上的已知數(shù)字,推理出所有剩余空格的數(shù)字,并滿足每一行、每一列、每一個(gè)粗線宮(3×3)內(nèi)的數(shù)字均含1~9,且不重復(fù).?dāng)?shù)獨(dú)愛好者小明打算報(bào)名參加“絲路杯”全國數(shù)獨(dú)大賽初級(jí)組的比賽.參考數(shù)據(jù)t=1i=1ti=117500.370.55參考公式:對于一組數(shù)據(jù)(u1,v1),(1)賽前小明進(jìn)行了一段時(shí)間的訓(xùn)練,每天解題的平均速度y(秒/題)與訓(xùn)練天數(shù)x(天)有關(guān),經(jīng)統(tǒng)計(jì)得到如下數(shù)據(jù):x(天)1234567y(秒/題)910800600440300240210現(xiàn)用y=a+bx作為回歸方程模型,請利用表中數(shù)據(jù),求出該回歸方程;((2)小明和小紅玩“對戰(zhàn)賽”,每局兩人同時(shí)開始解一道數(shù)獨(dú)題,先解出題的人獲勝,不存在平局,兩人約定先勝3局者贏得比賽.若小明每局獲勝的概率為23,且各局之間相互獨(dú)立,設(shè)比賽X局后結(jié)束,求隨機(jī)變量X【答案】(1)y=(2)分布列見解析,均值107【分析】(1)由y=a+bx,ti=(2)根據(jù)隨機(jī)變量X的可能取值逐一分析,當(dāng)X=3時(shí),小明連勝3局或小紅連勝3局;當(dāng)X=4時(shí),小明前3局勝2局最后一局勝或小紅前3局勝2局最后一局勝;當(dāng)X=5時(shí),小明前4局勝2局最后一局勝或小紅前4局勝2局最后一局勝;分別求出每個(gè)取值的概率.最后代入期望公式計(jì)算即可.【詳解】(1)解:因?yàn)閥=a+因?yàn)閥=所以b=所以a=所以y=所以所求回歸方程為y=(2)解:隨機(jī)變量X的所有可能取值為3,4,5,P(P(P(所以隨機(jī)變量X的分布列為X345P1108E(在正常生產(chǎn)條件下,根據(jù)經(jīng)驗(yàn),可以認(rèn)為化肥的有效利用率近似服從正態(tài)分布N(0.54,0.022(1)假設(shè)生產(chǎn)條件正常,記X表示化肥的有效利用率,求P(X≥0.56);(2)課題組為研究每畝化肥施用量與某農(nóng)作物畝產(chǎn)量之間的關(guān)系,收集了10組數(shù)據(jù),并對這些數(shù)據(jù)作了初步處理,得到了如圖所示的散點(diǎn)圖及一些統(tǒng)計(jì)量的值.其中每畝化肥施用量為x(單位:公斤),糧食畝產(chǎn)量為y(單位:百公斤)參考數(shù)據(jù):i=1i=1i=1i=1i=1i=1i=1i=165091.552.51478.630.5151546.5ti=lnxi,zi=lny(i)根據(jù)散點(diǎn)圖判斷,y=a+bx與y=cxd,哪一個(gè)適宜作為該農(nóng)作物畝產(chǎn)量y關(guān)于每畝化肥施用量(ii)根據(jù)(i)的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;并預(yù)測每畝化肥施用量為27公斤時(shí),糧食畝產(chǎn)量y的值.(附:①對于一組數(shù)據(jù)(ui,vi)(i=1,2,3,…,n),其回歸直線②若隨機(jī)變量X~N(μ,σ2),則P(μ-σ<X<μ+σ)≈0.6827【答案】(1)0.15865(2)(i)y=cxd適宜作為糧食畝產(chǎn)量y關(guān)于每畝化肥施用量x的回歸方程;(ii)y=e【分析】(1)根據(jù)正態(tài)分布曲線的對稱性,結(jié)合P(X>0.56)=1-P(μ-σ<X<μ+σ)(2)(i)由散點(diǎn)圖可知y與x的關(guān)系不是線性關(guān)系,即可得到答案;(ii)由y=cxd,得到lny=dlnx+lnc,令【詳解】(1)解:由X~N0.54,可得P(X>0.56)=1-P(0.54-0.02<X<0.54+0.02)(2)解:(i)由散點(diǎn)圖可知y與x的關(guān)系不是線性關(guān)系,所以y=cxd適宜作為糧食畝產(chǎn)量y關(guān)于每畝化肥施用量(ii)因?yàn)閥=cxd,所以lny=dlnx+由表可得t=1.5,z=1.5所以lnc=z-dt=1.5-當(dāng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論