版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、_3.1回歸分析的基本思想及其初步應(yīng)用回歸直線方程提出問題必修3中,求出回歸直線方程x.問題1:回歸直線方程準(zhǔn)確的反映了x,y之間的關(guān)系嗎?提示:不是問題2:所有的兩個相關(guān)變量都可以求回歸方程嗎?提示:可以,但擬合程度很差導(dǎo)入新知1回歸分析回歸分析是對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的一種常用方法2回歸直線方程方程x是兩個具有線性相關(guān)關(guān)系的變量的一組數(shù)據(jù)(x1,y1)(x2,y2),(xn,yn)的回歸方程,其中,是待定參數(shù),其最小二乘估計分別為:其中i,i,(,)稱為樣本點的中心化解疑難線性回歸方程中系數(shù)的含義(1)是回歸直線的斜率的估計值,表示x每增加一個單位,y的平均增加單位數(shù),而不是
2、增加單位數(shù)(2)當(dāng)0時,變量y與x具有正的線性相關(guān)關(guān)系;當(dāng)0時,變量y與x具有負(fù)的線性相關(guān)關(guān)系線性回歸分析提出問題具有相關(guān)關(guān)系的兩個變量的回歸直線方程x.問題1:預(yù)報變量與真實值y一樣嗎?提示:不一定問題2:預(yù)報值與真實值y之間誤差大了好還是小了好?提示:越小越好導(dǎo)入新知1殘差平方和法(1)iyiiyixi(i1,2,n),稱為相應(yīng)于點(xi,yi)的殘差(2)殘差平方和(yii)2越小,模型擬合效果越好2殘差圖法殘差點比較均勻地落在水平的帶狀區(qū)域內(nèi),說明選用的模型比較合適,其中這樣的帶狀區(qū)域?qū)挾仍秸?,說明模型的精確度越高3利用相關(guān)指數(shù)r2刻畫回歸效果其計算公式為:r21,其幾何意義:r2越接
3、近于1,表示回歸效果越好化解疑難1在線性回歸模型中,因為e是一個隨機變量,所以可以通過其數(shù)字特征來刻畫它的一些總體特征2在線性回歸模型中,r2表示解釋變量對于預(yù)報變量變化的貢獻率,r2越接近于1,表示回歸的效果越好求線性回歸方程例1某種產(chǎn)品的廣告費用支出x與銷售額y(單位:百萬元)之間有如下的對應(yīng)數(shù)據(jù):x/百萬元24568y/百萬元3040605070(1)畫出散點圖;(2)求線性回歸方程;(3)試預(yù)測廣告費用支出為10百萬元時,銷售額多大?解(1)散點圖如圖所示:(2)列出下表,并用科學(xué)計算器進行有關(guān)計算:i12345合計xi2456825yi3040605070250xiyi6016030
4、03005601 380x416253664145所以,5,50,145,iyi1 380.于是可得6.5, 506.5517.5.所以所求的線性回歸方程為6.5x17.5.(3)根據(jù)上面求得的線性回歸方程,當(dāng)廣告費用支出為10百萬元時,6.51017.582.5(百萬元),即廣告費用支出為10百萬元時,銷售額大約為82.5百萬元類題通法求線性回歸方程的步驟(1)列表表示xi,yi,xiyi,x;(2)計算,iyi;(3)代入公式計算,的值;(4)寫出線性回歸方程活學(xué)活用為了估計山上積雪融化后對下游灌溉的影響,在山下建立了一個觀測站,測量了最大積雪深度x(尺)與當(dāng)年灌溉面積y(千畝),得到連續(xù)
5、10年的數(shù)據(jù)于下表:年序最大積雪深度x/尺灌溉面積y/千畝115.228.6210.419.3321.240.5418.635.6526.448.9623.445.0713.529.2816.734.1924.046.71019.137.4(1)試根據(jù)散點圖判斷變量y與x是否相關(guān)?(2)若y與x相關(guān),求出回歸直線方程解:為了研究這些數(shù)據(jù)中所蘊含的規(guī)律性,我們把各年最大積雪深度作為橫坐標(biāo),相應(yīng)的灌溉面積作為縱坐標(biāo),將這些數(shù)據(jù)點標(biāo)在平面直角坐標(biāo)系中,如下圖所示從上圖可以看到,數(shù)據(jù)點大致落在一條直線附近,這告訴我們變量x與y之間的關(guān)系大致可看作是線性關(guān)系,從上圖還可以看到,這些點又不都在一條直線上,
6、這表明x與y的關(guān)系并沒有確切到給定x就可以唯一地確定y的程度,事實上,還有許多其他因素對y產(chǎn)生影響,如當(dāng)年的平均氣溫,當(dāng)年的降雨量等等,這些都是影響y取什么值的隨機因素,研究x與y的關(guān)系,利用公式得,(15.210.419.1)18.85,(28.619.337.4)36.53,x10 2227.845,xiyi10 413.065,1.813,36.531.81318.852.355.從而回歸直線方程為1.813x2.355.線性回歸分析例2已知某種商品的價格x(元)與需求量y(件)之間的關(guān)系有如下一組數(shù)據(jù):x(元)1416182022y(件)1210753求y對x的回歸直線方程,并說明回歸
7、模型擬合效果的好壞解(1416182022)18,(1210753)7.4,1421621822022221 660,122102725232327,iyi14121610187205223620,1.15. 7.41.151828.1,所求回歸直線方程為1.15x28.1.列出殘差表:yii00.30.40.10.2yi4.62.60.42.44.4(yii)20.3,(yi)253.2,r210.994,故回歸模型的擬合效果很好類題通法在進行線性回歸分析時,要按線性回歸分析步驟進行在求r2時,通常采用分步計算的方法,r2越大,模型的擬合效果越好活學(xué)活用關(guān)于x與y有如下數(shù)據(jù):x24568y3
8、040605070有如下的兩個線性模型:(1)6.5x17.5;(2)7x17.試比較哪一個擬合效果更好解:由(1)可得yii與yi的關(guān)系如下表:yii0.53.5106.50.5yi201010020(yii)2(0.5)2(3.5)2102(6.5)20.52155,(yi)2(20)2(10)2102022021 000.r110.845.由(2)可得yii與yi的關(guān)系如下表:yii15893yi201010020 (yii)2(1)2(5)282(9)2(3)2180,(yi)2(20)2(10)2021022021 000.r110.82.由于r0.845,r0.82,0.8450.
9、82,rr.(1)的擬合效果好于(2)的擬合效果.非線性回歸分析例3在一次抽樣調(diào)查中測得樣本的5個樣本點,數(shù)值如下表:x0.250.5124y1612521試建立y與x之間的回歸方程解作出變量y與x之間的散點圖,如圖所示由圖可知變量y與x近似地呈反比例函數(shù)關(guān)系設(shè)y,令t,則ykt.由y與x的數(shù)據(jù)表可得y與t的數(shù)據(jù)表:t4210.50.25y1612521作出y與t的散點圖,如圖所示:由圖可知y與t近似地呈線性相關(guān)關(guān)系又1.55,7.2,iyi94.25,21.312 5,4.134 4, 7.24.134 41.550.8,4.134 4t0.8.所以y與x的回歸方程是0.8.類題通法非線性回
10、歸分析的步驟非線性回歸問題有時并不給出經(jīng)驗公式這時我們可以畫出已知數(shù)據(jù)的散點圖,把它與學(xué)過的各種函數(shù)(冪函數(shù)、指數(shù)函數(shù)、對數(shù)函數(shù)等)圖象作比較,挑選一種跟這些散點擬合得最好的函數(shù),然后采用適當(dāng)?shù)淖兞孔儞Q,把問題化為線性回歸分析問題,使之得到解決其一般步驟為:活學(xué)活用3某電容器充電后,電壓達到100 v,然后開始放電,由經(jīng)驗知道,此后電壓u隨時間t變化的規(guī)律用公式uaebt(b0)表示,現(xiàn)測得時間t(s)時的電壓u(v)如下表:t/s012345678910u/v100755540302015101055試求:電壓u對時間t的回歸方程(提示:對公式兩邊取自然對數(shù),把問題轉(zhuǎn)化為線性回歸分析問題)解
11、:對uaebt兩邊取對數(shù)得ln uln abt,令yln u,aln a,xt,則yabx,y與x的數(shù)據(jù)如下表:x012345678910y4.64.34.03.73.43.02.72.32.31.61.6根據(jù)表中數(shù)據(jù)畫出散點圖,如圖所示,從圖中可以看出,y與x具有較好的線性相關(guān)關(guān)系,由表中數(shù)據(jù)求得5,3.045,由公式計算得0.313, 4.61,所以y對x的線性回歸方程為0.313x4.61.所以ln 0.313t4.61,即e0.313t4.61e0.313te4.61,因此電壓u對時間t的回歸方程為e0.313te4.61.典例下列現(xiàn)象的線性相關(guān)程度最高的是()a某商店的職工人數(shù)與商品
12、銷售額之間的相關(guān)系數(shù)為0.87b流通費用率與商業(yè)利潤率之間的相關(guān)系數(shù)為0.94c商品銷售額與商業(yè)利潤率之間的相關(guān)系數(shù)為0.51d商品銷售額與流通費用率之間的相關(guān)系數(shù)為0.81解析|r|越接近于1,相關(guān)程度越高答案b易錯防范1解題誤認(rèn)為r越近于1,相關(guān)程度越高,從而誤選a.2|r|值越大,變量之間的線性相關(guān)程度越高;|r|值越接近0,變量之間的線性相關(guān)程度越低成功破障變量x與y相對應(yīng)的一組數(shù)據(jù)為(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);變量u與v相對應(yīng)的一組數(shù)據(jù)為(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1)r1表示變量y
13、與x之間的線性相關(guān)系數(shù),r2表示變量v與u之間的線性相關(guān)系數(shù),則()ar2r10b0r2r1cr20r1 dr2r1解析:選c對于變量x與y而言,y隨x的增大而增大,故變量y與x正相關(guān),即r10;對于變量u與v而言,v隨u的增大而減小,故變量v與u負(fù)相關(guān),即r10.故r20r1.隨堂即時演練1關(guān)于回歸分析,下列說法錯誤的是()a在回歸分析中,變量間的關(guān)系若是非確定性關(guān)系,那么因變量不能由自變量唯一確定b線性相關(guān)系數(shù)可以是正的也可以是負(fù)的c在回歸分析中,如果r21或r1,說明x與y之間完全線性相關(guān)d樣本相關(guān)系數(shù)r(1,1)解析:選d樣本的相關(guān)系數(shù)應(yīng)滿足1r1.2若某地財政收入x與支出y滿足回歸方
14、程bxaei(單位:億元)(i1,2,),其中0.8,2,|ei|0.5,如果今年該地區(qū)財政收入10億元,年支出預(yù)計不會超過()a10億元b9億元c10.5億元 d9.5億元解析:選c0.8102ei10ei,|ei|0.5,10.5.3在研究氣溫和熱茶銷售杯數(shù)的關(guān)系時,若求得相關(guān)指數(shù)r20.85,則表明氣溫解釋了_的熱茶銷售杯數(shù)變化,而隨機誤差貢獻了剩余的_,所以氣溫對熱茶銷售杯數(shù)的效應(yīng)比隨機誤差的效應(yīng)大得多解析:由相關(guān)指數(shù)r2的意義可知,r20.85表明氣溫解釋了85%,而隨機誤差貢獻了剩余的15%.答案:85%15%4若施肥量x(kg)與小麥產(chǎn)量y(kg)之間的回歸直線方程為2504x,
15、當(dāng)施肥量為50 kg時,預(yù)計小麥產(chǎn)量為_解析:把x50代入2504x,可求得450.答案:450 kg5某工廠為了對新研發(fā)的一種產(chǎn)品進行合理定價,將該產(chǎn)品按事先擬定的價格進行試銷,得到如下數(shù)據(jù):單價x(元)88.28.48.68.89銷量y(件)908483807568(1)求回歸直線方程x,其中b20,;(2)預(yù)計在今后的銷售中,銷量與單價仍然服從(1)中的關(guān)系,且該產(chǎn)品的成本是4元/件,為使工廠獲得最大利潤,該產(chǎn)品的單價應(yīng)定為多少元?(利潤銷售收入成本)解:(1)因為(88.28.48.68.89)8.5,(908483807568)80.從而2080208.5250,故20x250.(2
16、)由題意知,工廠獲得利潤z(x4)y20x2330x1 00020(x)2361.25,所以當(dāng)x8.25時,zmax361.25(元)即當(dāng)該產(chǎn)品的單價定為8.25元時,工廠獲得最大利潤課時達標(biāo)檢測一、選擇題1為了研究變量x和y的線性相關(guān)性,甲、乙兩人分別利用線性回歸方法得到回歸直線l1和l2,已知兩人計算過程中,分別相同,則下列說法正確的是()al1與l2一定平行bl1與l2重合cl1與l2相交于點(,)d無法判斷l(xiāng)1和l2是否相交解析:選c回歸直線一定過樣本點的中心(,),故c正確2甲、乙、丙、丁四位同學(xué)在建立變量x,y的回歸模型時,分別選擇了4種不同模型,計算可得它們的相關(guān)指數(shù)r2分別如下
17、表:甲乙丙丁r20.980.780.500.85哪位同學(xué)建立的回歸模型擬合效果最好?()a甲 b乙c丙 d丁解析:選a相關(guān)指數(shù)r2越大,表示回歸模型的擬合效果越好3對變量x,y進行回歸分析時,依據(jù)得到的4個不同的回歸模型畫出殘差圖,則下列模型擬合精度最高的是()解析:選a用殘差圖判斷模型的擬合效果,殘差點比較均勻地落在水平的帶狀區(qū)域中,說明這樣的模型比較合適帶狀區(qū)域的寬度越窄,說明模型的擬合精度越高4設(shè)某大學(xué)的女生體重y(單位:kg)與身高x(單位:cm)具有線性相關(guān)關(guān)系根據(jù)一組樣本數(shù)據(jù)(xi,yi)(i1,2,n),用最小二乘法建立的回歸方程為0.85x85.71,則下列結(jié)論中不正確的是()
18、ay與x具有正的線性相關(guān)關(guān)系b回歸直線過樣本點的中心(,)c若該大學(xué)某女生身高增加1 cm,則其體重約增加0.85 kgd若該大學(xué)某女生身高為170 cm,則可斷定其體重必為58.79 kg解析:選d回歸方程中x的系數(shù)為0.850,因此y與x具有正的線性相關(guān)關(guān)系,a正確;由回歸方程系數(shù)的意義可知回歸直線過樣本點的中心(,),b正確;依據(jù)回歸方程中的含義可知,x每變化1個單位,相應(yīng)變化約0.85個單位,c正確;用回歸方程對總體進行估計不能得到肯定的結(jié)論,故d錯誤5某產(chǎn)品的廣告費用x與銷售額y的統(tǒng)計數(shù)據(jù)如下表:廣告費用x(萬元)4235銷售額y(萬元)49263954根據(jù)上表可得回歸方程x中的為9
19、.4,據(jù)此模型預(yù)報廣告費用為6萬元時銷售額為()a63.6萬元 b65.5萬元c67.7萬元 d72.0萬元解析:選b樣本點的中心是(3.5,42),則429.43.59.1,所以回歸直線方程是9.4x9.1,把x6代入得65.5.二、填空題6在一組樣本數(shù)據(jù)(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散點圖中,若所有樣本點(xi,yi)(i1,2,n)都在直線yx1上,則這組樣本數(shù)據(jù)的樣本相關(guān)系數(shù)為_解析:根據(jù)樣本相關(guān)系數(shù)的定義可知,當(dāng)所有樣本點都在直線上時,相關(guān)系數(shù)為1.答案:17若一個樣本的總偏差平方和為80,殘差平方和為60,則相關(guān)指數(shù)r2為_解析:
20、回歸平方和總偏差平方和殘差平方和 806020,故r20.25或r210.25答案:0.258面對競爭日益激烈的消費市場,眾多商家不斷擴大自己的銷售市場,以降低生產(chǎn)成本某白酒釀造企業(yè)市場部對該企業(yè)9月份的產(chǎn)品銷量(單位:千箱)與單位成本(單位:元)的資料進行線性回歸分析,結(jié)果如下:,71,79,iyi1 481.則銷量每增加1 000箱,單位成本下降_元解析:由題意知,1.818 2,71(1.818 2)77.36,1.818 2x77.36,銷量每增加1千箱,則單位成本下降1.818 2元答案:1.818 2三、解答題9某電腦公司有6名產(chǎn)品推銷員,其工作年限與年推銷金額數(shù)據(jù)如下表:推銷員編
21、號12345工作年限x/年35679年推銷金額y/萬元23345(1)求年推銷金額y關(guān)于工作年限x的線性回歸方程;(2)若第6名推銷員的工作年限為11年,試估計他的年推銷金額解:(1)設(shè)所求的線性回歸方程為x,則0.5, 0.4.所以年推銷金額y關(guān)于工作年限x的線性回歸方程為0.5x0.4.(2)當(dāng)x11時,0.5x0.40.5110.45.9(萬元)所以可以估計第6名推銷員的年推銷金額為5.9萬元10假設(shè)某農(nóng)作物基本苗數(shù)x與有效穗數(shù)y之間存在相關(guān)關(guān)系,今測得5組數(shù)據(jù)如下:x15.025.830.036.644.4y39.442.942.943.149.2(1)以x為解釋變量,y為預(yù)報變量,畫
22、出散點圖;(2)求y與x之間的回歸方程,對于基本苗數(shù)56.7預(yù)報有效穗數(shù);(3)計算各組殘差解:(1)散點圖如圖所示(2)由圖看出,樣本點呈條狀分布,有比較好的線性相關(guān)關(guān)系,因此可以用線性回歸方程來建立兩個變量之間的關(guān)系設(shè)線性回歸方程為x,由表中數(shù)據(jù)可得0.29,34.66,故y與x之間的回歸方程為0.29x34.66.當(dāng)x56.7時,0.2956.734.6651.103.故估計有效穗數(shù)為51.103.(3)各組數(shù)據(jù)的殘差分別為10.39,20.76,30.46,42.17,51.66.3.2獨立性檢驗的基本思想及其初步應(yīng)用獨立性檢驗的有關(guān)概念提出問題某校高三模擬考試調(diào)查中,性格內(nèi)向的426
23、人中有332人考前緊張,性格外向的594人中有213人考前緊張問題1:考前緊張與性格類別有關(guān)系嗎?提示:有問題2:通過怎樣比較看出有?提示:通過考前緊張的人數(shù)占性格類型的比例導(dǎo)入新知1分類變量變量的不同“值”表示個體所屬的不同類別,像這樣的變量稱為分類變量222列聯(lián)表假設(shè)有兩個分類變量x和y,它們的取值分別為x1,x2和y1,y2,其樣本頻數(shù)列聯(lián)表(也稱為22列聯(lián)表)為:y1y2總計x1ababx2cdcd總計acbdabcd3k2統(tǒng)計量為了使不同樣本容量的數(shù)據(jù)有統(tǒng)一的評判標(biāo)準(zhǔn),我們構(gòu)造一個隨機變量k2,其中nabcd為樣本容量4獨立性檢驗利用隨機變量k2來確定是否能以給定把握認(rèn)為“兩個分類變
24、量有關(guān)系”的方法,稱為兩個分類變量獨立性檢驗化解疑難122列聯(lián)表的特征2在列聯(lián)表中,如果兩個分類變量沒有關(guān)系,則應(yīng)滿足adbc0.因此|adbc|越小,說明兩個分類變量之間的關(guān)系越弱;|adbc|越大,說明兩個分類變量之間的關(guān)系越強.獨立性檢驗的思想提出問題吸煙與患肺癌“列聯(lián)表”中,事件a表示不吸煙,b表示不患肺癌問題1:事件a,b發(fā)生的頻率可求嗎?提示:可以問題2:通常情況下,為研究問題方便,常用什么近似于概率?提示:頻率問題3:事件a,b無關(guān)有怎樣的概率公式?提示:p(ab)p(a)p(b)導(dǎo)入新知獨立性檢驗的思想:要確定“兩個分類變量有關(guān)系”這一結(jié)論成立的可信程度,首先假設(shè)結(jié)論不成立,即
25、假設(shè)結(jié)論“兩個分類變量沒有關(guān)系”成立在該假設(shè)下我們構(gòu)造的隨機變量k2應(yīng)該很小,如果由觀測數(shù)據(jù)計算得到的k2觀測值k很大,那么在一定程度上說明假設(shè)不合理,根據(jù)隨機變量k2的含義,可以通過可信度表評價該假設(shè)不合理的程度,即“兩個分類變量有關(guān)系”的可信程度化解疑難1p(k26.635)0.01表明h0成立的概率很小,是小概率事件,可以判斷h0不成立,也就是“兩個分類變量之間沒有關(guān)系”錯誤地判斷為“兩個分類變量之間有關(guān)系”的概率不超過0.01,也可以理解為“有99%的把握認(rèn)為兩個分類變量之間有關(guān)系”2利用獨立性檢驗解決問題的基本步驟:(1)根據(jù)相關(guān)數(shù)據(jù)作列聯(lián)表;(2)求k2的觀測值;(3)與臨界值作比
26、較,得出結(jié)論.列聯(lián)表和等高條形圖的應(yīng)用例1某學(xué)校對高三學(xué)生作了一項調(diào)查,發(fā)現(xiàn):在平時的模擬考試中,性格內(nèi)向的學(xué)生426人中有332人在考前心情緊張,性格外向的學(xué)生594人中有213人在考前心情緊張作出等高條形圖,利用圖形判斷考前心情緊張與性格類別是否有關(guān)系解作列聯(lián)表如下:性格內(nèi)向性格外向總計考前心情緊張332213545考前心情不緊張94381475總計4265941 020相應(yīng)的等高條形圖如圖所示:圖中陰影部分表示考前心情緊張與考前心情不緊張中性格內(nèi)向的比例從圖中可以看出考前心情緊張的樣本中性格內(nèi)向占的比例比考前心情不緊張樣本中性格內(nèi)向占的比例高,可以認(rèn)為考前緊張與性格類型有關(guān)類題通法進行獨
27、立性檢驗的前提是根據(jù)題中數(shù)據(jù)獲得22列聯(lián)表,常用等高條形圖展示列聯(lián)表數(shù)據(jù)的頻率特征,即將與(或與)的值相比,由此能直觀地反映出兩個分類變量間是否相互影響,但是此方法較粗劣活學(xué)活用為了研究子女吸煙與父母吸煙的關(guān)系,調(diào)查了一千多名青少年及其家長,數(shù)據(jù)如下:父母吸煙父母不吸煙總計子女吸煙23783320子女不吸煙6785221 200總計9156051 520利用等高條形圖判斷父母吸煙對子女吸煙是否有影響?解:等高條形圖如下:由圖形觀察可以看出父母吸煙者中子女吸煙的比例要比父母不吸煙者中子女吸煙的比例高,因此可以在某種程度上認(rèn)為“子女吸煙與父母吸煙有關(guān)系”.考查獨立性檢驗的原理例2研究人員選取170
28、名青年男女大學(xué)生為樣本,對他們進行一種心理測驗發(fā)現(xiàn)有60名女生對該心理測驗中的最后一個題目的反應(yīng)是:作肯定的有22名,否定的有38名;男生110名在相同的項目上作肯定的有22名,否定的有88名問:性別與態(tài)度之間是否存在某種關(guān)系?用獨立性檢驗的方法判斷附:p(k2k0)0.100.050.025k02.7063.8415.024解根據(jù)題目所給數(shù)據(jù)建立如下22列聯(lián)表:肯定否定總計男生2288110女生223860總計44126170根據(jù)22列聯(lián)表中的數(shù)據(jù)得到:k5.6223.841.所以在犯錯誤的概率不超過0.05的前提下,認(rèn)為“性別與態(tài)度有關(guān)系”類題通法根據(jù)題意列出22列聯(lián)表,計算k2的觀測值,
29、如果k2的觀測值很大,說明兩個分類變量有關(guān)系的可能性很大;如果k2的觀測值比較小,則認(rèn)為沒有充分的證據(jù)顯示兩個分類變量有關(guān)系這需要給出正確的計算,避免計算失誤活學(xué)活用在一次天氣惡劣的飛機航程中,調(diào)查了男女乘客在飛機上暈機的情況:男乘客暈機的有24人,不暈機的有31人;女乘客暈機的有8人,不暈機的有26人請你根據(jù)所給數(shù)據(jù)判定:在天氣惡劣的飛機航程中,男乘客是否比女乘客更容易暈機?附:p(k2k0)0.100.05k02.7063.848解:根據(jù)題意,列出22列聯(lián)表如下:暈機不暈機總計男乘客243155女乘客82634總計325789假設(shè)在天氣惡劣的飛機航程中男乘客不比女乘客更容易暈機由公式可得k
30、2的觀測值k3.6892.706,故在犯錯誤的概率不超過0.10的前提下,認(rèn)為“在天氣惡劣的飛機航程中男乘客比女乘客更容易暈機”典例(12分)某工廠有工人1 000名,其中250名工人參加過短期培訓(xùn)(稱為a類工人),另外750名工人參加過長期培訓(xùn)(稱為b類工人)現(xiàn)用分層抽樣的方法(按a類、b類分兩層)從該工廠的工人中抽取100名工人,調(diào)查他們的生產(chǎn)能力(此處生產(chǎn)能力指一天加工的零件數(shù)),結(jié)果如下表表1:a類工人生產(chǎn)能力的頻數(shù)分布表生產(chǎn)能力分組110,120)120,130)130,140)140,150)人數(shù)8x32表2:b類工人生產(chǎn)能力的頻數(shù)分布表生產(chǎn)能力分組110,120)120,130)
31、130,140)140,150)人數(shù)6y2718(1)確定x,y的值;(2)完成下面22列聯(lián)表,并回答能否在犯錯誤的概率不超過0.001的前提下認(rèn)為工人的生產(chǎn)能力與工人的類別有關(guān)系?生產(chǎn)能力分組工人類別110,130)130,150)總計a類工人b類工人總計附:k2,p(k2k0)0.0500.0100.001k03.8416.63510.828解題流程 (2)根據(jù)所給的數(shù)據(jù)可以完成列聯(lián)表,如下表所示:生產(chǎn)能力分組工人類別110,130)130,150)總計a類工人20525b類工人304575總計5050100 (6分)由列聯(lián)表中的數(shù)據(jù),得k2的觀測值為活學(xué)活用(東北三校聯(lián)考)某學(xué)生對其親屬
32、30人的飲食進行了一次調(diào)查,并用下圖所示的莖葉圖表示30人的飲食指數(shù)(說明:圖中飲食指數(shù)低于70的人,飲食以蔬菜為主;飲食指數(shù)高于70的人,飲食以肉類為主)(1)根據(jù)以上數(shù)據(jù)完成下列22列聯(lián)表:主食蔬菜主食肉類總計50歲以下50歲以上總計(2)能否在犯錯誤的概率不超過0.01的前提下認(rèn)為其親屬的飲食習(xí)慣與年齡有關(guān)?并寫出簡要分析解:(1)22列聯(lián)表如下:主食蔬菜主食肉類總計50歲以下481250歲以上16218總計201030(2)因為k2106.635,p(k26.635)0.01所以可以在犯錯誤的概率不超過0.01的前提下認(rèn)為其親屬的飲食習(xí)慣與年齡有關(guān)隨堂即時演練1觀察下列各圖,其中兩個分
33、類變量x,y之間關(guān)系最強的是()解析:選d在四幅圖中,d圖中兩個深色條的高相差最明顯,說明兩個分類變量之間關(guān)系最強2下面是一個22列聯(lián)表:y1y2總計x1a2173x222527總計b46則表中a、b處的值分別為()a94,96b52,50c52,54 d54,52解析:選c由得3獨立性檢驗所采用的思路是:要研究a,b兩類型變量彼此相關(guān),首先假設(shè)這兩類變量彼此_,在此假設(shè)下構(gòu)造隨機變量k2,如果k2的觀測值較大,那么在一定程度上說明假設(shè)_答案:無關(guān)不成立4在吸煙與患肺病是否相關(guān)的判斷中,有下面的說法:若k2的觀測值k6.635,則在犯錯誤的概率不超過0.01的前提下,認(rèn)為吸煙與患肺病有關(guān)系,那
34、么在100個吸煙的人中必有99人患有肺病;從獨立性檢驗可知在犯錯誤的概率不超過0.01的前提下,認(rèn)為吸煙與患肺病有關(guān)系時,若某人吸煙,則他有99%的可能患有肺病;從獨立性檢驗可知在犯錯誤的概率不超過0.05的前提下,認(rèn)為吸煙與患肺病有關(guān)系時,是指有5%的可能性使得推斷錯誤其中說法正確的是_解析:k2是檢驗吸煙與患肺病相關(guān)程度的量,是相關(guān)關(guān)系,而不是確定關(guān)系,是反映有關(guān)和無關(guān)的概率,故說法不正確;說法中對“確定容許推斷犯錯誤概率的上界”理解錯誤;說法正確答案:5為了解決高二年級統(tǒng)計案例入門難的問題,某校在高一年級的數(shù)學(xué)教學(xué)中設(shè)有試驗班,著重加強統(tǒng)計思想的滲透,下面是高二年級統(tǒng)計案例的測驗成績統(tǒng)計
35、表(單位:分)的一部分,試分析實驗效果.70及70分以下70分以上總計對照班321850試驗班123850總計4456100附:p(k2k0)0.0250.0100.005k05.0246.6357.879解:根據(jù)列聯(lián)表中的數(shù)據(jù),由公式得k2的觀測值k16.234.因為16.2346.635,所以,在犯錯誤的概率不超過0.01的前提下認(rèn)為高二年級統(tǒng)計案例的測試成績與高一年級數(shù)學(xué)教學(xué)中增加統(tǒng)計思想的滲透有聯(lián)系課時達標(biāo)檢測一、選擇題1判斷兩個分類變量是彼此相關(guān)還是相互獨立的常用的方法中,最為精確的是()a22列聯(lián)表 b獨立性檢驗c等高條形圖 d其他解析:選ba、c只能直觀地看出兩個分類變量x與y是
36、否相關(guān),但看不出相關(guān)的程度;獨立性檢驗通過計算得出相關(guān)的可能性,較為準(zhǔn)確2假設(shè)有兩個分類變量x和y,它們的值域分別為x1,x2和y1,y2,其22列聯(lián)表為y xy1y2總計x1ababx2cdcd總計acbdabcd對同一樣本,以下數(shù)據(jù)能說明x與y有關(guān)的可能性最大的一組為()aa5,b4,c3,d2 ba5,b3,c4,d2ca2,b3,c4,d5 da3,b2,c4,d5解析:選d對于同一樣本,|adbc|越小,說明x與y相關(guān)性越弱,而|adbc|越大,說明x與y相關(guān)性越強,通過計算知,對于a,b,c都有|adbc|1012|2;對于選項d,有|adbc|158|7,顯然72.3對于分類變量
37、x與y的隨機變量k2的觀測值k,下列說法正確的是()ak越大,“x與y有關(guān)系”的可信程度越小bk越小,“x與y有關(guān)系”的可信程度越小ck越接近于0,“x與y沒有關(guān)系”的可信程度越小dk越大,“x與y沒有關(guān)系”的可信程度越大解析:選bk越大,“x與y沒有關(guān)系”的可信程度越小,則“x與y有關(guān)系”的可信程度越大即k越小,“x與y有關(guān)系”的可信程度越小4利用獨立性檢驗對兩個分類變量是否有關(guān)系進行研究時,若有99.5%的把握認(rèn)為事件a和b有關(guān)系,則具體計算出的數(shù)據(jù)應(yīng)該是()ak6.635 bk6.635ck7.879 dk7.879解析:選c有99.5%的把握認(rèn)為事件a和b有關(guān)系,即犯錯誤的概率為0.5
38、%,對應(yīng)的k0的值為7.879,由獨立性檢驗的思想可知應(yīng)為k7.879.5通過隨機詢問110名性別不同的大學(xué)生是否愛好某項運動,得到如下的列聯(lián)表:男女總計愛好402060不愛好203050總計6050110由k2算得,觀測值k7.8.附表:p(k2k0)0.0500.0100.001k03.8416.63510.828參照附表,得到的正確結(jié)論是()a有99%以上的把握認(rèn)為“愛好該項運動與性別有關(guān)”b有99%以上的把握認(rèn)為“愛好該項運動與性別無關(guān)”c在犯錯誤的概率不超過0.1%的前提下,認(rèn)為“愛好該項運動與性別有關(guān)”d在犯錯誤的概率不超過0.1%的前提下,認(rèn)為“愛好該項運動與性別無關(guān)”解析:選a
39、由k7.8及p(k26.635)0.010可知,在犯錯誤的概率不超過1%的前提下認(rèn)為“愛好該項運動與性別有關(guān)”,也就是有99%以上的把握認(rèn)為“愛好該項運動與性別有關(guān)”二、填空題6下列關(guān)于k2的說法中,正確的有_k2的值越大,兩個分類變量的相關(guān)性越大;k2的計算公式是k2;若求出k243.841,則有95%的把握認(rèn)為兩個分類變量有關(guān)系,即有5%的可能性使得“兩個分類變量有關(guān)系”的推斷出現(xiàn)錯誤;獨立性檢驗就是選取一個假設(shè)h0條件下的小概率事件,若在一次試驗中該事件發(fā)生了,這是與實際推斷相抵觸的“不合理”現(xiàn)象,則作出拒絕h0的推斷解析:對于,k2的值越大,只能說明我們有更大的把握認(rèn)為二者有關(guān)系,卻不
40、能判斷相關(guān)性大小,故錯;對于,(adbc)應(yīng)為(adbc)2,故錯;對答案:7某電視臺在一次對收看文藝節(jié)目和新聞節(jié)目觀眾的抽樣調(diào)查中,隨機抽取了100名電視觀眾,相關(guān)的數(shù)據(jù)如下表所示:文藝節(jié)目新聞節(jié)目總計20至40歲401858大于40歲152742總計5545100由表中數(shù)據(jù)直觀分析,收看新聞節(jié)目的觀眾是否與年齡有關(guān):_(填“是”或“否”)解析:因為在20至40歲的58名觀眾中有18名觀眾收看新聞節(jié)目,而在大于40歲的42名觀眾中有27名觀眾收看新聞節(jié)目,即,兩者相差較大,所以經(jīng)直觀分析,收看新聞節(jié)目的觀眾與年齡是有關(guān)的答案:是8某工廠為了調(diào)查工人文化程度與月收入的關(guān)系,隨機抽取了部分工人,
41、得到如下列聯(lián)表(單位:人):月收入2 000元以下月收入2 000元及以上總計高中文化以上104555高中文化及以下203050總計3075105由上表中數(shù)據(jù)計算得k2的觀測值k6.109,請估計在犯錯誤的概率不超過_的情況下認(rèn)為文化程度與月收入有關(guān)系解析:由于6.1095.024,所以在犯錯誤的概率不超過0.025的前提下認(rèn)為文化程度與月收入有關(guān)系答案:0.025三、解答題9用兩種檢驗方法對某食品做沙門氏菌檢驗,結(jié)果如下表.陽性陰性總計熒光抗體法1605165常規(guī)培養(yǎng)法264874總計18653239附:p(k2k0)0.0100.0050.001k06.6357.87910.828(1)利
42、用圖形判斷采用熒光抗體法與檢驗結(jié)果呈陽性是否有關(guān)系;(2)能否在犯錯誤的概率不超過0.001的前體下認(rèn)為采用熒光抗體法與檢驗結(jié)果呈陽性有關(guān)系?解:(1)作出等高條形圖如圖所示,由圖知采用熒光抗體法與檢驗結(jié)果呈陽性有關(guān)系(2)通過計算可知k2113.184 6.而查表可知,因為p(k210.828)0.001,而113.184 6遠(yuǎn)大于10.828,所以在犯錯誤的概率不超過0.001的前提下認(rèn)為采用熒光抗體法與檢驗結(jié)果呈陽性有關(guān)系10某校在兩個班進行教學(xué)方式對比試驗,兩個月后進行了一次檢測,試驗班與對照班成績統(tǒng)計如下表所示(單位:人):80及80分以上80分以下總計試驗班351550對照班20m
43、50總計5545n(1)求m,n;(2)能否在犯錯誤的概率不超過0.005的情況下認(rèn)為教學(xué)方式與成績有關(guān)系?解:(1)m451530,n5050100.(2)由表中的數(shù)據(jù),得k2的觀測值為k9.091.因為9.0917.879,所以能在犯錯誤的概率不超過0.005的前提下認(rèn)為教學(xué)方式與成績有關(guān)系統(tǒng)計案例一、選擇題(共10小題,每小題5分,共50分)1對于自變量x和因變量y,當(dāng)x取值一定時,y的取值帶有一定的隨機性,x,y之間的這種非確定性關(guān)系叫()a函數(shù)關(guān)系b線性關(guān)系c相關(guān)關(guān)系 d回歸關(guān)系解析:選c由相關(guān)關(guān)系的概念可知,c正確2設(shè)兩個變量x和y之間具有線性相關(guān)關(guān)系,它們的相關(guān)系數(shù)是r,y關(guān)于x
44、的回歸直線的斜率是b,縱軸上的截距是a,那么必有()ab與r的符號相同 ba與r的符號相同cb與r的符號相反 da與r的符號相反解析:選a因為b0時,兩變量正相關(guān),此時r0;b0時,兩變量負(fù)相關(guān),此時r0.3下表顯示出樣本中變量y隨變量x變化的一組數(shù)據(jù),由此判斷它最可能是()x45678910y14181920232528a線性函數(shù)模型 b二次函數(shù)模型c指數(shù)函數(shù)模型 d對數(shù)函數(shù)模型解析:選a畫出散點圖(圖略)可以得到這些樣本點在某一條直線上或該直線附近,故最可能是線性函數(shù)模型4下表是某廠14月份用水量(單位:百噸)的一組數(shù)據(jù):月份x1234用水量y4.5432.5由散點圖可知,用水量y與月份x
45、之間有較好的線性相關(guān)關(guān)系,其線性回歸方程是0.7x,則()a10.5 b5.15c5.2 d5.25解析:選d樣本點的中心為(2.5,3.5),將其代入線性回歸方程可解得5.25.5下面的等高條形圖可以說明的問題是()a“心臟搭橋”手術(shù)和“血管清障”手術(shù)對“誘發(fā)心臟病”的影響是絕對不同的b“心臟搭橋”手術(shù)和“血管清障”手術(shù)對“誘發(fā)心臟病”的影響沒有什么不同c此等高條形圖看不出兩種手術(shù)有什么不同的地方d“心臟搭橋”手術(shù)和“血管清障”手術(shù)對“誘發(fā)心臟病”的影響在某種程度上是不同的,但是沒有100%的把握解析:選d由等高條形圖可知選項d正確6根據(jù)一位母親記錄兒子39歲的身高數(shù)據(jù),建立兒子身高(單位:
46、cm)對年齡(單位:歲)的線性回歸方程為7.19x73.93,若用此方程預(yù)測兒子10歲時的身高,有關(guān)敘述正確的是()a身高一定為145.83 cm b身高大于145.83 cmc身高小于145.83 cm d身高在145.83 cm左右解析:選d用線性回歸方程預(yù)測的不是精確值,而是估計值當(dāng)x10時,y145.83,只能說身高在145.83 cm左右7在22列聯(lián)表中,下列哪兩個比值相差越大,兩個分類變量有關(guān)系的可能性就越大()a.與 b.與c.與 d.與解析:選a當(dāng)ad與bc相差越大,兩個分類變量有關(guān)系的可能性越大,此時與相差越大8如圖,5個(x,y)數(shù)據(jù),去掉d(3,10)后,下列說法錯誤的是
47、()a相關(guān)系數(shù)r變大b殘差平方和變大c相關(guān)指數(shù)r2變大d解釋變量x與預(yù)報變量y的相關(guān)性變強解析:選b由散點圖知,去掉d后,x與y的相關(guān)性變強,且為正相關(guān),所以r變大,r2變大,殘差平方和變小9為了解高中生作文成績與課外閱讀量之間的關(guān)系,某研究機構(gòu)隨機抽取了60名高中生,通過問卷調(diào)查,得到以下數(shù)據(jù):作文成績優(yōu)秀作文成績一般總計課外閱讀量較大221032課外閱讀量一般82028總計303060由以上數(shù)據(jù),計算得到k2的觀測值k9.643,根據(jù)臨界值表,以下說法正確的是()a沒有充足的理由認(rèn)為課外閱讀量大與作文成績優(yōu)秀有關(guān)b有0.5%的把握認(rèn)為課外閱讀量大與作文成績優(yōu)秀有關(guān)c有99.9%的把握認(rèn)為課外閱讀量大與作文成績優(yōu)秀有關(guān)d有99.5%的把握認(rèn)為課外閱讀量大與作文成績優(yōu)秀有關(guān)解析:選d根據(jù)臨界值表,9.6437.879,在犯錯誤的概率不超過0.005的前提下,認(rèn)為課外閱讀量大與作
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 拉伸模具設(shè)計課程設(shè)計
- 智能數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng)開發(fā)合同
- 企業(yè)級庫存管理系統(tǒng)定制開發(fā)及運營服務(wù)合同
- POS收銀系統(tǒng)定制服務(wù)合同
- 物流服務(wù)合同
- 智能房地產(chǎn)在線支付系統(tǒng)合同
- 2024至2030年中國針布側(cè)磨片行業(yè)投資前景及策略咨詢研究報告
- 2024至2030年中國可調(diào)式噴嘴行業(yè)投資前景及策略咨詢研究報告
- 2024版房地產(chǎn)中介加盟及售后服務(wù)保障合同范本3篇
- 2024年萬科房產(chǎn)合作開發(fā)合同范本3篇
- 《逆向教學(xué)設(shè)計研究的國內(nèi)外文獻綜述》2500字
- 2024年保密協(xié)議書(信息技術(shù)行業(yè))2篇
- 2024-2025學(xué)年高一【數(shù)學(xué)(人教A版)】函數(shù)的零點與方程的解-教學(xué)設(shè)計
- 【課件】程式與意蘊-中國傳統(tǒng)繪畫+課件-2024-2025學(xué)年高中美術(shù)人美版(2019)美術(shù)鑒賞
- 社會學(xué)概論-終結(jié)性考核-國開(SC)-參考資料
- 2022年全國應(yīng)急普法知識競賽試題庫大全-上(單選題庫-共4部分-1)
- 四川省南充市2023-2024學(xué)年高一上學(xué)期期末考試 生物 含解析
- 2024年廠長崗位聘用合同范本版B版
- 個人分紅協(xié)議合同范例
- 2024河北石家莊市辛集市大學(xué)生鄉(xiāng)村醫(yī)生專項計劃招聘5人筆試備考試題及答案解析
- 2023年護理人員分層培訓(xùn)、考核計劃表
評論
0/150
提交評論