版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、12.5統(tǒng)計(jì)與統(tǒng)計(jì)案例高考理數(shù)高考理數(shù)一、隨機(jī)抽樣1.簡單隨機(jī)抽樣一般地,設(shè)一個總體含有N個個體,從中逐個不放回地抽取n個個體作為樣本(nN),如果每次抽取時總體內(nèi)的各個個體被抽到的機(jī)會都相等,就把這種抽樣方法叫做簡單隨機(jī)抽樣.最常用的簡單隨機(jī)抽樣的方法有兩種:抽簽法和隨機(jī)數(shù)法.2.系統(tǒng)抽樣當(dāng)總體中的個體比較多時,首先把總體分成均衡的若干部分,然后按照事先確定的規(guī)則,從每一部分中抽取一個個體,得到所需要的樣本,這種抽樣方法叫做系統(tǒng)抽樣.3.分層抽樣一般地,在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨(dú)立地抽取一定數(shù)量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法是分層抽
2、樣.知識清單二、用樣本估計(jì)總體1.用樣本的頻率分布估計(jì)總體分布(1)頻率分布表與頻率分布直方圖頻率分布表和頻率分布直方圖,是從各個小組數(shù)據(jù)在樣本容量中所占比例大小的角度來表示數(shù)據(jù)分布的規(guī)律.它可以使我們看到整個樣本數(shù)據(jù)的頻率分布情況.繪制頻率分布直方圖的步驟:求極差;決定組距與組數(shù);將數(shù)據(jù)分組;列頻率分布表;畫頻率分布直方圖.(2)頻率分布折線圖連結(jié)頻率分布直方圖中各小長方形上端的中點(diǎn),就得到頻率分布折線圖.(3)莖葉圖一般地,莖是指中間的一列數(shù),葉就是從莖的旁邊生長出來的數(shù).2.用樣本的數(shù)字特征估計(jì)總體的數(shù)字特征(1)眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù).(2)中位數(shù):將數(shù)據(jù)從小到大(或從大到小
3、)排列,若有奇數(shù)個數(shù),則最中間的數(shù)是中位數(shù);若有偶數(shù)個數(shù),則中間兩數(shù)的平均數(shù)是中位數(shù).(3)平均數(shù):=,反映了一組數(shù)據(jù)的平均水平.(4)標(biāo)準(zhǔn)差:s=,反映了樣本數(shù)據(jù)的離散程度.(5)方差:s2=(x1-)2+(x2-)2+(xn-)2,反映了樣本數(shù)據(jù)的離散程度.三、變量間的相關(guān)關(guān)系及回歸分析1.相關(guān)關(guān)系:當(dāng)自變量取值一定時,因變量的取值帶有一定隨機(jī)性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系.與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種不確定關(guān)系.2.散點(diǎn)圖:表示具有相關(guān)關(guān)系的兩個變量的一組數(shù)據(jù)的圖形叫做散點(diǎn)圖,它可直觀地判斷兩變量的關(guān)系是否可以用線性關(guān)系表示.若這些點(diǎn)散布在從左下角到右上角的區(qū)域,則稱兩個變量正相關(guān)
4、;若這些點(diǎn)散布在從左上角到右下角的區(qū)域,則稱兩個變量負(fù)相關(guān).x12nxxxn222121()()() nxxxxxxn1nxxx3.回歸分析:對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計(jì)分析的方法叫做回歸分析.在線性回歸模型y=bx+a+e中,因變量y的值由自變量x和隨機(jī)誤差e共同確定,即自變量x只能解釋部分y的變化,在統(tǒng)計(jì)中,我們把自變量x稱為解釋變量,因變量y稱為預(yù)報(bào)變量.4.回歸方程:=x+,其中=,=-,它主要用來估計(jì)和預(yù)測取值,從而獲得對這兩個變量之間整體關(guān)系的了解.5.相關(guān)系數(shù):,它主要用于相關(guān)量的顯著性檢驗(yàn),以衡量它們之間的線性相關(guān)程度.當(dāng)r0時,表示兩個變量正相關(guān);當(dāng)r2.706時,有90
5、%的把握判定變量X,Y有關(guān)聯(lián);當(dāng)K23.841時,認(rèn)為X與Y無關(guān);當(dāng)K23.841時,有95%的把握說X與Y有關(guān);當(dāng)K26.635時,有99%的把握說X與Y有關(guān);當(dāng)K210.828時,有99.9%的把握說X與Y有關(guān).類別共同點(diǎn)各自特點(diǎn)相互聯(lián)系適用范圍從總體中逐個抽取總體中的個體數(shù)較少將總體均分成幾部分,按事先確定的規(guī)則在各部分抽取在起始部分抽樣時采用簡單隨機(jī)抽樣總體中的個體數(shù)較多將總體分成幾層,分層進(jìn)行抽取分層抽樣時采用簡單隨機(jī)抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成【知識拓展】【知識拓展】1.隨機(jī)抽樣2.用樣本估計(jì)總體用樣本估計(jì)總體,包括用“形”與“數(shù)”兩個方面.用“形”就是利用樣本數(shù)據(jù)列出
6、頻率分布表、畫出頻率分布直方圖和頻率折線圖.用“數(shù)”就是用樣本的數(shù)字特征來反映總體的某個方面的特征,最常用的是借助平均數(shù)、眾數(shù)、中位數(shù)、標(biāo)準(zhǔn)差和方差等數(shù)字特征來估計(jì)數(shù)據(jù)的平均水平和離散、波動的程度.它們是同一組數(shù)據(jù)的頻率分布的不同表現(xiàn)形式.3.對回歸分析的理解回歸分析是處理變量相關(guān)關(guān)系的一種數(shù)學(xué)方法,它主要解決三個問題:(1)確定兩個變量之間是否有相關(guān)關(guān)系,如果有,就找出它們之間貼近的數(shù)學(xué)表達(dá)式;(2)根據(jù)一組觀察值,預(yù)測變量的取值及判斷變量取值的變化趨勢;(3)求出回歸直線方程.簡單隨機(jī)抽樣的方法有:抽簽法和隨機(jī)數(shù)法.系統(tǒng)抽樣的步驟:將總體中的個體隨機(jī)編號;將編號分段;在第1段中用簡單隨機(jī)抽
7、樣確定起始的個體編號;按照事先研究的規(guī)則抽取樣本.分層抽樣的步驟:分層;按比例確定每層抽取個體的個數(shù);各層抽樣(方法可以不同);合成樣本.例例1 (2016河南龍子湖一模,17,12分)我省城鄉(xiāng)居民社會養(yǎng)老保險(xiǎn)個人年繳費(fèi)分100,200,300,400,500,600,700,800,900,1000(單位:元)十個檔次,某社區(qū)隨機(jī)抽取了50名村民,按繳費(fèi)在100500元,6001000元,以及年齡在2039歲,4059歲之間進(jìn)行了統(tǒng)計(jì),相關(guān)數(shù)據(jù)如下:突破方法方法方法1抽樣方法抽樣方法100500元6001000元總計(jì)2039歲106164059歲151934總計(jì)252550(1)用分層抽樣的
8、方法從繳費(fèi)在100500元之間的村民中隨機(jī)抽取5人,則應(yīng)從年齡在2039歲之間的村民中抽取幾人?(2)從繳費(fèi)在100500元之間抽取的5人中,隨機(jī)選取2人進(jìn)行到戶走訪,求這2人的年齡都在4059歲之間的概率.解析解析(1)設(shè)應(yīng)從年齡在2039歲之間的村民中抽取x人,則=,解得x=2.所以應(yīng)從年齡在2039歲之間的村民中抽取2人.(2)設(shè)從繳費(fèi)在100500元之間抽取的5人中,年齡在2039歲之間的2人為A,B,在4059歲之間的3人為a,b,c,則隨機(jī)選取2人的情況有(A,B),(A,a),(A,b),(A,c),(B,a),(B,b),(B,c),(a,b),(a,c),(b,c),共10種
9、.年齡都在4059歲之間的有(a,b),(a,c),(b,c),共3種,則所求概率P=.1-1 (2016廣西南寧三模,5,5分)采用系統(tǒng)抽樣方法從960人中抽取32人做問卷調(diào)查,為此將他們隨機(jī)編號為1,2,960,分組后在第一組采用簡單隨機(jī)抽樣的方法抽到的號碼為9,抽到的32人中,編號在1450內(nèi)的人做問卷A,編號在451750內(nèi)的人做問卷B,其余的人做問卷C,則抽到的人中,52510 x310做問卷B的人數(shù)為()A.7B.9C.10D.15答案答案 C解析解析由題意可知系統(tǒng)抽樣中每一組的樣本數(shù)為=30,因?yàn)榈谝唤M抽取的樣本號碼為9,所以第k組抽取的樣本號碼應(yīng)該為9+30(k-1)(kN*)
10、.由4519+30(k-1)750,得16k25(kN*),所以k=16,17,25,共10個,即應(yīng)該有10人做問卷B.96032從頻率分布直方圖中得出有關(guān)數(shù)據(jù)的方法:(1)頻率=組距;(2)頻率比=小長方形的高的比;(3)眾數(shù):最高小長方形底邊中點(diǎn)的橫坐標(biāo);(4)中位數(shù):平分頻率分布直方圖面積且垂直于橫軸的直線與橫軸交點(diǎn)的橫坐標(biāo);(5)平均數(shù):每個小長方形的面積乘小長方形底邊中點(diǎn)的橫坐標(biāo)之和.例例2 (2014吉林延吉一模,19,12分)從全校參加科技知識競賽的學(xué)生試卷中,抽取一個樣本,考察競賽的成績分布.將樣本分成5組,繪成頻率分布直方圖(如圖),圖中從左到右各小組的小長方形的高的比是1
11、3 6 4 2,最后一組的頻數(shù)是6.頻率組距方法方法2頻率分布直方圖的應(yīng)用頻率分布直方圖的應(yīng)用請結(jié)合頻率分布直方圖,解答下列問題:(1)樣本的容量是多少?(2)列出頻率分布表;(3)成績落在哪個范圍內(nèi)的人數(shù)最多?并求該小組的頻數(shù)、頻率;(4)估計(jì)這次競賽中,成績不低于60分的學(xué)生占總?cè)藬?shù)的百分比.解析解析(1)由于各組的組距相等,所以各組的頻率與各小長方形的高成正比且各組頻率的和等于1,那么各組的頻率分別為,.設(shè)該樣本容量為n,則=,解得n=48.1163166164162166n216(2)由以上得頻率分布表如下:(3)成績落在70.5,80.5)之間的人數(shù)最多,該組的頻數(shù)和頻率分別是18和
12、.(4)不低于60分的學(xué)生占總?cè)藬?shù)的百分比約為100%=93.75%.2-1 (2014廣東,17,13分)隨機(jī)觀測生產(chǎn)某種零件的某工廠25名工人的日加工零件數(shù)(單位:件),獲得數(shù)據(jù)如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根據(jù)上述數(shù)據(jù)得到樣本的頻率分布表如下:成績頻數(shù)頻率50.5,60.5)360.5,70.5)970.5,80.5)1880.5,90.5)1290.5,100.56合計(jì)481116316616416216381116分組頻數(shù)頻率25,3030.12(30,355
13、0.20(35,4080.32(40,45n1f1(45,50n2f2(1)確定樣本頻率分布表中n1,n2,f1和f2的值;(2)根據(jù)上述頻率分布表,畫出樣本頻率分布直方圖;(3)根據(jù)樣本頻率分布直方圖,求在該廠任取4人,至少有1人的日加工零件數(shù)落在區(qū)間(30,35的概率.解析解析(1)n1=7,n2=2,f1=0.28,f2=0.08.(2)樣本頻率分布直方圖如圖所示.(3)根據(jù)樣本頻率分布直方圖,得每人的日加工零件數(shù)落在區(qū)間(30,35的概率為0.2,設(shè)所取的4人中,日加工零件數(shù)落在區(qū)間(30,35的人數(shù)為,則B(4,0.2),P(1)=1-P(=0)=1-(1-0.2)4=1-0.409
14、6=0.5904,所以4人中,至少有1人的日加工零件數(shù)落在區(qū)間(30,35的概率為0.5904.1.制作莖葉圖的方法:將所有兩位數(shù)的十位數(shù)字作為“莖”,個位數(shù)字作為“葉”,莖相同者共用一個莖,莖按從小到大的順序由上到下列出.2.估計(jì)數(shù)字特征,給定兩組數(shù)據(jù)的莖葉圖,“重心”下移者平均數(shù)較大,數(shù)據(jù)集中者方差較小.例3(2014山東東營二模,10,4分)甲、乙兩名同學(xué)在5次數(shù)學(xué)考試中,成績統(tǒng)計(jì)圖用莖葉圖表示如圖所示,若甲、乙兩名同學(xué)的平均成績分別用、表示,則下列結(jié)論正確的是()A.,且甲比乙成績穩(wěn)定B.,且乙比甲成績穩(wěn)定C.,且甲比乙成績穩(wěn)定D.可知乙的成績較穩(wěn)定.從折線圖看,甲的成績基本上呈上升狀
15、態(tài),而乙的成績上下波動,可知甲的成績在不斷提高,而乙的成績無明顯提高.4-1(2016河南鄭州回民中學(xué)4月月考,6,5分)為了普及環(huán)保知識,增強(qiáng)環(huán)保意識,某大學(xué)隨機(jī)抽取30名學(xué)生參加環(huán)保知識測試,得分(十分制)的統(tǒng)計(jì)圖如圖所示,假設(shè)得分值的中位數(shù)為m,眾數(shù)為n,平均數(shù)為,則()x甲10 13 12 14 165x乙13 14 12 12 1452s甲152s乙152s甲2s乙xA.m=n=B.m=nC.mnD.nm答案答案D解析解析由題圖可知,30名學(xué)生的得分情況為2個人得3分,3個人得4分,10個人得5分,6個人得6分,3個人得7分,2個人得8分,2個人得9分,2個人得10分.中位數(shù)為第15
16、,16個數(shù)(分別為5,6)的平均數(shù),即xxxxm=5.5;5出現(xiàn)的次數(shù)最多,故n=5,=5.97,于是得nm,故選D.x2 33 4 10 56 63 72 82 92 1030 x求線性回歸方程的步驟:例例5(2014湖南長沙3月月考,18,12分)下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)能耗y(噸標(biāo)準(zhǔn)煤)的幾組對照數(shù)據(jù).方法方法5線性回歸分析線性回歸分析x3456y2.5344.5(1)請畫出上表數(shù)據(jù)的散點(diǎn)圖;(2)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程y=x+;(3)已知該廠技改前100噸甲產(chǎn)品的生產(chǎn)能耗為90噸標(biāo)準(zhǔn)煤.試根據(jù)(
17、2)求出的線性回歸方程,預(yù)測生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標(biāo)準(zhǔn)煤.(參考數(shù)值:32.5+43+54+64.5=66.5)解析解析(1)由題設(shè)所給數(shù)據(jù),可得散點(diǎn)圖如下圖.b a(2)由對照數(shù)據(jù),計(jì)算得所以,由最小二乘法確定的回歸方程的系數(shù)為=0.7,=-=3.5-0.74.5=0.35.因此,所求的線性回歸方程為y=0.7x+0.35.(3)由(2)的回歸方程及技改前生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗,得降低的生產(chǎn)能耗為90-(0.7100+0.35)=19.65噸標(biāo)準(zhǔn)煤.5-1 (2015江西一模,18,14分)為了研究某種細(xì)菌在特定環(huán)境下,隨時間變化的繁殖情況,得如下實(shí)驗(yàn)數(shù)據(jù):42
18、141345686,4.5,42.5344.53.5,466.5,iiiiixxyx y 已知41422144iiiiix yx ybxx266.54 4.5 3.5864 4.5 ayb x天數(shù)t(天)34567繁殖個數(shù)y(千個)2.5344.56(1)求y關(guān)于t的線性回歸方程;(2)利用(1)中的回歸方程,預(yù)測t=8時,細(xì)菌繁殖個數(shù).附:=,=-b.解析解析(1)由表中數(shù)據(jù)計(jì)算得,=5,=4,(ti-)(yi-)=8.5,(ti-)2=10,=0.85,=-=-0.25.所以,回歸方程為y=0.85t-0.25.(2)將t=8代入回歸方程y=0.85t-0.25中得y=0.858-0.25
19、=6.55.故預(yù)測t=8時,細(xì)菌繁殖個數(shù)為6.55千個.b121()()()niiiniittyytt aytty1nity1nitb121()()()niiiniittyytt ayb t獨(dú)立性檢驗(yàn)的基本思想類似于反證法.要確認(rèn)“兩個分類變量有關(guān)系”這一結(jié)論成立的可信程度,首先假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個分類變量沒有關(guān)系”成立,在該假設(shè)下構(gòu)造的隨機(jī)變量K2應(yīng)該很小.如果由觀測數(shù)據(jù)計(jì)算得到的K2的觀察值k很大,則在一定程度上說明假設(shè)不合理.根據(jù)隨機(jī)變量K2的含義,我們把K2k0解釋為有1-P(K2k0)100%的把握認(rèn)為“兩個分類變量有關(guān)系”;把K210.828,所以有99.9%的把握認(rèn)為學(xué)生的學(xué)習(xí)積極性與對待班級工作的態(tài)度有關(guān)系.6-1 (2015長沙一模,18,12分)甲、乙兩個班進(jìn)行數(shù)學(xué)考試,按照大于或等于85分為優(yōu)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 3個課時課程設(shè)計(jì)
- 什么是高效實(shí)驗(yàn)課程設(shè)計(jì)
- 2024至2030年中國壓黃線監(jiān)測系統(tǒng)行業(yè)投資前景及策略咨詢研究報(bào)告
- 管道安裝工程課程設(shè)計(jì)
- c語言課程設(shè)計(jì)雪花飛舞
- 病人呼吸器課程設(shè)計(jì)
- 2024年木梯項(xiàng)目可行性研究報(bào)告
- 2024至2030年中國外墻啞光高級乳膠漆數(shù)據(jù)監(jiān)測研究報(bào)告
- 課程設(shè)計(jì)原則簡答題
- 中國高分子絮凝劑行業(yè)應(yīng)用態(tài)勢及投資動態(tài)預(yù)測研究報(bào)告(2024-2030版)
- 安全生產(chǎn)知識競賽(簡答題)
- 玻璃鋼離心風(fēng)機(jī)
- 法律、法規(guī)及標(biāo)準(zhǔn)清單
- 四年級勞動教育-西紅柿炒蛋(課件)
- 抖音公會掛靠合作協(xié)議(法務(wù)審核最新版)
- 國企招考辦公室崗位筆試真題及答案
- GB∕T 5001-2018 日用陶瓷分類
- 2022年化學(xué)檢驗(yàn)員三級理論考試題庫及答案
- 康復(fù)醫(yī)學(xué)發(fā)展的歷史課件
- 幼兒園教師月度KPI績效考核表
- u8-HR案例及數(shù)據(jù)-修改版1
評論
0/150
提交評論