




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、12.5統(tǒng)計與統(tǒng)計案例高考理數(shù)高考理數(shù)一、隨機抽樣1.簡單隨機抽樣一般地,設(shè)一個總體含有N個個體,從中逐個不放回地抽取n個個體作為樣本(nN),如果每次抽取時總體內(nèi)的各個個體被抽到的機會都相等,就把這種抽樣方法叫做簡單隨機抽樣.最常用的簡單隨機抽樣的方法有兩種:抽簽法和隨機數(shù)法.2.系統(tǒng)抽樣當總體中的個體比較多時,首先把總體分成均衡的若干部分,然后按照事先確定的規(guī)則,從每一部分中抽取一個個體,得到所需要的樣本,這種抽樣方法叫做系統(tǒng)抽樣.3.分層抽樣一般地,在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數(shù)量的個體,將各層取出的個體合在一起作為樣本,這種抽樣方法是分層抽
2、樣.知識清單二、用樣本估計總體1.用樣本的頻率分布估計總體分布(1)頻率分布表與頻率分布直方圖頻率分布表和頻率分布直方圖,是從各個小組數(shù)據(jù)在樣本容量中所占比例大小的角度來表示數(shù)據(jù)分布的規(guī)律.它可以使我們看到整個樣本數(shù)據(jù)的頻率分布情況.繪制頻率分布直方圖的步驟:求極差;決定組距與組數(shù);將數(shù)據(jù)分組;列頻率分布表;畫頻率分布直方圖.(2)頻率分布折線圖連結(jié)頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖.(3)莖葉圖一般地,莖是指中間的一列數(shù),葉就是從莖的旁邊生長出來的數(shù).2.用樣本的數(shù)字特征估計總體的數(shù)字特征(1)眾數(shù):一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的數(shù).(2)中位數(shù):將數(shù)據(jù)從小到大(或從大到小
3、)排列,若有奇數(shù)個數(shù),則最中間的數(shù)是中位數(shù);若有偶數(shù)個數(shù),則中間兩數(shù)的平均數(shù)是中位數(shù).(3)平均數(shù):=,反映了一組數(shù)據(jù)的平均水平.(4)標準差:s=,反映了樣本數(shù)據(jù)的離散程度.(5)方差:s2=(x1-)2+(x2-)2+(xn-)2,反映了樣本數(shù)據(jù)的離散程度.三、變量間的相關(guān)關(guān)系及回歸分析1.相關(guān)關(guān)系:當自變量取值一定時,因變量的取值帶有一定隨機性的兩個變量之間的關(guān)系叫做相關(guān)關(guān)系.與函數(shù)關(guān)系不同,相關(guān)關(guān)系是一種不確定關(guān)系.2.散點圖:表示具有相關(guān)關(guān)系的兩個變量的一組數(shù)據(jù)的圖形叫做散點圖,它可直觀地判斷兩變量的關(guān)系是否可以用線性關(guān)系表示.若這些點散布在從左下角到右上角的區(qū)域,則稱兩個變量正相關(guān)
4、;若這些點散布在從左上角到右下角的區(qū)域,則稱兩個變量負相關(guān).x12nxxxn222121()()() nxxxxxxn1nxxx3.回歸分析:對具有相關(guān)關(guān)系的兩個變量進行統(tǒng)計分析的方法叫做回歸分析.在線性回歸模型y=bx+a+e中,因變量y的值由自變量x和隨機誤差e共同確定,即自變量x只能解釋部分y的變化,在統(tǒng)計中,我們把自變量x稱為解釋變量,因變量y稱為預(yù)報變量.4.回歸方程:=x+,其中=,=-,它主要用來估計和預(yù)測取值,從而獲得對這兩個變量之間整體關(guān)系的了解.5.相關(guān)系數(shù):,它主要用于相關(guān)量的顯著性檢驗,以衡量它們之間的線性相關(guān)程度.當r0時,表示兩個變量正相關(guān);當r2.706時,有90
5、%的把握判定變量X,Y有關(guān)聯(lián);當K23.841時,認為X與Y無關(guān);當K23.841時,有95%的把握說X與Y有關(guān);當K26.635時,有99%的把握說X與Y有關(guān);當K210.828時,有99.9%的把握說X與Y有關(guān).類別共同點各自特點相互聯(lián)系適用范圍從總體中逐個抽取總體中的個體數(shù)較少將總體均分成幾部分,按事先確定的規(guī)則在各部分抽取在起始部分抽樣時采用簡單隨機抽樣總體中的個體數(shù)較多將總體分成幾層,分層進行抽取分層抽樣時采用簡單隨機抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成【知識拓展】【知識拓展】1.隨機抽樣2.用樣本估計總體用樣本估計總體,包括用“形”與“數(shù)”兩個方面.用“形”就是利用樣本數(shù)據(jù)列出
6、頻率分布表、畫出頻率分布直方圖和頻率折線圖.用“數(shù)”就是用樣本的數(shù)字特征來反映總體的某個方面的特征,最常用的是借助平均數(shù)、眾數(shù)、中位數(shù)、標準差和方差等數(shù)字特征來估計數(shù)據(jù)的平均水平和離散、波動的程度.它們是同一組數(shù)據(jù)的頻率分布的不同表現(xiàn)形式.3.對回歸分析的理解回歸分析是處理變量相關(guān)關(guān)系的一種數(shù)學方法,它主要解決三個問題:(1)確定兩個變量之間是否有相關(guān)關(guān)系,如果有,就找出它們之間貼近的數(shù)學表達式;(2)根據(jù)一組觀察值,預(yù)測變量的取值及判斷變量取值的變化趨勢;(3)求出回歸直線方程.簡單隨機抽樣的方法有:抽簽法和隨機數(shù)法.系統(tǒng)抽樣的步驟:將總體中的個體隨機編號;將編號分段;在第1段中用簡單隨機抽
7、樣確定起始的個體編號;按照事先研究的規(guī)則抽取樣本.分層抽樣的步驟:分層;按比例確定每層抽取個體的個數(shù);各層抽樣(方法可以不同);合成樣本.例例1 (2016河南龍子湖一模,17,12分)我省城鄉(xiāng)居民社會養(yǎng)老保險個人年繳費分100,200,300,400,500,600,700,800,900,1000(單位:元)十個檔次,某社區(qū)隨機抽取了50名村民,按繳費在100500元,6001000元,以及年齡在2039歲,4059歲之間進行了統(tǒng)計,相關(guān)數(shù)據(jù)如下:突破方法方法方法1抽樣方法抽樣方法100500元6001000元總計2039歲106164059歲151934總計252550(1)用分層抽樣的
8、方法從繳費在100500元之間的村民中隨機抽取5人,則應(yīng)從年齡在2039歲之間的村民中抽取幾人?(2)從繳費在100500元之間抽取的5人中,隨機選取2人進行到戶走訪,求這2人的年齡都在4059歲之間的概率.解析解析(1)設(shè)應(yīng)從年齡在2039歲之間的村民中抽取x人,則=,解得x=2.所以應(yīng)從年齡在2039歲之間的村民中抽取2人.(2)設(shè)從繳費在100500元之間抽取的5人中,年齡在2039歲之間的2人為A,B,在4059歲之間的3人為a,b,c,則隨機選取2人的情況有(A,B),(A,a),(A,b),(A,c),(B,a),(B,b),(B,c),(a,b),(a,c),(b,c),共10種
9、.年齡都在4059歲之間的有(a,b),(a,c),(b,c),共3種,則所求概率P=.1-1 (2016廣西南寧三模,5,5分)采用系統(tǒng)抽樣方法從960人中抽取32人做問卷調(diào)查,為此將他們隨機編號為1,2,960,分組后在第一組采用簡單隨機抽樣的方法抽到的號碼為9,抽到的32人中,編號在1450內(nèi)的人做問卷A,編號在451750內(nèi)的人做問卷B,其余的人做問卷C,則抽到的人中,52510 x310做問卷B的人數(shù)為()A.7B.9C.10D.15答案答案 C解析解析由題意可知系統(tǒng)抽樣中每一組的樣本數(shù)為=30,因為第一組抽取的樣本號碼為9,所以第k組抽取的樣本號碼應(yīng)該為9+30(k-1)(kN*)
10、.由4519+30(k-1)750,得16k25(kN*),所以k=16,17,25,共10個,即應(yīng)該有10人做問卷B.96032從頻率分布直方圖中得出有關(guān)數(shù)據(jù)的方法:(1)頻率=組距;(2)頻率比=小長方形的高的比;(3)眾數(shù):最高小長方形底邊中點的橫坐標;(4)中位數(shù):平分頻率分布直方圖面積且垂直于橫軸的直線與橫軸交點的橫坐標;(5)平均數(shù):每個小長方形的面積乘小長方形底邊中點的橫坐標之和.例例2 (2014吉林延吉一模,19,12分)從全校參加科技知識競賽的學生試卷中,抽取一個樣本,考察競賽的成績分布.將樣本分成5組,繪成頻率分布直方圖(如圖),圖中從左到右各小組的小長方形的高的比是1
11、3 6 4 2,最后一組的頻數(shù)是6.頻率組距方法方法2頻率分布直方圖的應(yīng)用頻率分布直方圖的應(yīng)用請結(jié)合頻率分布直方圖,解答下列問題:(1)樣本的容量是多少?(2)列出頻率分布表;(3)成績落在哪個范圍內(nèi)的人數(shù)最多?并求該小組的頻數(shù)、頻率;(4)估計這次競賽中,成績不低于60分的學生占總?cè)藬?shù)的百分比.解析解析(1)由于各組的組距相等,所以各組的頻率與各小長方形的高成正比且各組頻率的和等于1,那么各組的頻率分別為,.設(shè)該樣本容量為n,則=,解得n=48.1163166164162166n216(2)由以上得頻率分布表如下:(3)成績落在70.5,80.5)之間的人數(shù)最多,該組的頻數(shù)和頻率分別是18和
12、.(4)不低于60分的學生占總?cè)藬?shù)的百分比約為100%=93.75%.2-1 (2014廣東,17,13分)隨機觀測生產(chǎn)某種零件的某工廠25名工人的日加工零件數(shù)(單位:件),獲得數(shù)據(jù)如下:30,42,41,36,44,40,37,37,25,45,29,43,31,36,49,34,33,43,38,42,32,34,46,39,36.根據(jù)上述數(shù)據(jù)得到樣本的頻率分布表如下:成績頻數(shù)頻率50.5,60.5)360.5,70.5)970.5,80.5)1880.5,90.5)1290.5,100.56合計481116316616416216381116分組頻數(shù)頻率25,3030.12(30,355
13、0.20(35,4080.32(40,45n1f1(45,50n2f2(1)確定樣本頻率分布表中n1,n2,f1和f2的值;(2)根據(jù)上述頻率分布表,畫出樣本頻率分布直方圖;(3)根據(jù)樣本頻率分布直方圖,求在該廠任取4人,至少有1人的日加工零件數(shù)落在區(qū)間(30,35的概率.解析解析(1)n1=7,n2=2,f1=0.28,f2=0.08.(2)樣本頻率分布直方圖如圖所示.(3)根據(jù)樣本頻率分布直方圖,得每人的日加工零件數(shù)落在區(qū)間(30,35的概率為0.2,設(shè)所取的4人中,日加工零件數(shù)落在區(qū)間(30,35的人數(shù)為,則B(4,0.2),P(1)=1-P(=0)=1-(1-0.2)4=1-0.409
14、6=0.5904,所以4人中,至少有1人的日加工零件數(shù)落在區(qū)間(30,35的概率為0.5904.1.制作莖葉圖的方法:將所有兩位數(shù)的十位數(shù)字作為“莖”,個位數(shù)字作為“葉”,莖相同者共用一個莖,莖按從小到大的順序由上到下列出.2.估計數(shù)字特征,給定兩組數(shù)據(jù)的莖葉圖,“重心”下移者平均數(shù)較大,數(shù)據(jù)集中者方差較小.例3(2014山東東營二模,10,4分)甲、乙兩名同學在5次數(shù)學考試中,成績統(tǒng)計圖用莖葉圖表示如圖所示,若甲、乙兩名同學的平均成績分別用、表示,則下列結(jié)論正確的是()A.,且甲比乙成績穩(wěn)定B.,且乙比甲成績穩(wěn)定C.,且甲比乙成績穩(wěn)定D.可知乙的成績較穩(wěn)定.從折線圖看,甲的成績基本上呈上升狀
15、態(tài),而乙的成績上下波動,可知甲的成績在不斷提高,而乙的成績無明顯提高.4-1(2016河南鄭州回民中學4月月考,6,5分)為了普及環(huán)保知識,增強環(huán)保意識,某大學隨機抽取30名學生參加環(huán)保知識測試,得分(十分制)的統(tǒng)計圖如圖所示,假設(shè)得分值的中位數(shù)為m,眾數(shù)為n,平均數(shù)為,則()x甲10 13 12 14 165x乙13 14 12 12 1452s甲152s乙152s甲2s乙xA.m=n=B.m=nC.mnD.nm答案答案D解析解析由題圖可知,30名學生的得分情況為2個人得3分,3個人得4分,10個人得5分,6個人得6分,3個人得7分,2個人得8分,2個人得9分,2個人得10分.中位數(shù)為第15
16、,16個數(shù)(分別為5,6)的平均數(shù),即xxxxm=5.5;5出現(xiàn)的次數(shù)最多,故n=5,=5.97,于是得nm,故選D.x2 33 4 10 56 63 72 82 92 1030 x求線性回歸方程的步驟:例例5(2014湖南長沙3月月考,18,12分)下表提供了某廠節(jié)能降耗技術(shù)改造后生產(chǎn)甲產(chǎn)品過程中記錄的產(chǎn)量x(噸)與相應(yīng)的生產(chǎn)能耗y(噸標準煤)的幾組對照數(shù)據(jù).方法方法5線性回歸分析線性回歸分析x3456y2.5344.5(1)請畫出上表數(shù)據(jù)的散點圖;(2)請根據(jù)上表提供的數(shù)據(jù),用最小二乘法求出y關(guān)于x的線性回歸方程y=x+;(3)已知該廠技改前100噸甲產(chǎn)品的生產(chǎn)能耗為90噸標準煤.試根據(jù)(
17、2)求出的線性回歸方程,預(yù)測生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗比技改前降低多少噸標準煤.(參考數(shù)值:32.5+43+54+64.5=66.5)解析解析(1)由題設(shè)所給數(shù)據(jù),可得散點圖如下圖.b a(2)由對照數(shù)據(jù),計算得所以,由最小二乘法確定的回歸方程的系數(shù)為=0.7,=-=3.5-0.74.5=0.35.因此,所求的線性回歸方程為y=0.7x+0.35.(3)由(2)的回歸方程及技改前生產(chǎn)100噸甲產(chǎn)品的生產(chǎn)能耗,得降低的生產(chǎn)能耗為90-(0.7100+0.35)=19.65噸標準煤.5-1 (2015江西一模,18,14分)為了研究某種細菌在特定環(huán)境下,隨時間變化的繁殖情況,得如下實驗數(shù)據(jù):42
18、141345686,4.5,42.5344.53.5,466.5,iiiiixxyx y 已知41422144iiiiix yx ybxx266.54 4.5 3.5864 4.5 ayb x天數(shù)t(天)34567繁殖個數(shù)y(千個)2.5344.56(1)求y關(guān)于t的線性回歸方程;(2)利用(1)中的回歸方程,預(yù)測t=8時,細菌繁殖個數(shù).附:=,=-b.解析解析(1)由表中數(shù)據(jù)計算得,=5,=4,(ti-)(yi-)=8.5,(ti-)2=10,=0.85,=-=-0.25.所以,回歸方程為y=0.85t-0.25.(2)將t=8代入回歸方程y=0.85t-0.25中得y=0.858-0.25
19、=6.55.故預(yù)測t=8時,細菌繁殖個數(shù)為6.55千個.b121()()()niiiniittyytt aytty1nity1nitb121()()()niiiniittyytt ayb t獨立性檢驗的基本思想類似于反證法.要確認“兩個分類變量有關(guān)系”這一結(jié)論成立的可信程度,首先假設(shè)該結(jié)論不成立,即假設(shè)結(jié)論“兩個分類變量沒有關(guān)系”成立,在該假設(shè)下構(gòu)造的隨機變量K2應(yīng)該很小.如果由觀測數(shù)據(jù)計算得到的K2的觀察值k很大,則在一定程度上說明假設(shè)不合理.根據(jù)隨機變量K2的含義,我們把K2k0解釋為有1-P(K2k0)100%的把握認為“兩個分類變量有關(guān)系”;把K210.828,所以有99.9%的把握認為學生的學習積極性與對待班級工作的態(tài)度有關(guān)系.6-1 (2015長沙一模,18,12分)甲、乙兩個班進行數(shù)學考試,按照大于或等于85分為優(yōu)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年大學生心理健康知識競賽題庫及答案(共180題)
- 2025-2030年中國PE筆袋數(shù)據(jù)監(jiān)測研究報告
- 2025-2030年中國永固紫RL顏料數(shù)據(jù)監(jiān)測研究報告
- 北師大版(2019)必修 第一冊 Unit 1 Life Choices Lesson 1 Lifestyles 閱讀課教學設(shè)計(表格式)
- Unit 3 How do you get to schoolSection A (1a-2d)導(dǎo)學案 2025年人教版七年級英語下冊
- 合作融資協(xié)議書
- 授權(quán)藥品代理經(jīng)銷合同
- 公司員工休息日計劃表
- 保證代理擔保合同協(xié)議
- 保溫板防火隔離帶施工方案
- 鋼結(jié)構(gòu)安全交底
- 中國移動《下一代全光骨干傳送網(wǎng)白皮書》
- 川教版六年級《生命.生態(tài).安全》下冊第1課《我們的閑暇時光》課件
- 2024年社區(qū)工作者考試必背1000題題庫含必背答案
- 心理危機干預(yù)指導(dǎo)手冊
- 抖音:短視頻與直播運營全套教學課件
- 部編小學語文單元作業(yè)設(shè)計二年級下冊第七單元
- 【真題】2023年鎮(zhèn)江市中考化學試卷(含答案解析)
- 小米創(chuàng)始人雷軍的創(chuàng)業(yè)經(jīng)歷
- 2023年江蘇省蘇州市吳江區(qū)中考一模數(shù)學試題
- 海南中維生物科技有限公司 蝗蟲微孢子蟲生物制劑項目 環(huán)評報告
評論
0/150
提交評論