版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、 必修三第二章統(tǒng)計復(fù)習(xí)專題一、基礎(chǔ)知識回顧1:簡單隨機抽樣(1)總體和樣本 在統(tǒng)計學(xué)中 , 把研究對象的全體叫做總體把每個研究對象叫做個體把總體中個體的總數(shù)叫做總體容量為了研究總體的有關(guān)性質(zhì),一般從總體中隨機抽取一部分:, , , 研究,我們稱它為樣本其中個體的個數(shù)稱為樣本容量(2)簡單隨機抽樣:就是從總體中不加任何分組、劃類、排隊等,完全隨機地抽取調(diào)查單位。特點是:每個樣本個體被抽中的可能性相同(概率相等),樣本的每個個體完全獨立,彼此間無一定的關(guān)聯(lián)性和排斥性且為逐個不放回抽取,簡單隨機抽樣是其它各種抽樣形式的基礎(chǔ)。通常只是在總體個體之間差異程度較小和數(shù)目較少時,才采用這種方法。(3)簡單隨
2、機抽樣常用的方法: 抽簽法隨機數(shù)表法計算機模擬法(4)抽簽法: 給調(diào)查對象群體中的每一個對象編號;準(zhǔn)備抽簽的工具,實施抽簽; 對樣本中的每一個個體進(jìn)行測量或調(diào)查(5) 隨機數(shù)表法:給調(diào)查對象群體中的每一個對象編號(編號位數(shù)相同);獲取樣本編號2:系統(tǒng)抽樣(1)系統(tǒng)抽樣(等距抽樣或機械抽樣):把總體的單位進(jìn)行排序,再計算出抽樣距離,然后按照這一固定的抽樣距離抽取樣本。第一個樣本采用簡單隨機抽樣的辦法抽取。 K(抽樣距離)=N/n(若N/n不是整數(shù),則需先用簡單隨機抽樣剔除數(shù)目最少的個體后再進(jìn)行)(2)系統(tǒng)抽樣,即等距抽樣是實際中最為常用的抽樣方法之一。因為它對抽樣框的要求較低,實施也比較簡單。更
3、為重要的是,如果有某種與調(diào)查指標(biāo)相關(guān)的輔助變量可供使用,總體單元按輔助變量的大小順序排隊的話,使用系統(tǒng)抽樣可以大大提高估計精度。3:分層抽樣(1)分層抽樣(類型抽樣):先將總體中的所有單位按照某種特征或標(biāo)志(性別、年齡等)劃分成若干類型或?qū)哟?,然后再在各個類型或?qū)哟沃胁捎煤唵坞S機抽樣或系用抽樣的辦法抽取一個子樣本,最后,將這些子樣本合起來構(gòu)成總體的樣本。兩種方法:先以分層變量將總體劃分為若干層,再按照各層在總體中的比例從各層中抽取。先以分層變量將總體劃分為若干層,再將各層中的元素按分層的順序整齊排列,最后用系統(tǒng)抽樣的方法抽取樣本。(2)分層抽樣是把異質(zhì)性較強的總體分成一個個同質(zhì)性較強的子總體,
4、再抽取不同的子總體中的樣本分別代表該子總體,所有的樣本進(jìn)而代表總體。分層標(biāo)準(zhǔn):以調(diào)查所要分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn)。以保證各層內(nèi)部同質(zhì)性強、各層之間異質(zhì)性強、突出總體內(nèi)在結(jié)構(gòu)的變量作為分層變量。以那些有明顯分層區(qū)分的變量作為分層變量。(3)分層的比例問題:抽樣比= 按比例分層抽樣:根據(jù)各種類型或?qū)哟沃械膯挝粩?shù)目占總體單位數(shù)目的比重來抽取子樣本的方法。 不按比例分層抽樣:有的層次在總體中的比重太小,其樣本量就會非常少,此時采用該方法,主要是便于對不同層次的子總體進(jìn)行專門研究或進(jìn)行相互比較。如果要用樣本資料推斷總體時,則需要先對各層的數(shù)據(jù)資料進(jìn)行加權(quán)處理,調(diào)整樣本中各層的比例,
5、使數(shù)據(jù)恢復(fù)到總體中各層實際的比例結(jié)構(gòu)。類別共同點各自特點相互關(guān)系適用范圍簡單隨機抽樣抽樣過程中每個個體被抽取的機會相等,都為n/N從總體中逐個抽取總體中的個體數(shù)較少系統(tǒng)抽樣將總體均勻分成幾部分,按事先確定的規(guī)則在各部分抽取再起時部分抽樣時采用簡單隨機抽樣總體中的個數(shù)較多分成抽樣經(jīng)總體分成幾層,分層進(jìn)行抽取各層抽樣時采用簡單隨機抽樣總體由差異明顯的幾部分組成如:某學(xué)校決定從高一(1)班60名學(xué)生中利用隨機數(shù)表法抽取10人進(jìn)行調(diào)研,先將60名學(xué)生按01,02,60進(jìn)行編號;如果從第8行第7列的數(shù)開始從左向右讀,則抽取到的第4個人的編號為()(下面摘取了第7行到第9行)844217533157245
6、50688770474476721763350268392630153165916927538629821507175128673580744391326 3321134278641607 8252074438150324 4299 7931A16B38C21D50【考點】系統(tǒng)抽樣方法【分析】根據(jù)隨機數(shù)表法的讀法,可得答案【解答】解:找到第8行第7列的數(shù)開始向右讀,第一個符合條件的是16,第二個數(shù)59,第三個數(shù)38,第四個數(shù)21第4個樣本個體的編號是21,故選:C,4:用樣本的數(shù)字特征估計總體的數(shù)字特征(1)樣本均值:(2)樣本標(biāo)準(zhǔn)差:(3)眾數(shù):在樣本數(shù)據(jù)中,頻率分布最大值所對應(yīng)的樣本數(shù)據(jù)(
7、可以是多個)。(4)中位數(shù):居中(中間一個或兩個的平均數(shù),直方圖中使兩邊頻率相等的數(shù)據(jù))注意: 如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)都加上或減去同一個共同的常數(shù),標(biāo)準(zhǔn)差不變?nèi)绻岩唤M數(shù)據(jù)中的每一個數(shù)據(jù)乘以一個共同的常數(shù)k,標(biāo)準(zhǔn)差變?yōu)樵瓉淼膋倍一組數(shù)據(jù)中的最大值和最小值對標(biāo)準(zhǔn)差的影響,區(qū)間的應(yīng)用;“去掉一個最高分,去掉一個最低分”中的科學(xué)道理5:用樣本的頻率分布估計總體分布1:頻率分布表與頻率分布直方圖 頻率分布表盒頻率分布直方圖,是從各個小組數(shù)據(jù)在樣本容量中所占比例大小的角度,來表示數(shù)據(jù)分布規(guī)律,它可以使我們看到整個樣本數(shù)據(jù)的頻率分布情況。具體步驟如下:第一步:求極差,即計算最大值與最小值的差.第二步
8、:決定組距和組數(shù):組距與組數(shù)的確定沒有固定標(biāo)準(zhǔn),需要嘗試、選擇,力求有合適的組數(shù),以能把數(shù)據(jù)的規(guī)律較清楚地呈現(xiàn)為準(zhǔn).太多或太少都不好,不利對數(shù)據(jù)規(guī)律的發(fā)現(xiàn).組數(shù)應(yīng)與樣本的容量有關(guān),樣本容量越大組數(shù)越多.一般來說,容量不超過100的組數(shù)在5至12之間.組距應(yīng)最好“取整”,它與有關(guān).注意:組數(shù)的“取舍”不依據(jù)四舍五入,而是當(dāng)不是整數(shù)時,組數(shù)=+1.頻率分布折線圖 :連接頻率分布直方圖中各個小長方形上端的中點,就得到頻率分布折線圖??傮w密度曲線:總體密度曲線反映了總體在各個范圍內(nèi)取值的百分比,它能給我們提供更加精細(xì)的信息。2:莖葉圖:莖是指中間的一列數(shù),葉是指從莖旁邊生長出來的數(shù)。例1:某班n名學(xué)生
9、的綜合素質(zhì)測評成績(百分制)頻率分布直方圖如圖所示,已知7080分?jǐn)?shù)段的學(xué)生人數(shù)為27人,9095分?jǐn)?shù)段的學(xué)生中女生為2人(1)求a,n的值;(2)若從9095分?jǐn)?shù)段內(nèi)的學(xué)生中隨機抽取2人,求其中至少有一名女生的概率【考點】頻率分布直方圖;列舉法計算基本事件數(shù)及事件發(fā)生的概率【分析】(1)根據(jù)頻率分布直方圖求出a的值,從而求出n即可;(2)先得到男生4人,記為:a,b,c,d,女生2人,記為:e,f,列出所有的基本事件以及滿足條件的事件,從而求出滿足條件的概率即可【解答】解:(1)由頻率分布直方圖得:(a+a+2a+3a+4a+4a+5a)×5=1,解得:a=0.01,由已知得(4a
10、+5a)×5=,解得:n=60;(2)9095分?jǐn)?shù)段內(nèi)的學(xué)生數(shù)是2a×5×60=6,則男生4人,記為:a,b,c,d,女生2人,記為:e,f,若從9095分?jǐn)?shù)段內(nèi)的學(xué)生中隨機抽取2人,共有ab,ac,ad,ae,af,bc,bd,be,bf,cd,ce,cf,de,df,ef,共15種情形,其中滿足至少有一名女生共有:ae,af,be,bf,ce,cf,de,df,ef,共9種情形,其中至少有一名女生的概率是p=例2:某賽季甲、乙兩名籃球運動員每場比賽得分情況的莖葉圖如下圖225請根據(jù)上圖對兩名運動員的成績進(jìn)行比較,誰發(fā)揮比較穩(wěn)定。6:變量間的相關(guān)關(guān)系:自變量取值
11、一定時因變量的取值帶有一定隨機性的兩個變量之間的關(guān)系交相關(guān)關(guān)系。對具有相關(guān)關(guān)系的兩個變量進(jìn)行統(tǒng)計分析的方法叫做回歸分析。(1)回歸直線:根據(jù)變量的數(shù)據(jù)作出散點圖,如果各點大致分布在一條直線的附近,就稱這兩個變量之間具有線性相關(guān)的關(guān)系,這條直線叫做回歸直線方程。如果這些點散布在從左下角到右上角的區(qū)域,我們就成這兩個變量呈正相關(guān);若從左上角到右下角的區(qū)域,則稱這兩個變量呈負(fù)相關(guān)。設(shè)已經(jīng)得到具有線性相關(guān)關(guān)系的一組數(shù)據(jù): 所要求的回歸直線方程為:,其中,是待定的系數(shù)。(2)回歸直線過的樣本中心點例3. 10.假設(shè)關(guān)于某設(shè)備的使用年限x(年)和所支出的維修費y(萬元)有如下統(tǒng)計資料:x23456y2.2
12、3.85.56.57.0若由資料知,y對x呈線性相關(guān)關(guān)系.試求:(1)線性回歸方程;(2)估計使用年限為10年時,維修費用約是多少?思路分析:本題考查線性回歸方程的求法和利用線性回歸方程求兩變量間的關(guān)系.解:(1) b= =1.23,a=-b=5-1.23×4=0.08.所以,回歸直線方程為=1.23x+0.08.(2)當(dāng)x=10時,=1.23×10+0.08=12.38(萬元),即估計使用10年時維修費約為12.38萬元.例4(15年全國卷19)某公司為確定下一年度投入某種產(chǎn)品的宣傳費,需了解年宣傳費x(單位:千元)對年銷售量y(單位:t)和年利潤z(單位:千元)的影響,
13、對近8年的年宣傳費xi和年銷售量yi(i1,2,···,8)數(shù)據(jù)作了初步處理,得到下面的散點圖及一些統(tǒng)計量的值. 46.656.36.8289.81.61469108.8表中w1 , , ()根據(jù)散點圖判斷,yabx與ycd哪一個適宜作為年銷售量y關(guān)于年宣傳費x的回歸方程類型?(給出判斷即可,不必說明理由)()根據(jù)()的判斷結(jié)果及表中數(shù)據(jù),建立y關(guān)于x的回歸方程;()已知這種產(chǎn)品的年利率z與x、y的關(guān)系為z0.2yx.根據(jù)()的結(jié)果回答下列問題:()年宣傳費x49時,年銷售量及年利潤的預(yù)報值是多少?()年宣傳費x為何值時,年利率的預(yù)報值最大?附:對于一組數(shù)據(jù)(u1
14、 v1),(u2 v2),(un vn),其回歸線vu的斜率和截距的最小二乘估計分別為: 二、練習(xí)提高;1.一學(xué)校高中部有學(xué)生2 000人,其中高一學(xué)生800人,高二學(xué)生600人,高三學(xué)生600人.現(xiàn)采用分層抽樣的方法抽取容量為50的樣本,那么高一、高二、高三各年級被抽取的學(xué)生人數(shù)分別為( ) A.15,10,25 B、20,15,15 C.10,10,30 D.10,20,202. 一個容量為10的樣本數(shù)據(jù),分組后,組距與頻數(shù)如下:1,2),1;2,3),1;3,4),2; 4,5),3;5,6),1;6,7),2.則樣本在區(qū)間1,5)上的頻率是( ) A、0.70 B.0.25 C.0.5
15、0 D.0.203.觀察新生嬰兒的體重表,其頻率分布直方圖如圖2-1所示,則新生嬰兒體重在2 700,3 000)的頻率為( )圖2-1A.0.001 B.0.1 C.0.2 D、0.34.有甲、乙兩種水稻,測得每種水稻各10株的分蘗數(shù)后,計算出樣本方差分別為s甲2=11,s乙2=3.4,由此可以估計( )A.甲種水稻比乙種水稻分蘗整齊 B、乙種水稻比甲種水稻分蘗整齊C.甲、乙兩種水稻分蘗整齊程度相同 D.甲、乙兩種水稻分蘗整齊程度不能比較5.某公司在甲、乙、丙、丁四個地區(qū)分別有150個、120個、180個、150個銷售點,公司為了調(diào)查產(chǎn)品銷售的情況,需從這600個銷售點中抽取一個容量為100
16、的樣本,記這項調(diào)查為(1);在丙地區(qū)中有20個特大型銷售點,要從中抽取7個調(diào)查其銷售收入和售后服務(wù)情況,記這項調(diào)查為(2). 則完成(1)(2)這兩項調(diào)查宜采用的抽樣方法依次是( )A.分層抽樣法,系統(tǒng)抽樣法 B、分層抽樣法,簡單隨機抽樣法C.系統(tǒng)抽樣法,分層抽樣法 D.簡單隨機抽樣法,分層抽樣法6.已知x,y之間的一組數(shù)據(jù)如下表,則y與x的線性回歸方程y=a+bx必經(jīng)過點 ( D )x0123y1357 (A)(2,2) (B)(1.5,0) (C)(1,2) (D)(1.5,4)7.若總體中含有1 650個個體,現(xiàn)在要采用系統(tǒng)抽樣法,從中抽取一個容量為35的樣本,分段時應(yīng)從總體中隨機剔除_個個體,編號后應(yīng)均分為_段,每段有_個個體.答案:5 35 478.數(shù)據(jù)x1,x2, ,x8的平均數(shù)為6,標(biāo)準(zhǔn)差為2,則數(shù)據(jù)2x1-6,2x2-6, ,2x8-6的平均數(shù)為_,方差為_.答案:6 169.進(jìn)行n次試驗,得到樣本觀測值為x1,x2,xn,設(shè)c為任
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 商用住宅合同范例
- 屋面防水注漿合同范例
- 小區(qū)物業(yè)與保安合同范例
- 學(xué)校不裝修合同范例
- 場地促銷合同范例
- 商標(biāo)授權(quán)合同范例范例
- 藝術(shù)教育:激發(fā)創(chuàng)新之源
- 包材意向合同范例
- 委托行為合同范例
- 建材經(jīng)銷商授權(quán)合同范例
- 以名師工作室為引領(lǐng)構(gòu)建教師發(fā)展共同體ppt課件市公開課金獎市賽課一等獎?wù)n件
- 《斯坦福大學(xué)人生設(shè)計課》讀書筆記PPT模板思維導(dǎo)圖下載
- 廈門大學(xué)考研細(xì)胞生物學(xué)本科生期末試題庫
- 軟巖隧道設(shè)計
- PEP小學(xué)六年級英語上冊選詞填空專題訓(xùn)練
- 部編版道德與法治四年級上冊第一單元作業(yè)設(shè)計
- SB/T 10379-2012速凍調(diào)制食品
- GB/T 9754-2007色漆和清漆不含金屬顏料的色漆漆膜的20°、60°和85°鏡面光澤的測定
- 甲狀腺癌NCCN指南中文版2021.v2
- GB/T 28726-2012氣體分析氦離子化氣相色譜法
- GB/T 14100-2016燃?xì)廨啓C驗收試驗
評論
0/150
提交評論