統(tǒng)計知識點與例題_第1頁
統(tǒng)計知識點與例題_第2頁
統(tǒng)計知識點與例題_第3頁
統(tǒng)計知識點與例題_第4頁
統(tǒng)計知識點與例題_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第二章 統(tǒng)計2.1隨機(jī)抽樣1、簡單隨機(jī)抽樣的概念一般地,設(shè)一個總體含有N個個體,從中逐個不放回地抽取n個個體作為樣本(nN),如果每次抽取時總體內(nèi)的各個個體被抽到的機(jī)會都相等,就把這種抽樣方法叫做簡單隨機(jī)抽樣。思考:下列抽樣的方式是否屬于簡單隨機(jī)抽樣?為什么?(1)從無限多個個體中抽取50個個體作為樣本。(2)箱子里共有100個零件,從中選出10個零件進(jìn)行質(zhì)量檢驗,在抽樣操作中,從中任意取出一個零件進(jìn)行質(zhì)量檢驗后,再把它放回箱子。2、抽簽法和隨機(jī)數(shù)法(1)、抽簽法的定義。一般地,抽簽法就是把總體中的N個個體編號,把號碼寫在號簽上,將號簽放在一個容器中,攪拌均勻后,每次從中抽取一個號簽,連續(xù)抽取

2、n次,就得到一個容量為n的樣本。抽簽法的一般步驟:a、將總體的個體編號。b、連續(xù)抽簽獲取樣本號碼。(2)隨機(jī)數(shù)表法:利用隨機(jī)數(shù)表、隨機(jī)數(shù)骰子或計算機(jī)產(chǎn)生的隨機(jī)數(shù)進(jìn)行抽樣,叫隨機(jī)數(shù)表法注:隨機(jī)數(shù)表法的步驟:a、將總體的個體編號。b、在隨機(jī)數(shù)表中選擇開始數(shù)字。c、讀數(shù)獲取樣本號碼。典例精析例1:人們打橋牌時,將洗好的撲克牌隨機(jī)確定一張為起始牌,這時按次序搬牌時,對任何一家來說,都是從52張牌中抽取13張牌,問這種抽樣方法是否是簡單隨機(jī)抽樣?分析: 簡單隨機(jī)抽樣的實質(zhì)是逐個地從總體中隨機(jī)抽取樣本,而這里只是隨機(jī)確定了起始張,其他各張牌雖然是逐張起牌,但是各張在誰手里已被確定,所以不是簡單隨機(jī)抽樣。例

3、2:某車間工人加工一種軸100件,為了了解這種軸的直徑,要從中抽取10件軸在同一條件下測量,如何采用簡單隨機(jī)抽樣的方法抽取樣本?分析: 簡單隨機(jī)抽樣一般采用兩種方法:抽簽法和隨機(jī)數(shù)表法。解法1:(抽簽法)將100件軸編號為1,2,100,并做好大小、形狀相同的號簽,分別寫上這100個數(shù),將這些號簽放在一起,進(jìn)行均勻攪拌,接著連續(xù)抽取10個號簽,然后測量這個10個號簽對應(yīng)的軸的直徑。解法2:(隨機(jī)數(shù)表法)將100件軸編號為00,01,99,在隨機(jī)數(shù)表中選定一個起始位置,如取第21行第1個數(shù)開始,選取10個為68,34,30,13,70,55,74,77,40,44,這10件即為所要抽取的樣本。課

4、時小結(jié)1、簡單隨機(jī)抽樣是一種最簡單、最基本的抽樣方法,簡單隨機(jī)抽樣有兩種選取個體的方法:放回和不放回,我們在抽樣調(diào)查中用的是不放回抽樣,常用的簡單隨機(jī)抽樣方法有抽簽法和隨機(jī)數(shù)法。2、抽簽法的優(yōu)點是簡單易行,缺點是當(dāng)總體的容量非常大時,費時、費力,又不方便,如果標(biāo)號的簽攪拌得不均勻,會導(dǎo)致抽樣不公平,隨機(jī)數(shù)表法的優(yōu)點與抽簽法相同,缺點上當(dāng)總體容量較大時,仍然不是很方便,但是比抽簽法公平,因此這兩種方法只適合總體容量較少的抽樣類型。2.1.1、系統(tǒng)抽樣的定義:一般地,要從容量為N的總體中抽取容量為n的樣本,可將總體分成均衡的若干部分,然后按照預(yù)先制定的規(guī)則,從每一部分抽取一個個體,得到所需要的樣本

5、,這種抽樣的方法叫做系統(tǒng)抽樣。注意:系統(tǒng)抽樣的特證:(1)當(dāng)總體容量N較大時,采用系統(tǒng)抽樣。(2)將總體分成均衡的若干部分指的是將總體分段,分段的間隔要求相等,因此,系統(tǒng)抽樣又稱等距抽樣,這時間隔一般為k.(3)預(yù)先制定的規(guī)則指的是:在第1段內(nèi)采用簡單隨機(jī)抽樣確定一個起始編號,在此編號的基礎(chǔ)上加上分段間隔的整倍數(shù)即為抽樣編號。2、系統(tǒng)抽樣的一般步驟。(1)采用隨機(jī)抽樣的方法將總體中的N個個編號。(2)將整體按編號進(jìn)行分段,確定分段間隔k(kN,Lk).(3)在第一段用簡單隨機(jī)抽樣確定起始個體的編號L(LN,Lk)。(4)按照一定的規(guī)則抽取樣本,通常是將起始編號L加上間隔k得到第2個個體編號L+

6、K,再加上K得到第3個個體編號L+2K,這樣繼續(xù)下去,直到獲取整個樣本。典例精析: 例1、某校高中三年級的295名學(xué)生已經(jīng)編號為1,2,295,為了了解學(xué)生的學(xué)習(xí)情況,要按1:5的比例抽取一個樣本,用系統(tǒng)抽樣的方法進(jìn)行抽取,并寫出過程。分析:按1:5分段,每段5人,共分59段,每段抽取一人,關(guān)鍵是確定第1段的編號。解:按照1:5的比例,應(yīng)該抽取的樣本容量為295÷5=59,我們把259名同學(xué)分成59組,每組5人,第一組是編號為15的5名學(xué)生,第2組是編號為610的5名學(xué)生,依次下去,59組是編號為291295的5名學(xué)生。采用簡單隨機(jī)抽樣的方法,從第一組5名學(xué)生中抽出一名學(xué)生,不妨設(shè)編

7、號為k(1k5),那么抽取的學(xué)生編號為k+5L(L=0,1,2,,58),得到59個個體作為樣本,如當(dāng)k=3時的樣本編號為3,8,13,288,293。例2、從憶編號為150的50枚最新研制的某種型號的導(dǎo)彈中隨機(jī)抽取5枚來進(jìn)行發(fā)射實驗,若采用每部分選取的號碼間隔一樣的系統(tǒng)抽樣方法,則所選取5枚導(dǎo)彈的編號可能是A5,10,15,20,25 B、3,13,23,33,43C1,2,3,4,5 D、2,4,6,16,32簡析:用系統(tǒng)抽樣的方法抽取至的導(dǎo)彈編號應(yīng)該k,k+d,k+2d,k+3d,k+4d,其中d=50/5=10,k是1到10中用簡單隨機(jī)抽樣方法得到的數(shù),因此只有選項B滿足要求,故選B。

8、課堂檢測:1、從2005個編號中抽取20個號碼入樣,采用系統(tǒng)抽樣的方法,則抽樣的間隔為 ( )A99 B、99,5C100 D、100,52、從學(xué)號為050的高一某班50名學(xué)生中隨機(jī)選取5名同學(xué)參加數(shù)學(xué)測試,采用系統(tǒng)抽樣的方法,則所選5名學(xué)生的學(xué)號可能是 ( )A1,2,3,4,5 B、5,16,27,38,49C2, 4, 6, 8, 10 D、4,13,22,31,402.1.2、分層抽樣1分層抽樣的定義一般地,在抽樣時,將總體分成互不交叉的層,然后按照一定的比例,從各層獨立地抽取一定數(shù)量的個體,將各層取出的個體合在一起作為樣本,這種抽樣的方法叫分層抽樣。2、分層抽樣的步驟:(1)分層:按

9、某種特征將總體分成若干部分。(2)按比例確定每層抽取個體的個數(shù)。(3)各層分別按簡單隨機(jī)抽樣的方法抽取。(4)綜合每層抽樣,組成樣本。3、 簡單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣的比較類 別共同點各自特點聯(lián) 系適 用范 圍簡 單隨 機(jī)抽 樣(1)抽樣過程中每個個體被抽到的可能性相等(2)每次抽出個體后不再將它放回,即不放回抽樣從總體中逐個抽取總體個數(shù)較少將總體均分成幾部 分,按預(yù)先制定的規(guī)則在各部分抽取在起始部分樣時采用簡隨機(jī)抽樣總體個數(shù)較多系 統(tǒng)抽 樣將總體分成幾層,分層進(jìn)行抽取分層抽樣時采用簡單隨機(jī)抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成分 層抽 樣典例精析例1、分層抽樣又稱類型抽樣,即將相似的

10、個體歸入一類(層),然后每層抽取若干個體成樣本,所以分層抽樣為保證每個個體等可能入樣,必須進(jìn)行( ) A、每層等可能抽樣B、每層不等可能抽樣C、所有層按同一抽樣比等可能抽樣簡析:保證每個個體等可能入樣是簡單隨機(jī)抽樣、系統(tǒng)抽樣、分層抽樣共同的特征,為了保證這一點,分層時用同一抽樣比是必不可少的,故此選C。例2、如果采用分層抽樣,從個體數(shù)為N的總體中抽取一個容量為n的樣本,那么每個個體被抽到的可能性為 ( )A B. C. D.簡析:根據(jù)每個個體都等可能入樣,所以其可能性本容量與總體容量比,故此題選C。例3、某高中共有900人,其中高一年級300人,高二年級200人,高三年級400人,現(xiàn)采用分層抽

11、樣抽取容量為45的樣本,那么高一、高二、高三各年級抽取的人數(shù)分別為A.15,5,25 B.15,15,15 C.10,5,30 D15,10,20簡析:因為300:200:400=3:2:4,于是將45分成3:2:4的三部分。設(shè)三部分各抽取的個體數(shù)分別為3x,2x,4x,由3x+2x+4x=45,得x=5,故高一、高二、高三各年級抽取的人數(shù)分別為15,10,20,故選D。課堂檢測1、某單位有老年人28人,中年人54人,青年人81人,為了調(diào)查他們的身體情況,需從他們中抽取一個容量為36的樣本,則適合的抽取方法是 ( )A簡單隨機(jī)抽樣B系統(tǒng)抽樣C分層抽樣D先從老人中剔除1人,然后再分層抽樣2、某校

12、有500名學(xué)生,其中O型血的有200人,A型血的人有125人,B型血的有125人,AB型血的有50人,為了研究血型與色弱的關(guān)系,要從中抽取一個20人的樣本,按分層抽樣,O型血應(yīng)抽取的人數(shù)為 人,A型血應(yīng)抽取的人數(shù)為 人,B型血應(yīng)抽取的人數(shù)為 人,AB型血應(yīng)抽取的人數(shù)為 人。3、某中學(xué)高一年級有學(xué)生600人,高二年級有學(xué)生450人,高三年級有學(xué)生750人,每個學(xué)生被抽到的可能性均為0.2,若該校取一個容量為n的樣本,則n= 。22用樣本估計總體1、頻率分布的概念:頻率分布是指一個樣本數(shù)據(jù)在各個小范圍內(nèi)所占比例的大小。一般用頻率分布直方圖反映樣本的頻率分布。其一般步驟為:(1) 計算一組數(shù)據(jù)中最大

13、值與最小值的差,即求極差(2) 決定組距與組數(shù)(3) 將數(shù)據(jù)分組(4) 列頻率分布表(5) 畫頻率分布直方圖頻率分布直方圖的特征:(1)、從頻率分布直方圖可以清楚的看出數(shù)據(jù)分布的總體趨勢。(2)、從頻率分布直方圖得不出原始的數(shù)據(jù)內(nèi)容,把數(shù)據(jù)表示成直方圖后,原有的具體數(shù)據(jù)信息就被抹掉了。2、頻率分布折線圖、總體密度曲線頻率分布折線圖:連接頻率分布直方圖中各小長方形上端的中點,就得到頻率分布折線圖??傮w密度曲線:在樣本頻率分布直方圖中,相應(yīng)的頻率折線圖會越來越接近于一條光滑曲線,統(tǒng)計中稱這條光滑曲線為總體密度曲線。它能夠精確地反映了總體在各個范圍內(nèi)取值的百分比,它能給我們提供更加精細(xì)的信息。3、莖

14、葉圖()莖葉圖的概念:當(dāng)數(shù)據(jù)是兩位有效數(shù)字時,用中間的數(shù)字表示十位數(shù),即第一個有效數(shù)字,兩邊的數(shù)字表示個位數(shù),即第二個有效數(shù)字,它的中間部分像植物的莖,兩邊部分像植物莖上長出來的葉子,因此通常把這樣的圖叫做莖葉圖。(見課本P6例子)(2)莖葉圖的特征:a、用莖葉圖表示數(shù)據(jù)有兩個優(yōu)點:一是從統(tǒng)計圖上沒有原始數(shù)據(jù)信息的損失,所有數(shù)據(jù)信息都可以從莖葉圖中得到;二是莖葉圖中的數(shù)據(jù)可以隨時記錄,隨時添加,方便記錄與表示。b、莖葉圖只便于表示兩位有效數(shù)字的數(shù)據(jù),而且莖葉圖只方便記錄兩組的數(shù)據(jù),兩個以上的數(shù)據(jù)雖然能夠記錄,但是沒有表示兩個記錄那么直觀,清晰。典例精析例1:下表給出了某校500名12歲男孩中用

15、隨機(jī)抽樣得出的120人的身高(單位) (1)列出樣本頻率分布表(2)一畫出頻率分布直方圖;(3)估計身高小于134的人數(shù)占總?cè)藬?shù)的百分比.。分析:根據(jù)樣本頻率分布表、頻率分布直方圖的一般步驟解題。解:()樣本頻率分布表如下:122126130134138142146150158154身高(cm)o0.010.020.030.040.050.060.07頻率/組距()其頻率分布直方圖如下:(3)由樣本頻率分布表可知身高小于134cm 的男孩出現(xiàn)的頻率為0.04+0.07+0.08=0.19,所以我們估計身高小于134cm的人數(shù)占總?cè)藬?shù)的19%.90100110120130140150次數(shù)o0.0

16、040.0080.0120.0160.0200.0240.028頻率/組距0.0320.036例2:為了了解高一學(xué)生的體能情況,某校抽取部分學(xué)生進(jìn)行一分鐘跳繩次數(shù)次測試,將所得數(shù)據(jù)整理后,畫出頻率分布直方圖(如圖),圖中從左到右各小長方形面積之比為2:4:17:15:9:3,第二小組頻數(shù)為12.(1) 第二小組的頻率是多少?樣本容量是多少?(2) 若次數(shù)在110以上(含110次)為達(dá)標(biāo),試估計該學(xué)校全體高一學(xué)生的達(dá)標(biāo)率是多少?(3) 在這次測試中,學(xué)生跳繩次數(shù)的中位數(shù)落在哪個小組內(nèi)?請說明理由。分析:在頻率分布直方圖中,各小長方形的面積等于相應(yīng)各組的頻率,小長方形的高與頻數(shù)成正比,各組頻數(shù)之和

17、等于樣本容量,頻率之和等于1。解:(1)由于頻率分布直方圖以面積的形式反映了數(shù)據(jù)落在各小組內(nèi)的頻率大小,因此第二小組的頻率為:又因為 頻率=所以 (2)由圖可估計該學(xué)校高一學(xué)生的達(dá)標(biāo)率約為(3)由已知可得各小組的頻數(shù)依次為6,12,51,45,27,9,所以前三組的頻數(shù)之和為69,前四組的頻數(shù)之和為114,所以跳繩次數(shù)的中位數(shù)落在第四小組內(nèi)。2.2.2樣本數(shù)字特征1、本均值:2、樣本標(biāo)準(zhǔn)差:3用樣本估計總體時,如果抽樣的方法比較合理,那么樣本可以反映總體的信息,但從樣本得到的信息會有偏差。在隨機(jī)抽樣中,這種偏差是不可避免的。雖然我們用樣本數(shù)據(jù)得到的分布、均值和標(biāo)準(zhǔn)差并不是總體的真正的分布、均值

18、和標(biāo)準(zhǔn)差,而只是一個估計,但這種估計是合理的,特別是當(dāng)樣本量很大時,它們確實反映了總體的信息。4(1)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)都加上或減去同一個共同的常數(shù),標(biāo)準(zhǔn)差不變.(2)如果把一組數(shù)據(jù)中的每一個數(shù)據(jù)乘以一個共同的常數(shù)k,標(biāo)準(zhǔn)差變?yōu)樵瓉淼膋倍.(3)一組數(shù)據(jù)中的最大值和最小值對標(biāo)準(zhǔn)差的影響,區(qū)間的應(yīng)用;“去掉一個最高分,去掉一個最低分”中的科學(xué)道理.例1 為了解A,B兩種輪胎的性能,某汽車制造廠分別從這兩種輪胎中隨機(jī)抽取了8個進(jìn)行測試,下面列出了每一個輪胎行駛的最遠(yuǎn)里程數(shù)(單位:1 000 km)輪胎A96,112,97,108,100,103,86,98輪胎B108,101,94,10

19、5,96,93,97,106(1)分別計算A,B兩種輪胎行駛的最遠(yuǎn)里程的平均數(shù),中位數(shù);(2)分別計算A,B兩種輪胎行駛的最遠(yuǎn)里程的極差、標(biāo)準(zhǔn)差;(3)根據(jù)以上數(shù)據(jù)你認(rèn)為哪種型號的輪胎性能更加穩(wěn)定?解 (1)A輪胎行駛的最遠(yuǎn)里程的平均數(shù)為:=100,中位數(shù)為: =99;B輪胎行駛的最遠(yuǎn)里程的平均數(shù)為:=100,中位數(shù)為:=99.(2)A輪胎行駛的最遠(yuǎn)里程的極差為:112-86=26,標(biāo)準(zhǔn)差為:s=7.43;B輪胎行駛的最遠(yuǎn)里程的極差為:108-93=15,標(biāo)準(zhǔn)差為:s= =5.43.(3)由于A和B的最遠(yuǎn)行駛里程的平均數(shù)相同,而B輪胎行駛的最遠(yuǎn)里程的極差和標(biāo)準(zhǔn)差較小,所以B輪胎性能更加穩(wěn)定.例

20、2(14分)某化肥廠甲、乙兩個車間包裝肥料,在自動包裝傳送帶上每隔30 min抽取一包產(chǎn)品,稱其重量,分別記錄抽查數(shù)據(jù)如下:甲:102,101,99,98,103,98,99;乙:110,115,90,85,75,115,110.(1)這種抽樣方法是哪一種?(2)將這兩組數(shù)據(jù)用莖葉圖表示;(3)將兩組數(shù)據(jù)比較,說明哪個車間產(chǎn)品較穩(wěn)定.解 (1)因為間隔時間相同,故是系統(tǒng)抽樣.(2)莖葉圖如下:(3)甲車間:平均值:=(102+101+99+98+103+98+99)=100,方差:s12=(102-100)2+(101-100)2+(99-100)23.428 6.乙車間:平均值:=(110+

21、115+90+85+75+115+110)=100,方差:s22=(110-100)2+(115-100)2+(110-100)2228.571 4.=,s12s22,甲車間產(chǎn)品穩(wěn)定.2.3兩個變量的線性相關(guān)1、概念: (1)回歸直線方程 (2)回歸系數(shù)2最小二乘法3直線回歸方程的應(yīng)用 (1)描述兩變量之間的依存關(guān)系;利用直線回歸方程即可定量描述兩個變量間依存的數(shù)量關(guān)系 (2)利用回歸方程進(jìn)行預(yù)測;把預(yù)報因子(即自變量x)代入回歸方程對預(yù)報量(即因變量Y)進(jìn)行估計,即可得到個體Y值的容許區(qū)間。 (3)利用回歸方程進(jìn)行統(tǒng)計控制規(guī)定Y值的變化,通過控制x的范圍來實現(xiàn)統(tǒng)計控制的目標(biāo)。如已經(jīng)得到了空氣中NO2的濃度和汽車流量間的回歸方程,即可通過控制汽車流量來控制空

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論