簡單隨機(jī)抽樣與系統(tǒng)抽樣_第1頁
簡單隨機(jī)抽樣與系統(tǒng)抽樣_第2頁
簡單隨機(jī)抽樣與系統(tǒng)抽樣_第3頁
簡單隨機(jī)抽樣與系統(tǒng)抽樣_第4頁
簡單隨機(jī)抽樣與系統(tǒng)抽樣_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

簡單隨機(jī)抽樣與系統(tǒng)抽樣第1頁,共45頁,2023年,2月20日,星期三我國土地沙漠化問題非常嚴(yán)重,全國沙漠化土地面積已超過174000平方公里,并以每年3400平方公里的速度擴(kuò)張。你知道這些數(shù)據(jù)是怎么來的嗎?通過調(diào)查獲得的。怎么調(diào)查?是對考察對象進(jìn)行全面調(diào)查還是抽樣調(diào)查?第2頁,共45頁,2023年,2月20日,星期三媽媽:“兒子,幫媽媽買盒火柴去?!眿寢?“這次注意點(diǎn),上次你買的火柴好多劃不著?!薄瓋鹤痈吲d地跑回來。孩子:“媽媽,這次的火柴全劃得著,我每根都試過了?!毙^之后,談?wù)勀愕目捶ㄟ@個調(diào)查具有破壞性,不可能每根試過,不能展開全面調(diào)查。看一看第3頁,共45頁,2023年,2月20日,星期三

例如,為了了解一批計算器的壽命,我們能將它們逐一測試嗎?很明顯,這既不可能也沒必要。實踐中,由于所考察的總體中的個體數(shù)往往很多,而且許多考察帶有破壞性,因此,我們通常只考察總體中的一個樣本,通過樣本來了解總體的情況。提出問題進(jìn)一步,從節(jié)約費(fèi)用的角度考慮,在保證樣本估計總體達(dá)到一定的精度的前提下,樣本中包含的個體數(shù)越少越好。第4頁,共45頁,2023年,2月20日,星期三要了解全國高中生的視力情況,在全國抽取了這15所中學(xué)的全部高中生15000人進(jìn)行視力測試??疾鞂ο笫鞘裁?在統(tǒng)計中,我們把所要考察的對象的全體叫做總體全國每位高中學(xué)生的視力情況。把組成總體的每一個考察的對象叫做個體這15000名學(xué)生的視力情況又組成一個集體從總體中取出的一部分個體的集體叫做這個總體的一個樣本。15000樣本中的個體的數(shù)目叫做樣本的容量。第5頁,共45頁,2023年,2月20日,星期三閱讀一個著名的案例

在抽樣調(diào)查中,樣本的選擇是至關(guān)重要的,樣本能否代表總體,直接影響著統(tǒng)計結(jié)果的可靠性。下面的故事是一次著名的失敗的統(tǒng)計調(diào)查,被稱為抽樣中的泰坦尼克事件。它可以幫助我們理解為什么一個好的樣本如此重要。在1936年美國總統(tǒng)選舉前,一份頗有名氣的雜志的工作人員做了一次民意調(diào)查。調(diào)查蘭頓(當(dāng)時任堪薩斯州州長)和羅斯福(當(dāng)時的總統(tǒng))中誰將當(dāng)選下一屆總統(tǒng)。為了了解公眾意向,調(diào)查者通過電話簿和車輛登記簿上的名單給一大批人發(fā)了調(diào)查表(注意在1936年電話和汽車只有少數(shù)富人擁有)。通過分析收回的調(diào)查表,顯示蘭頓非常受歡迎,于是雜志預(yù)測蘭頓將在選舉中獲勝。實際上選舉結(jié)果正好相反,最后羅斯福在選舉中獲勝,其數(shù)據(jù)如下:候選人預(yù)測結(jié)果選舉結(jié)果羅斯福4362蘭頓5738第6頁,共45頁,2023年,2月20日,星期三?思考你認(rèn)為預(yù)期結(jié)果出錯的原因是什么?原因是:用于統(tǒng)計推斷的樣本來自少數(shù)富人,只能代表富人的觀點(diǎn),不能代表全體選民的觀點(diǎn)(樣本不具有代表性)。像本例中這樣容易得到的樣本稱為方便樣本。如果使用“方便樣本”,那么得出與事實不符的結(jié)論的可能性就會大大增加。結(jié)論:在抽樣時不能只圖方便。如果只從一些容易得到的個體中抽取樣本,那么所得到的樣本只是一個“方便樣本”,“方便樣本”的代表性差,基本這種方便樣本得出的結(jié)論就會與事實相左。第7頁,共45頁,2023年,2月20日,星期三

為了了解學(xué)生對學(xué)?;锸车臐M意程度,小紅訪問了50名女生;小聰訪問了50名男生;小明訪問了24名男生和24名女生,其中高一、高二和高三的男生和女生各8名。你認(rèn)為小紅、小聰、小明三人的不同抽樣方法那一種最好?為什么?學(xué)以致用答:小明的方法最好。小明抽得樣本既有男生,又有女生,而均勻分布在各年級,這樣的抽樣較具有代表性,反映的情況具有普遍意義。1.我們常常根據(jù)樣本得到結(jié)果來推測總體的結(jié)果。不同的抽樣可能得到不同的結(jié)果。2.為了使結(jié)果更具準(zhǔn)確性,抽樣時,樣本的容量要合理,樣本的個體要有代表性。抽樣才具有普遍意義溫馨提示:第8頁,共45頁,2023年,2月20日,星期三——統(tǒng)計的基本思想方法:

用樣本估計總體,即通常不直接去研究總體,而是通過從總體中抽取一個樣本,根據(jù)樣本的情況去估計總體的相應(yīng)情況.第9頁,共45頁,2023年,2月20日,星期三關(guān)于“總體和樣本”

總體通常是指我們需要考慮的對象的全體.其中每一個考察對象叫做個體.

樣本就是從總體中抽取的一個“部分”.

樣本中個體的個數(shù)叫做樣本的容量.第10頁,共45頁,2023年,2月20日,星期三要從某汽車廠生產(chǎn)的30輛汽車中隨機(jī)抽取3輛進(jìn)行測試。(2)如何抽取呢?請問:

實例一

(1)此例中總體、個體、樣本、樣本容量分別是什么?第11頁,共45頁,2023年,2月20日,星期三

一般地,設(shè)一個總體的個體數(shù)為N,如果通過逐個不放回地抽取的方法從中抽取一個樣本,且每次抽取時各個個體被抽到的概率相等,就稱這樣的抽樣為簡單隨機(jī)抽樣。(P56第三段)一、簡單隨機(jī)抽樣第12頁,共45頁,2023年,2月20日,星期三簡單隨機(jī)抽樣的特點(diǎn):(1)它要求被抽取的樣本的個數(shù)有限,這樣,便于通過隨機(jī)抽取的樣本對總體進(jìn)行分析;(2)它是從總體中逐個地進(jìn)行抽取。這樣,便于在抽樣實踐中進(jìn)行操作;(3)它是一種不放回抽樣。由于抽樣實踐中多采用不放回抽樣,使其具有較廣泛的實用性,而且由于所抽取的樣本中沒有被重復(fù)抽取的個體,便于進(jìn)行有關(guān)的分析和計算。(4)它每一次抽取時總體中的各個個體有相同的可能性被抽到,從而保證了這種抽樣方法的公平性。第13頁,共45頁,2023年,2月20日,星期三

簡單隨機(jī)抽樣是在特定總體中抽取樣本,總體中每一個體被抽取的可能性是等同的,而且任何個體之間彼此被抽取的機(jī)會是獨(dú)立的。如果用從個體數(shù)為N的總體中抽取一個容量為n的樣本,那么每個個體被抽取的可能性等于第14頁,共45頁,2023年,2月20日,星期三1、抽簽法

先將總體中的所有個體(共N個)編號(號碼可以從1到N),并把號碼寫在形狀、大小相同的號簽上(號簽可以用小球、卡片、紙條等制作),然后將這些號簽放在同一個箱子里,進(jìn)行均勻攪拌。抽簽時,每次從中抽出1個號簽,連續(xù)抽取n次,就得到一個容量為n的樣本。對個體編號時,也可以利用已有的編號。例如學(xué)生的學(xué)號,座位號等。簡記為:編號;制簽;攪勻;抽簽;取個體。第15頁,共45頁,2023年,2月20日,星期三例如:將全班同學(xué)按學(xué)號編號,制作相應(yīng)的卡片號簽,放入同一個箱子里均勻攪拌,從中抽出15個號簽,就相應(yīng)的15名學(xué)生對看足球比賽的喜愛程度(很喜愛、喜愛、一般、不喜愛、很不喜愛)進(jìn)行調(diào)查。分析并說明整個抽簽過程中每個同學(xué)被抽到的概率是相等的。簡單隨機(jī)抽樣的特點(diǎn):它是一種不放回抽樣;它是逐個地進(jìn)行抽??;它是一種等概率抽樣.它的總體個數(shù)有限的;有限性逐個性不回性等率性第16頁,共45頁,2023年,2月20日,星期三抽簽法的優(yōu)點(diǎn)和缺點(diǎn):優(yōu)點(diǎn):抽簽法能夠保證每個個體入選樣本的機(jī)會都相等(得到的樣本是簡單隨機(jī)樣本);缺點(diǎn):(1)當(dāng)總體中的個體數(shù)較多時,制作號簽的成本將會增加,使得抽簽法成本高(費(fèi)時、費(fèi)力);(2)號簽很多時,把它們“攪拌均勻”就比較困難,結(jié)果很難保證每個個體入選樣本的可能性相等,從而使產(chǎn)生壞樣本(即代表性差的樣本)的可能性增加。第17頁,共45頁,2023年,2月20日,星期三2、隨機(jī)數(shù)表法(1)隨機(jī)數(shù)表是統(tǒng)計工作者用計算機(jī)生成的隨機(jī)數(shù),并保證表中的每個位置上的數(shù)字是等可能出現(xiàn)的。(2)隨機(jī)數(shù)表并不是唯一的,因此可以任選一個數(shù)作為開始,讀數(shù)的方向可以向左,也可以向右、向上、向下等等。(3)用隨機(jī)數(shù)表進(jìn)行抽樣的步驟:將總體中個體編號;選定開始的數(shù)字;獲取樣本號碼。(4)由于隨機(jī)數(shù)表是等概率的,因此利用隨機(jī)數(shù)表抽取樣本保證了被抽取個體的概率是相等的。第18頁,共45頁,2023年,2月20日,星期三

3、從7開始往右讀(方向隨意),得到第一個三位數(shù)785<編號799,將對應(yīng)編號的牛奶取出;繼續(xù)向右讀,得到916>編號799,舍棄;如此繼續(xù)下去,直至抽出60袋牛奶。范例:要考察某公司生產(chǎn)的500克袋裝牛奶的質(zhì)量是否達(dá)標(biāo),現(xiàn)從800袋牛奶中抽取60袋進(jìn)行檢驗。1、將800袋牛奶編號,000,001,…,7992、在隨機(jī)數(shù)表(課本103頁)中任選一數(shù),例如第8行第7列,是7。能從本例體會下,從000開始編號的好處嗎?第19頁,共45頁,2023年,2月20日,星期三用隨機(jī)數(shù)表法抽取樣本的步驟:

S1將總體中的所有個體編號(每個號碼位數(shù)一致);S2在隨機(jī)數(shù)表中任選一個數(shù)作為開始;S3從選定的數(shù)開始按一定的方向讀下去,得到的號碼若不在編號中,則跳過;若在編號中,則取出。得到的號碼若在前面已經(jīng)取出,也跳過,如此進(jìn)行下去,直到取滿為止;S4根據(jù)選定的號碼抽取樣本。編號、選數(shù)、取號、抽取.第20頁,共45頁,2023年,2月20日,星期三用隨機(jī)數(shù)表法抽取樣本的優(yōu)缺點(diǎn):優(yōu)點(diǎn):簡單易行。它很好地解決了用抽簽法時,當(dāng)總體中的個體數(shù)較多時制簽難的問題。缺點(diǎn):當(dāng)總體中的個體數(shù)很多,需要的樣本容量也很大時,用隨機(jī)數(shù)表法抽取樣本仍不方便。第21頁,共45頁,2023年,2月20日,星期三例1.要從某汽車廠生產(chǎn)的30輛汽車中隨機(jī)抽取3輛進(jìn)行測試,請選擇合適的抽樣方法,寫出抽樣過程。解:本題總體容量較小,樣本容量也較小,可用抽簽法。S1將30輛汽車編號,號碼是01,02,…,30;S2將號碼分別寫在一張紙條上,揉成團(tuán),制成號簽;第22頁,共45頁,2023年,2月20日,星期三S3將得到的號簽放入一個不透明的袋子中,并充分?jǐn)噭?;S4從袋子中依次抽取3個號簽,并記錄上面的編號;S5所得號碼對應(yīng)的3輛汽車就是要抽取的對象。第23頁,共45頁,2023年,2月20日,星期三例2.從30個燈泡中抽取10個進(jìn)行質(zhì)量檢測,說明利用隨機(jī)數(shù)表法抽取這個樣本的步驟。(隨機(jī)數(shù)表見本章末第103頁附表)解:S1將30個燈泡編號:00,01,02,03,……,30;S2在隨機(jī)數(shù)表中任取一組數(shù)作為開始。如從第4行第1組的數(shù)12開始;S3從12開始向右讀,依次選出12,26,27,05,03,15,10,14,21,22這10個編號的燈泡。第24頁,共45頁,2023年,2月20日,星期三練習(xí)2.欲從本班46名學(xué)生中隨機(jī)抽取8名學(xué)生參加黨的基本知識競賽,試用隨機(jī)表法確定這8名學(xué)生.1.中央電視臺要從春節(jié)聯(lián)歡晚會的60名熱心觀眾中隨機(jī)抽出4名幸運(yùn)觀眾,試用抽簽法為其設(shè)計產(chǎn)生這4名幸運(yùn)觀眾的過程.評點(diǎn):抽簽法—編號、制簽、攪拌、抽取,關(guān)鍵是“攪拌”后的隨機(jī)性;隨機(jī)數(shù)表法—編號、選數(shù)、取號、抽取,其中取號位置與方向具有任意性.第25頁,共45頁,2023年,2月20日,星期三練習(xí)3、下列抽取樣本的方式是屬于簡單隨機(jī)抽樣的是()①從無限多個個體中抽取100個個體作樣本;②盒子里有80個零件,從中選出5個零件進(jìn)行質(zhì)量檢驗,在抽樣操作時,從中任意拿出一個零件進(jìn)行質(zhì)量檢驗后,再把它放回盒子里;③從8臺電腦中不放回的隨機(jī)抽取2臺進(jìn)行質(zhì)量檢驗(假設(shè)8臺電腦已編好號,對編號隨機(jī)抽取)A.①B.②C.③D.以上都不對C第26頁,共45頁,2023年,2月20日,星期三知識探究(一)某學(xué)校為了了解高一年級學(xué)生對老師教學(xué)的意見,教務(wù)處打算從年級500名學(xué)生中抽取50名進(jìn)行問卷調(diào)查,除了用簡單隨機(jī)抽樣獲取樣本外,你能否設(shè)計其他抽樣方法?思考1:你能用簡單隨機(jī)抽樣對上述問題進(jìn)行抽樣嗎?具體如何操作?

第27頁,共45頁,2023年,2月20日,星期三第二步,將總體平均分成50部分,每一部分含10個個體.第四步,從該號碼起,每隔10個號碼取一個號碼,就得到一個容量為50的樣本.(如8,18,28,…,498)第三步,在第1部分中用簡單隨機(jī)抽樣抽取一個號碼(如8號).第一步,將這500件產(chǎn)品編號為1,2,3,…,500.系統(tǒng)抽樣第28頁,共45頁,2023年,2月20日,星期三思考2:上述抽樣方法稱為系統(tǒng)抽樣,一般地,怎樣理解系統(tǒng)抽樣的含義?

系統(tǒng)抽樣:當(dāng)總體的個體數(shù)較多時,采用簡單隨機(jī)抽樣太麻煩,這時將總體平均分成幾個部分,然后按照預(yù)先定出的規(guī)則,從每個部分中抽取一個個體,得到所需的樣本,這樣的抽樣方法稱為系統(tǒng)抽樣(等距抽樣)。第29頁,共45頁,2023年,2月20日,星期三系統(tǒng)抽樣的特點(diǎn):(1)用系統(tǒng)抽樣抽取樣本時,每個個體被抽到的可能性是相等的,(2)系統(tǒng)抽樣適用于總體中個體數(shù)較多,抽取樣本容量也較大時;(3)系統(tǒng)抽樣是不放回抽樣。個體被抽取的概率等于第30頁,共45頁,2023年,2月20日,星期三知識探究(二):系統(tǒng)抽樣的操作步驟

思考1:用系統(tǒng)抽樣從總體中抽取樣本時,首先要做的工作是什么?將總體中的所有個體編號.思考2:如果用系統(tǒng)抽樣從505位同學(xué)中抽取50位進(jìn)行調(diào)查,由于505不能均衡分成50部分,對此應(yīng)如何處理?

先從總體中隨機(jī)剔除5個個體,再均衡分成50部分.第31頁,共45頁,2023年,2月20日,星期三思考3:用系統(tǒng)抽樣從含有N個個體的總體中抽取一個容量為n的樣本,要平均分成多少段?思考4:如果N不能被n整除怎么辦?

從總體中隨機(jī)剔除N除以n的余數(shù)個個體后再分段.第32頁,共45頁,2023年,2月20日,星期三思考5:將含有N個個體的總體平均分成n段,每段的號碼個數(shù)稱為分段間隔,那么分段間隔k的值如何確定?總體中的個體數(shù)N除以樣本容量n所得的商.第33頁,共45頁,2023年,2月20日,星期三

用簡單隨機(jī)抽樣抽取第1段的個體編號.在抽取第1段的號碼之前,自定義規(guī)則確定以后各段的個體編號,通常是將第1段抽取的號碼依次累加間隔k.思考6:用系統(tǒng)抽樣抽取樣本時,每段各取一個號碼,其中第1段的個體編號怎樣抽???以后各段的個體編號怎樣抽???第34頁,共45頁,2023年,2月20日,星期三思考7:一般地,用系統(tǒng)抽樣從含有N個個體的總體中抽取一個容量為n的樣本,其操作步驟如何?第35頁,共45頁,2023年,2月20日,星期三系統(tǒng)抽樣的步驟:(1)采用隨機(jī)的方式將總體中的個體編號;(2)將整個的編號按一定的間隔(設(shè)為K)分段,當(dāng)

(N為總體中的個體數(shù),n為樣本容量)是整數(shù)時,;當(dāng)不是整數(shù)時,從總體中剔除一些個體,使剩下的總體中個體的個數(shù)能被n整除,這時,,并將剩下的總體重新編號;(3)在第一段中用簡單隨機(jī)抽樣確定起始的個體編號

;(4)將編號為的個體抽出。簡記為:編號;分段;在第一段確定起始號;加間隔獲取樣本。第36頁,共45頁,2023年,2月20日,星期三理論遷移

例3、

某中學(xué)有高一學(xué)生322名,為了了解學(xué)生的身體狀況,要抽取一個容量為40的樣本,用系統(tǒng)抽樣法如何抽樣?第37頁,共45頁,2023年,2月20日,星期三第一步,隨機(jī)剔除2名學(xué)生,把余下的320名學(xué)生編號為1,2,3,…320.第四步,從該號碼起,每間隔8個號碼抽取1個號碼,就可得到一個容量為40的樣本.第三步,在第1部分用抽簽法確定起始編號.

第二步,把總體分成40個部分,每個部分有8個個體.

第38頁,共45頁,2023年,2月20日,星期三2、采用系統(tǒng)抽樣的方法,從個體數(shù)為1003的總體中抽取一個容量50的樣本,則在抽樣過程中,被剔除的個體數(shù)為(),抽樣間隔為()。320練習(xí):1、某工廠生產(chǎn)產(chǎn)品,用傳送帶將產(chǎn)品送放下一道工序,質(zhì)檢人員每隔十分鐘在傳送帶的某一個位置取一件檢驗,則這種抽樣方法是()。A.抽簽法B.隨機(jī)數(shù)表法C.系統(tǒng)抽樣D.其他C第39頁,共45頁,2023年,2月20日,星期三3、為了解1200名學(xué)生對學(xué)校某項教改試驗的意見,打算從中抽取一個容量為30的樣本,考慮采用系統(tǒng)抽樣,則分段的間隔k為()A、40 B、30 C、20 D、124、為了了解參加一次知識競賽的1252名學(xué)生的成績,決定采用系統(tǒng)抽樣的方法抽取一個容量為50的樣本,那么總體中應(yīng)隨機(jī)剔除的個體數(shù)目()A、2 B、4 C、5 D、6

AA

第40頁,共45頁,2023年,2月20日,星期三5、用系統(tǒng)抽樣的方法從個體數(shù)為1003的總體中抽取一個容量為50的樣本,在整個抽樣過程中每個個體被抽到的可能性為()A、1/1000 B、1/1003 C、50/1003 D、50/10006、從已編號為1-50的50枚最新研制的某種型號的導(dǎo)彈中隨機(jī)抽取5枚來進(jìn)行發(fā)射實驗,若采用每部分選取的號碼間隔一樣的系統(tǒng)抽樣方法,則所選取5枚導(dǎo)彈的編號可能為()A、5,10,15,20,25 B、3,13,23,33,43C、1,2,3,4,5 D、2,4,6,16,32

C

B

第41頁,共45頁,2023年,2月20日,星期三7、※(2004年福建省高考卷)一個總體中有100個個體,隨機(jī)編號為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論