




已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
從大小為N的總體抽取樣本量為n的樣本,若全部可能的樣本被抽中的概率都相等,則稱這樣的抽樣為簡單隨機(jī)抽樣。,第三章簡單隨機(jī)抽樣,1簡單隨機(jī)抽樣及實(shí)施方法,簡單隨機(jī)抽樣就是從裝有N張票子的盒子里隨機(jī)無放回地摸取n張票子,它可以有兩種摸取方法:,(1)從盒子中一次摸取n張票。這樣摸取共有種可能性,每種可能的概率為。抽到的樣本稱為簡單隨機(jī)樣本。,(2)從盒子中隨機(jī)摸取1張票,相應(yīng)該票的單元入樣后,票并不放回盒子,從余下的票中再隨機(jī)摸取1張票,相應(yīng)此票的單元也入樣且票也不返回盒子;依此實(shí)施,直到第n個(gè)樣本入樣。,這兩種方法都使用了隨機(jī)的方法,而且樣本并不重復(fù),那么這兩種方法是否都算是簡單隨機(jī)抽樣呢?要檢驗(yàn)一下這兩種方法中每一單元的入樣概率是否相等。只要驗(yàn)證第二種方法中總體的每n個(gè)單元一組的樣本入樣的可能性等于第一種方法中的即可。,利用條件概率即可得到驗(yàn)證。,也就是說,兩種操作方法是等價(jià)的。都是簡單隨機(jī)抽樣但由于N、n一般都很大,第二種操作方案較方便?,F(xiàn)在介紹一下具體實(shí)施簡單隨機(jī)抽樣的做法:,首先將N個(gè)總體元素編號為:1,2,N,每一單元對應(yīng)一個(gè)號碼,若抽到某號,則相應(yīng)單元入樣。,(1)抽簽法:實(shí)際上就是一個(gè)盒子模型,將編號為1N的N個(gè)形狀與質(zhì)地完全相同的紙簽放在盒子里,用上述兩種方法之一從盒子中摸出n張簽。,(2)隨機(jī)數(shù)法:設(shè)想N相當(dāng)大,你會做那么多的簽放在盒子里以供抽取嗎?隨機(jī)數(shù)法用來解決這個(gè)困難。利用隨機(jī)數(shù)表、隨機(jī)數(shù)骰子或計(jì)算機(jī)可以獲得隨機(jī)數(shù)。,隨機(jī)數(shù)表:本書最后附有隨機(jī)數(shù)表,它應(yīng)當(dāng)被看成09數(shù)字隨機(jī)地橫豎排列,我們可以隨機(jī)地從某行某列的數(shù)字開始如果需要一至二位數(shù)字,則從該數(shù)字開始從左向右接連地截取,該行不夠則換下一行開始;如果需要三位或三位以上數(shù)字,則從開頭數(shù)字開始向右取三位或三位以上的數(shù)從該數(shù)縱向往下接連獲取其它隨機(jī)數(shù),不夠可另換列執(zhí)行,直到取到我們所需要的個(gè)數(shù)n,當(dāng)然這中間應(yīng)該去掉可能發(fā)生重復(fù)的數(shù)以及超出N的數(shù)字。,利用計(jì)算機(jī)產(chǎn)生隨機(jī)數(shù):不少現(xiàn)成的統(tǒng)計(jì)軟件都可提供此類服務(wù)。但必須指出,這樣產(chǎn)生的隨機(jī)數(shù)一般不能保證其隨機(jī)性,稱為“偽隨機(jī)數(shù)”。因此,提倡前述方法產(chǎn)生隨機(jī)數(shù)。,隨機(jī)數(shù)骰子:隨機(jī)數(shù)骰子是由均質(zhì)材料制成的正二十面體面上標(biāo)有09數(shù)字各兩個(gè)。通常用36個(gè)隨機(jī)骰子,視所需要的隨機(jī)數(shù)的位數(shù)而定。骰子用不同的顏色染成可事先規(guī)定好哪種顏色的骰子產(chǎn)生個(gè)位數(shù),哪種顏色的骰子產(chǎn)生十位數(shù),依次下去。將所需骰子在盒內(nèi)搖勻等穩(wěn)定后揭蓋讀取朝上面的數(shù)字,即獲取一組隨機(jī)數(shù)。所搖的骰子數(shù)m通常取決于總體單元個(gè)數(shù)N,滿足。記m個(gè)骰子按約定顏色而確定的順序讀得隨機(jī)數(shù),若,則此即為一次合格的隨機(jī)數(shù);否則予以放棄,重新?lián)u取,直到取到n個(gè)合格的隨機(jī)數(shù)為止。,2總體平均數(shù)與總和的估計(jì),設(shè)總體元素為,為來自該總體的簡單隨機(jī)樣本,有時(shí)也記樣本為為中的某個(gè)組合。在后者的表示中隨機(jī)性體現(xiàn)在下標(biāo)上。樣本是總體的一個(gè)有代表性的剖面。,總體平均數(shù)的估計(jì)為:,總體總和的估計(jì)自然為:,由于這兩個(gè)估計(jì)之間僅差一個(gè)常數(shù)因子N,因而只要重點(diǎn)研究的估計(jì)量的若干性質(zhì)即可。是樣本平均數(shù),由于樣本的隨機(jī)性,樣本平均值也是隨機(jī)變量,理論上的平均值,即數(shù)學(xué)期望為:,其中表示對中所有組合求和,對于中的每個(gè)元素,比如,它與其它元素構(gòu)成樣本的可能次數(shù)顯然為,因此,乃至在中出現(xiàn)的次數(shù)均為,于是,即是的無偏估計(jì)。同樣也是總體總量的無偏估計(jì),例3.1某班第一小組10人的數(shù)學(xué)考試成績分別為:100,95,92,88,83,75,71,62,60,50平均分為77.6。先從中任選3個(gè)為一組樣本,其選法共有120種每種選法都有概率1/120。以4組樣本為例(100,95,92),(100,83,50),(88,83,62),(62,60,50)它們的樣本平均數(shù)分別為95.67,77.67,77.67,57.33。,從抽樣調(diào)查的角度來看,我們希望抽到第二或第三組樣本,根據(jù)它們來估計(jì)總體平均數(shù)相當(dāng)準(zhǔn)確。而第一和第四組樣本的估計(jì)相當(dāng)糟糕。但它們?nèi)霕优c第二第三組具有同樣的可能性,這是否與的無偏性相矛盾呢?,其實(shí)并不相矛盾。我們關(guān)心的是,盡管每一組樣本入樣的概率相同,像第二第三組這樣的“良好”情況就大體而言是否會多于像第一第四那樣的“糟糕”情況呢?如果肯定的話,那么就能指望在一次隨機(jī)抽樣中發(fā)生的估計(jì)誤差較小。該問題的解決將由下一節(jié)的討論給出。,3估計(jì)量的方差及其估計(jì),下面求的無偏估計(jì)的方差,其中表示對中所有組合求和,(或),(3.6),對隨機(jī)有放回抽樣,由于各次抽取是相互獨(dú)立的,由概率論的知識可以求得,此時(shí):,(或),(3.7),比較(3.6)式與(3.7)式,發(fā)現(xiàn)同樣用樣本平均數(shù)來估計(jì)總體平均數(shù),它們都是無偏估計(jì),但隨機(jī)無放回時(shí)的方差小于隨機(jī)有放回時(shí)的方差。的方差表示新盒子的離散程度,也就是表示了取值范圍的大小,方差小表明取值遠(yuǎn)離中心的可能性較小,這樣隨機(jī)的一組樣本得到的實(shí)現(xiàn)值距很近的可能性就較大,這正是我們所期望的。因此,在實(shí)際抽樣中我們采用無放回抽樣方式。,(3.6)式中的因子(Nn)/(N1),稱為隨機(jī)無放回的校正系數(shù),它是對隨機(jī)有放回情況的校正。,如果N相當(dāng)?shù)拇?,則總體可視為無限總體,由(3.7)式,,即為的方差,這是無限總體情況樣本平均數(shù)的方差。,而有限總體的的方差為:,因此稱1f為有限總體校正系數(shù),其中f=n/N,稱為抽樣比,抽樣比就是樣本所占總體的比例。f越大,越接近1,則樣本越接近總體,與的隨機(jī)誤差就越??;當(dāng)f=1時(shí),抽樣變成全面普查,此時(shí)誤差消失。,一般情況下f比較小,由于N是固定的,也就意味著n相當(dāng)小,此時(shí)(3.6)式告訴我們的方差將隨著n的減少而增大,此時(shí)1f在1附近,對的影響不大。事實(shí)上,抽取樣本越少,抽樣誤差越大。,當(dāng)然,影響的方差的另一個(gè)重要因素是或。設(shè)想,當(dāng)相當(dāng)大時(shí),原盒子中的數(shù)據(jù)相當(dāng)?shù)胤稚?,從一個(gè)很分散的盒子中隨機(jī)取一樣本來代替總體,你不可能指望誤差很小。,對于的方差,n的影響是可以由人們主觀控制的,只要多花費(fèi)一些,多抽取一些就能適當(dāng)降低誤差,當(dāng)然這只能控制在一定范圍內(nèi)。,可見實(shí)際抽樣調(diào)查中用估計(jì)所產(chǎn)生的隨機(jī)誤差,也即的方差,主要受到樣本容量n的影響,因子1f的影響幾乎可以忽略。,的影響是客觀存在的,盒子中數(shù)據(jù)越分散,總體就變得越難捉摸。實(shí)際上,本身就是一個(gè)待估參數(shù),必須對的大小給出估計(jì),不估計(jì)就無法評價(jià)所產(chǎn)生的誤差可能有多大。,設(shè)為來自總體的樣本,既然它是總體的一個(gè)縮影,那么這些值的離散程度應(yīng)該反映了盒子的離散程度,因此采用統(tǒng)計(jì)量(樣本方差):,來估計(jì)。為了研究統(tǒng)計(jì)量的性質(zhì),將改寫為:,用作為的估計(jì),利用正態(tài)近似理論可以建立的置信區(qū)間,當(dāng)N,n,Nn相當(dāng)大時(shí),的分布近似可用正態(tài)曲線表示,由于,所以,取置信水平為(),注意到標(biāo)準(zhǔn)正態(tài)曲線關(guān)于0點(diǎn)的對稱性,我們有,其中是標(biāo)準(zhǔn)正態(tài)曲線的分位點(diǎn),任何一本概率統(tǒng)計(jì)的書上都提供有標(biāo)準(zhǔn)正態(tài)分布表以供查取分位點(diǎn)。,這樣,的置信區(qū)間為:,其中為未知參數(shù),用其無偏估計(jì)來代替,則得置信區(qū)間,或,例3.2某鎮(zhèn)有3250名職工,為調(diào)查該鎮(zhèn)職工收入情況,用簡單隨機(jī)抽樣方式從中抽取30名,調(diào)查結(jié)果如下表。試估計(jì)該鎮(zhèn)職工的平均月收入,并求置信水平為95的近似置信區(qū)間。,解:,N3250,n30,查標(biāo)準(zhǔn)正態(tài)分布表得分位點(diǎn):,于是該鎮(zhèn)職工月平均收入的估計(jì)值為672.23元,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 多層次安全驗(yàn)證在數(shù)字醫(yī)療中的應(yīng)用
- 節(jié)能建筑改造項(xiàng)目審計(jì)與節(jié)能改造效果跟蹤及評價(jià)服務(wù)協(xié)議
- 2025年軟考新動(dòng)態(tài)關(guān)鍵點(diǎn)的試題及答案
- 生態(tài)連鎖塊堤防施工與環(huán)保驗(yàn)收協(xié)議
- 高考作文適宜人群試題及答案
- 社區(qū)公共安全公益性崗位聘用服務(wù)協(xié)議
- 美團(tuán)民宿房源全流程托管與客戶關(guān)系維護(hù)合同
- 軟考網(wǎng)絡(luò)管理人員素養(yǎng)提升試題及答案
- 緊急國際法律文件翻譯與同步法律咨詢協(xié)議
- 風(fēng)險(xiǎn)管理在運(yùn)營效率中的影響試題及答案
- 2024北森圖表分析題庫
- 法院出庭授權(quán)委托書
- 2025年山東出版集團(tuán)有限公司山東出版?zhèn)髅焦煞萦邢薰菊衅?192名)筆試參考題庫附帶答案詳解
- 2024年浙江省海鹽縣事業(yè)單位公開招聘醫(yī)務(wù)工作者筆試題帶答案
- 江西省南昌市2025年中考語文一調(diào)試卷(含答案)
- 腸內(nèi)營養(yǎng)護(hù)理
- 高房子與矮房子的比較與思考
- 2025中國臨床腫瘤學(xué)會CSCO非小細(xì)胞肺癌診療指南要點(diǎn)解讀課件
- 全民營養(yǎng)周活動(dòng)吃動(dòng)平衡健康體重全民行動(dòng)宣傳課件
- 研學(xué)公司管理制度
- 抵押房屋買賣合同書范例
評論
0/150
提交評論