第七章統(tǒng)計抽樣_第1頁
第七章統(tǒng)計抽樣_第2頁
第七章統(tǒng)計抽樣_第3頁
第七章統(tǒng)計抽樣_第4頁
第七章統(tǒng)計抽樣_第5頁
已閱讀5頁,還剩62頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第七章抽樣調查一、抽樣調查及其意義1、抽樣調查的概念抽樣調查是按照隨機性原則,從研究總體中抽取一部分單位進行調查(或觀察),用這一部分單位的數(shù)量特征(值)去推斷研究總體的特征(值),從而達到認識總體的目的,也稱為隨機抽樣調查或概率抽樣調查。2、抽樣調查的特點1、 抽樣調查是一種非全面調查2、 按隨機原則抽取單位3、 從數(shù)量上推斷總體4、抽樣調查會產生調查誤差,但這種誤差可以預防和控制。3、抽樣調查的作用(1)不能作全面調查的時候使用(如破壞性實驗)。(2)理論上可以全面調查,但實際很難實現(xiàn)。(3)節(jié)省人力、費用和時間的考慮。(4)與全面調查相比可以調查更多的項目。(5)提高調查質量和數(shù)字的準確性,修正和補充全面調查資料。調查誤差(抽樣誤差和工作誤差)二、抽樣調查的基本原理1、幾個基本概念(1)全及總體和抽樣總體總體:研究對象的全體??傮w單位數(shù)N。樣本:從總體中抽取部分單位的集合體。樣本容量:樣本中所包含的單位數(shù)n。樣本個數(shù):從總體中可能抽取的樣本的數(shù)量。抽樣比:樣本容量與總體單位數(shù)之比。(2)全及指標和抽樣(樣本)指標全及指標:是根據(jù)總體各單位標志值計算的反映總體特征的指標。它是個確定值,在抽樣中也稱為參數(shù)(即總體的數(shù)量特征)。主要有:全及平均數(shù)X,全及成數(shù)P=N1/N;全及方差2及標準差

。抽樣(樣本)指標,是按樣本中各單位的標志值計算的反映樣本特征的指標。它是一個隨機變量,在抽樣中也稱為統(tǒng)計量,在進行統(tǒng)計推算的時候它又是總體參數(shù)的估計量。主要有:樣本平均數(shù)x,樣本成數(shù):p=n1/n,樣本方差s2及標準差s:(3) 重復抽樣和不重復抽樣重復抽樣:每次都從N個總體單位中抽取樣本(始終有N個候選單位),同一單位有多次重復中選的可能。(放回抽樣)樣本數(shù)目:考慮順序:不考慮順序:不重復抽樣:每個單位只能被抽中一次。即它的候選單位是遞減的:N,N-1,N-2,……,N-n+1。樣本數(shù)目:考慮順序:不考慮順序:例有4名工人,每人每月產量分別是40,50,70,80,現(xiàn)隨機從其中抽取兩人,測算考慮順序的樣本個數(shù)。重復抽樣考慮順序樣本數(shù):42=16,不重復抽樣考慮順序樣本數(shù):4×3=12。抽樣方案設計抽樣方案設計的基本原則1、隨機性原則2、實現(xiàn)最大抽樣效果原則精度費用1009050100抽樣方案簡單隨機抽樣和系統(tǒng)抽樣分層抽樣和整群抽樣

多階段抽樣

簡單隨機抽樣與系統(tǒng)抽樣簡單隨機抽樣:在總體各單位都有同等被抽取可能性的假設條件下進行的抽樣。抽樣方法又分為直接抽選法、抽簽法、隨機數(shù)碼表法,系統(tǒng)抽樣,也稱機械抽樣、等距抽樣是將總體各單位按某種標志排序,按相等的間隔抽取樣本單位的抽樣有關標志排隊隨機起點等距抽樣無關標志排隊半距起點等距抽樣對稱等距抽樣類型抽樣與整群抽樣分層抽樣,也稱類型抽樣是將總體按某種標志分成若干層(類型組),之后在每層中按隨機原則抽取樣本單位。類型比例抽樣:類型適宜抽樣:整群抽樣:將總體分成若干群,再按隨機原則抽取部分群,所抽取的群內所有單位作為樣本單位的抽樣方法。群內方差群間方差多階段抽樣多階段抽樣是指在抽選樣本時,并不是一次直接從總體中抽取,而是分兩個或兩個以上的階段來進行。

適用條件:1、調查范圍廣泛,沒有合適的抽樣框或者范圍太大。2、相對節(jié)約人力和物力。3、可以利用現(xiàn)成的行政區(qū)劃、組織系統(tǒng)作為劃分階段的依據(jù)。三、抽樣平均誤差抽樣(實際)誤差是指樣本指標與總體指標之間數(shù)量上的差別。抽樣平均誤差是指所有可能出現(xiàn)的樣本指標的標準差,所有可能出現(xiàn)的樣本指標與總體指標的平均離差。影響抽樣平均誤差的因素1.全及總體標志的變異程度與抽樣誤差成正比.2.樣本容量與抽樣誤差成反比.3.抽樣的組織方式與抽樣方法對誤差的影響。重復抽樣比不重復抽樣的抽樣平均誤差大;簡單隨機抽樣、整群抽樣比類型抽樣、機械抽樣的抽樣平均誤差大。抽樣平均誤差的計算當總體資料未知時1、用過去調查取得的資料。2、用樣本方差資料代替總體方差資料。3、利用小規(guī)模調查的資料。4、用估計的資料。抽樣平均誤差實用公式1、簡單隨機抽樣例:從2500件電子元件中隨機抽取4%的元件做樣本,抽出的樣本里有5件耐用時間不合格,計算該電子產品的不合格率的抽樣平均誤差。解:首先確定樣本元件的不合格率,即抽樣成數(shù)。2、類型抽樣例:某鄉(xiāng)共有農戶4000戶,用類型抽樣的方法按10%抽取樣本,情況資料見表:推斷全鄉(xiāng)抽樣平均每戶收入和抽樣方差。農戶總數(shù)樣本數(shù)樣本平均收入抽樣標準差糧食作物區(qū)技術作物區(qū)250015002501503600540052754000400解:根據(jù)資料,3、機械抽樣一般認為,無關標志排隊等距抽樣近似于簡單隨機抽樣,因此一般按簡單隨機抽樣方法計算抽樣誤差。有關標志排隊等距抽樣可以看作類型抽樣,因此按類型抽樣方法計算抽樣平均誤差。4、整群抽樣整群抽樣采用的都是不重復抽樣,計算時要使用修正系數(shù)平均數(shù)抽樣平均誤差:成數(shù)抽樣平均誤差:例:某工廠生產某種燈泡,在連續(xù)生產720小時中,每隔24小時抽取1小時的全部產品加以檢查。根據(jù)抽樣資料計算,燈泡平均使用壽命為1200小時,群間方差為60小時,計算樣本平均數(shù)的抽樣誤差。

四、全及指標推斷應用樣本統(tǒng)計量作為估計量去估計總體參數(shù),稱為參數(shù)估計。如果在估計中,直接用估計量作為固定的數(shù)值對參數(shù)作出估計即為點估計。如果在估計中要對參數(shù)做出帶有某種可靠性的估計并給出對應于這一可靠性或置信度的區(qū)間,即為區(qū)間估計。抽樣極限誤差

抽樣指標與全及指標之間有一定的誤差范圍,以一定的可靠程度保證抽樣誤差不超過某一給定范圍,統(tǒng)計上稱為抽樣極限誤差,也稱置信區(qū)間??尚懦潭瘸闃诱`差范圍Δ與抽樣平均誤差之間的關系是:概率與概率度之間滿足函數(shù)關系:P=F(t)正態(tài)分布曲線由正態(tài)概率密度函數(shù)給出:當=0,=1時,正態(tài)分布稱為標準正態(tài)分布,N(0,1)。xx+3x-3x+2x+x-x-268.27%95.45%99.73%頻率總體平均數(shù)區(qū)間估計的步驟1)確定概率保證和概率度t。2)抽取一個樣本容量為n的樣本。3)計算樣本平均數(shù)和標準差。在有限總體不重復抽樣時,標準差修正為:4)構造置信區(qū)間:也就是說:如果從正態(tài)總體抽取一個容量為n的簡單隨機樣本,并構造區(qū)間:我們有F(t)的把握說,這個區(qū)間包含總體平均數(shù)X。

說明:1)對于樣本取自總體方差已知的非正態(tài)分布,當樣本容量足夠大時,仍然用上述區(qū)間作為總體平均數(shù)的置信區(qū)間。2)當總體方差2未知時,用樣本方差s2代替。例題:某工業(yè)企業(yè)報告期生產某種橡膠輪胎10000個,從中抽取0.5%進行耐磨性能檢驗,結果得到樣本的平均磨損量為5775毫克,平均磨損量的樣本方差為50000,根據(jù)有關規(guī)定,在規(guī)定時間內的磨損量低于6000毫克為正品。試以95%的概率保證估計全部產品的平均磨損率。已知五、必要抽樣單位數(shù)的確定確定原則:保證預期精確程度和可靠程度,確定恰當?shù)谋匾獦颖緮?shù)目。依據(jù):1、可靠程度和精確程度。2、總體標志變異程度。3、抽樣組織方法。抽樣單位數(shù)的確定1、簡單隨機抽樣2、類型抽樣3、整群抽樣例:某車間加工螺桿10000件,為確定其直徑是否合格,決定從中抽取部分進行測量。為使直徑的測量誤差不超過0.1mm(可靠度取99%),按過去經驗生產該螺桿的標準差為0.8mm,問至少應抽取多少件測量才可滿足上述要求?解:這里已知N=10000件,=0.1mm,s=0.8mm.F(t)=0.99,查正態(tài)概率表可得t=2.58。按重復抽樣計算時同時,以前加工螺桿的合格品率為98%,今要檢驗該批螺桿的合格率,為使合格率的測量誤差不超過1%(可靠度95%),問抽取多少件檢驗才能滿足要求?F(t)=0.95,t=1.96,=0.01,p=0.98,,按重復抽樣計算時六、假設檢驗假設檢驗:根據(jù)一定的隨機樣本信息,判斷總體未知參數(shù)作出的假設是否可信的統(tǒng)計分析方法?;舅枷耄簽榱伺袛嗫傮w的某個特征,先對總體特征作出一定的假設,在從總體中抽取一定容量的樣本,計算和分析樣本數(shù)居,對原假設作出接受或拒絕的決策。假設檢驗決策結果決策假設真實不真實不否定正確犯第二類錯誤(取偽錯誤)否定犯第一類錯誤(棄真錯誤)正確假設檢驗的步驟第一步:建立假設。要求:原假設必須包含等號在內,備擇假設可在不等、大于、小于三者任選。檢驗結果只有兩種可能:接受原假設就必須拒絕備擇假設;拒絕原假設,就必須接受備擇假設(發(fā)生錯誤的概率)。第二步:選擇顯著水平。第三步:尋找檢驗H0的統(tǒng)計量,確定其分布,計算統(tǒng)計量。第四步:用檢驗統(tǒng)計量值與臨界值比較,若統(tǒng)計量值落在否定域內,說明原假設與樣本描述的情況有顯著差異,則拒絕原假設,(犯錯誤的概率為);如果統(tǒng)計量落在接受域,則接受原假設。第五步:做出決策。正態(tài)總體參數(shù)的檢驗(一)、方差已知時,對一個正態(tài)總體均值的檢驗。(1)檢驗統(tǒng)計量為1-α

接受域拒絕域拒絕域總體均值的假設檢驗例:某公司出口魚罐頭,標準規(guī)格是每罐250克,根據(jù)以往經驗,標準差為3克?,F(xiàn)從一批產品中抽取100罐檢驗,其平均重量為251克,假定重量服從正態(tài)分布,規(guī)定顯著水平為0.05,問該批產品是否合乎出口標準。解:1)建立假設:H0:X=X0=250

,H1:XX0=2502)計算統(tǒng)計量確定顯著水平。=0.05,雙側檢驗臨界值:現(xiàn)z=3.33,遠遠大于臨界值1.96,故否定原假設。即該批罐頭重量不符合標準。也可以通過求X的置信區(qū)間來檢驗假設,如果求出的區(qū)間包含X,就接受原假設,否則就拒絕。如上題的置信區(qū)間為:由于X=250未包含在區(qū)間內,否定原假設。(2)

正態(tài)分布Zαα接受域拒絕域例:某廠生產一種產品,原月產量服從平均值X=75,方差=14的正態(tài)分布,設備更新后,為了考察產量是否提高,抽查了6個月產量,求得平均產量為78,,假設方差不變,在顯著性水平α=0.05的情況下,月產量是否有顯著提高?解:假設(3)-Zαα接受域拒絕域說明:如果檢驗統(tǒng)計量來自大樣本,則按照中心極限定理,不論總體分布是否已知,是否正態(tài),均可用Z統(tǒng)計量來近似。(二)方差未知時,對正態(tài)總體均值的檢驗檢驗統(tǒng)計量例:某食品廠每罐罐頭標準重量為500克?,F(xiàn)隨機抽10罐來檢查機器工作情況,10罐的重量為(單位:克):495、510、505、498、503、492、502、512、497、506假定重量服從近似正態(tài)分布,試問這段時間機器工作是否正常(給定顯著水平5%)。解:建立假設:H0:=500

,H1:500,由樣本計算:查表計算檢驗統(tǒng)計量:由于t=0.97<2.26,因此,不能拒絕原假設,即機器沒有發(fā)生異常??傮w成數(shù)假設檢驗對總體成數(shù)的假設檢驗必須在大樣本條件下進行,所以應當進行Z檢驗。檢驗統(tǒng)計量不同的樣本容量有不同的t分布,即:對每一個可能的自由度,都有一個不同的t分布。自由度,是可選擇的數(shù)值的個數(shù)。一般如果樣本容量為n,則自由度為n-1。0.050.100.150.2051015202530n=10n=1n=4n=202P0.20.60.8151015202530F(10,10)F(10,50)F(10,4)FP一個好的估計量應滿

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論