《統(tǒng)計學原理與實務》課件第七章 抽樣推斷_第1頁
《統(tǒng)計學原理與實務》課件第七章 抽樣推斷_第2頁
《統(tǒng)計學原理與實務》課件第七章 抽樣推斷_第3頁
《統(tǒng)計學原理與實務》課件第七章 抽樣推斷_第4頁
《統(tǒng)計學原理與實務》課件第七章 抽樣推斷_第5頁
已閱讀5頁,還剩163頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

大學生平均每月的手機話費支出是多少?導入案例某大學經(jīng)濟管理學院大學生月手機話費抽樣調查表月支出電話費用/元學生人數(shù)/人30以下2330~505050~702970~901390以上11合計126

大學生平均每月的手機話費支出是多少?導入案例分析在社會生產(chǎn)實踐中,常常會遇到這樣一些問題,如對某些產(chǎn)品質量的檢驗、藥品藥效的檢驗、煙花爆竹的檢驗等。因其檢驗過程對產(chǎn)品本身具有破壞性而不可能進行全面調查獲取總體資料。而統(tǒng)計的研究對象是大量的社會經(jīng)濟現(xiàn)象總體的數(shù)量方面。那么,如何獲取這些現(xiàn)象的總體資料呢?通過本章的學習就能夠找到答案。目錄1第一節(jié)抽樣推斷概述2第二節(jié)抽樣誤差3第三節(jié)參數(shù)估計4第四節(jié)抽樣調查的組織方式第一節(jié)抽樣推斷概述1一抽樣推斷概述一、抽樣推斷的概念與特點(一)抽樣推斷的概念抽樣調查是一種科學的非全面調查方法,是指按照隨機性原則從總體中抽取一部分單位進行調查,以獲得各項數(shù)據(jù)。抽樣推斷是進一步運用數(shù)理統(tǒng)計的原理,根據(jù)抽樣調查的數(shù)據(jù),對總體現(xiàn)象本質的認識。抽樣包括抽樣調查和抽樣推斷兩部分。一抽樣推斷概述(二)抽樣推斷的特點抽樣調查是一種非全面調查,調查的目的不在于了解部分單位的情況,它只是作為進一步推斷的手段,目的在于要認識總體的數(shù)量特征。(1)抽樣推斷是由部分推算整體的一種認識方法一抽樣推斷概述抽樣調查可以是隨機抽樣,也可以是非隨機抽樣,但是作為抽樣推斷的前提必須是隨機抽樣。隨機抽樣指從總體中抽取樣本單位時,樣本單位的中選機會均等。

這樣做的原因之一是可以利用概率論的原理對調查的結果做出具有一定可靠程度的估計與推斷;二是防止出現(xiàn)由于主觀抽選被調查單位帶來的傾向性誤差。(2)抽樣推斷是建立在隨機取樣的基礎上一抽樣推斷概述以抽樣調查的樣本指標數(shù)值來推斷總體指標數(shù)值,雖然存在一定誤差,但這種誤差在抽樣調查之前是可以計算的,并能根據(jù)統(tǒng)計研究的任務、目的、精確性等,采取相應的措施加以控制,使抽樣推斷的結論達到一定的可靠程度。這也是抽樣調查不同于其他調查方式的重要區(qū)別之一。(3)抽樣推斷的誤差可以事先計算并進行控制一抽樣推斷概述二、抽樣推斷的作用(1)對某些不必要或不可能進行全面調查而又要了解全面情況的現(xiàn)象,采用抽樣調查獲取資料可以大大節(jié)省人力、財力、物力,有利于提高經(jīng)濟效益和統(tǒng)計資料的時效性。(2)抽樣調查和全面調查同時進行,可以發(fā)揮相互補充和驗證的作用。(3)抽樣調查是開展專題研究、提供信息咨詢的重要手段。一抽樣推斷概述三、抽樣推斷的基本概念(一)抽樣單位和抽樣框1.總體和樣本總體是抽樣推斷所要研究對象的全部單位組成的整體,也稱母體??傮w的特點是,在一個總體中,各單位具有某種(或某些)相同的性質,同時,在各個個體的某個標志值之間又往往存在著差異。樣本是總體的一部分,它是由從總體中抽取出來的單位組成的整體,也稱子樣。如果說總體是由各個同質單位組成的一個母集,則樣本是來自該母集的一個子集,樣本代表總體,是總體的一個縮影,因此,可以用樣本的數(shù)量特征對總體的數(shù)量特征進行估計和推斷。一抽樣推斷概述2.抽樣框要從一個總體中抽選樣本,很重要的一個問題就是需要一個包括全部總體單位的框架,以此代表總體,從中抽取樣本單位。從中抽取樣本的這個框架就稱為抽樣框。它的作用就是將無形的總體變成有形的事物以便于實際抽取。一抽樣推斷概述要很好地理解抽樣框,需要區(qū)分一對概念:目的總體和被抽樣總體。在統(tǒng)計研究中,根據(jù)研究目的所確定的理想總體,就是目的總體。但是,有時目的總體非常復雜,尤其在社會經(jīng)濟調查中,我們想得到一個包括目的總體全部單位的框架往往很難,只能用一個接近目的總體,并且容易取得和便于操作的框架來代替,這就是被抽樣總體,即抽樣框包含的總體范圍。一抽樣推斷概述抽樣框有以下幾種具體表現(xiàn)形式:一種是一覽表(即名單或目錄),顧名思義,就是將總體全部單位的名稱羅列起來;另一種是地圖,調查對象與地理分布有關的時候,往往借助于地圖,根據(jù)地圖上的自然或人工標志,例如,河流、公路、自然村落、城市街區(qū)等將調查區(qū)域劃分成可以進行抽樣的單位;還有一種是時間抽樣框,有些抽樣單位是隨時間推移而變化的,例如,生產(chǎn)流水線上的產(chǎn)品、街道路口的汽車流量等。一抽樣推斷概述3.抽樣單位抽樣單位是構成抽樣框的基本要素,它與總體單位的關系有以下兩種情況:一種是抽樣單位就是總體的基本單位,在總體單位數(shù)不大并且比較集中的情況下,一般是從總體單位中直接抽取若干形成樣本,這時抽樣單位與總體單位一致;另一種情況是抽樣單位是總體單位的集合,在總體單位數(shù)很大,抽樣比較復雜時,我們一般不直接從總體中抽取總體單位,而是首先抽取若干總體單位的集合(比如整群抽樣),或者通過幾個階段來抽取總體單位(比如多階段抽樣),這時,抽樣單位與總體的基本單位往往是不一致的。此時,抽樣框就是抽樣單位的名單。一抽樣推斷概述抽樣單位的不同劃分,是針對不同抽樣方法而言的。若抽樣單位只包含一個個體,并且沒有分級,與之相對應的是簡單隨機抽樣;若抽樣單位中包含若干個體,與之對應的是整群抽樣;在抽樣單位分級情況下,與之對應的是多階段抽樣。由于抽樣單位可以分級,于是就有了與之相對應的不同級上的抽樣框。抽樣實踐中,抽選哪一級抽樣單位,有同級的抽樣框即可。一抽樣推斷概述(二)樣本容量和樣本可能數(shù)目1.樣本容量樣本容量是指一個樣本中所包含的單位數(shù)的多少??傮w單位數(shù)通常用N表示,樣本容量一般用n表示。在社會經(jīng)濟統(tǒng)計中,總體單位數(shù)N一般很大,有時可以是無限多的,樣本容量n相對于總體單位數(shù)N一般是很小的。

的樣本叫小樣本,的樣本叫大樣本。根據(jù)數(shù)理統(tǒng)計理論,在用樣本數(shù)量特征去推斷總體數(shù)量特征時,大樣本與小樣本兩種不同條件下,使用的推斷方法也有所不同。社會經(jīng)濟現(xiàn)象的抽樣推斷中,絕大多數(shù)采用的是大樣本。一抽樣推斷概述2.樣本可能數(shù)目樣本可能數(shù)目是指按一定抽樣方法和一定樣本容量從總體中抽取樣本時,所有可能的樣本組合個數(shù),一般用M表示。對于無限總體,樣本可能數(shù)目也是無限多的;對于有限總體,樣本可能數(shù)目與總體單位數(shù)、樣本容量以及所用的抽樣方法有關。按照隨機原則從總體中具體抽取樣本單位時,按抽樣的方法來分,有重復抽樣和不重復抽樣兩種。一抽樣推斷概述重復抽樣又稱回置抽樣,其具體做法是:從總體N個單位中隨機抽取一個容量為n的樣本,每次從總體中抽取一個單位,觀察登記后,將該單位放回總體,保持總體單位數(shù)不變,再進行下一個單位的抽取,如此反復n次,直到抽足n個單位為止。重復抽樣具有這樣的特點:n次抽取可以看作n次獨立試驗,每次抽取是在完全相同的條件下進行的,因此每個單位中選或不中選的機會在各次都完全一樣。但是,采用重復抽樣的方法,同一單位有可能被反復抽到,從而會影響樣本的代表性,抽樣誤差較大。一般來講,整群抽樣和多階段抽樣方式不宜采用這種方法。一抽樣推斷概述不重復抽樣又稱不回置抽樣,其具體做法是:從總體N個單位中抽取一個容量為n的樣本,每次從總體中隨機抽取一個單位,觀察登記后不再放回總體,在此基礎上抽取第二個單位,依次類推。不重復抽樣有這樣的特點:每次抽樣以后,總體都會少一個單位。因此,不重復抽樣的每次抽取都會影響到下一次,n次抽取不是相互獨立的。所以,不重復抽樣的每次抽一個,連續(xù)抽n次,相當于一次從總體中抽出n個單位組成樣本。由于每次抽取時總體單位數(shù)不同,每個單位中選或不中選的機會在各次是不同的。一抽樣推斷概述在不重復抽樣中,每個單位只有一次被抽中的機會,不可能被抽中兩次或兩次以上。因此,在樣本容量相同的情況下,采用不重復抽樣方法抽選出來的樣本的代表性高于用重復抽樣方法抽選出來的樣本的代表性。實際工作中,多采用不重復抽樣的方法。一抽樣推斷概述根據(jù)對樣本的要求不同,在采用重復抽樣和不重復抽樣方法的基礎上,又有考慮順序抽樣和不考慮順序抽樣兩種。考慮順序的抽樣,即從總體N個單位中取n個單位組成樣本時,不但要考慮樣本的構成單位,還要考慮樣本中各單位的中選順序,即使是相同單位組成的樣本,若各單位中選順序不同,也作為不同的樣本。不考慮順序的抽樣,即從總體個單位中抽取個單位組成樣本,只考慮樣本的組成單位,而不管各單位的中選順序,只要樣本的組成單位相同,都作為同一個樣本。一抽樣推斷概述(1)考慮順序的重復抽樣的樣本可能數(shù)目??紤]順序和不考慮順序抽樣,與重復抽樣和不重復抽樣方法相聯(lián)系,就產(chǎn)生了四種情況:考慮順序的重復抽樣,考慮順序的不重復抽樣,不考慮順序的重復抽樣,不考慮順序的不重復抽樣。采用重復抽樣的方法從總體N個單位中抽取一個容量為n的樣本,在考慮順序的情況下,可以看作進行n次抽取,每次抽取都有N種不同的抽法,所以:一抽樣推斷概述(2)考慮順序的不重復抽樣的樣本可能數(shù)目。采用不重復抽樣的方法從總體N個單位中抽取一個容量為n的樣本,在考慮順序的情況下,可能樣本數(shù)目可以看作從N個單位中抽取n個單位的排列,即:一抽樣推斷概述(3)不考慮順序的重復抽樣的樣本可能數(shù)目。采用重復抽樣的方法從總體N個單位中抽取一個容量為n的樣本,在不考慮順序的情況下,可能組成的樣本個數(shù)等于從N+n-1個單位中抽取n個單位的組合,即:一抽樣推斷概述(4)不考慮順序的不重復抽樣的可能樣本數(shù)目。采用不重復抽樣的方法從總體N個單位中抽取一個容量為n的樣本,在不考慮順序的情況下,可能組成的本個數(shù)可以看作從N個單位中抽取n個單位的組合,即:應用以上4個公式,應注意分析樣本的具體要求,根據(jù)提出的問題確定樣本可能數(shù)目。一抽樣推斷概述(三)參數(shù)和統(tǒng)計量1.參數(shù)參數(shù)即總體指標,是根據(jù)總體中各單位的變量值或屬性特征計算的、反映總體數(shù)量特征的綜合指標。由于總體是唯一確定的,根據(jù)總體計算的指標也是唯一確定的,所以,總體指標也稱為總體參數(shù)。不同性質的總體,需要計算不同的總體指標。對于變量總體,由于各單位的標志表現(xiàn)可以用數(shù)量表示,所以可以計算總體平均數(shù)(或總體成數(shù)P),總體方差和總體標準差。一抽樣推斷概述設總體單位變量值分別為:,則有:(簡單算術平均數(shù))(加權算術平均數(shù))或一抽樣推斷概述方差:(簡單式)(加權式)或一抽樣推斷概述標準差:(簡單式)(加權式)或一抽樣推斷概述對于屬性總體,由于各單位的標志表現(xiàn)不能用數(shù)量來表示,所以,其總體指標常以成數(shù)指標P來表示總體中具有某種屬性的單位數(shù)占總體全部單位數(shù)的比重,以Q

表示總體中不具有某種屬性的單位數(shù)占總體全部單位數(shù)的比重。一抽樣推斷概述設總體N個單位中,有N1個單位具有某種屬性,N0個不具有某種屬性,則有:在抽樣調查中,總體指標的意義和計算方法是明確的,但指標的具體數(shù)值事先未知,需要用樣本指標來估計。屬性總體的平均數(shù)就是成數(shù)P,即:其方差和標準差分別為:一抽樣推斷概述2.統(tǒng)計量統(tǒng)計量即樣本指標,是由樣本中各單位的變量值或屬性特征計算的、反映樣本數(shù)量特征的綜合指標。與總體指標相對應,樣本指標有樣本平均數(shù)、樣本成數(shù)、樣本方差

和樣本標準差。為了與總體指標相區(qū)別,樣本指標用小寫字母表示。一抽樣推斷概述對于從變量總體中抽選出來的樣本,設樣本各單位變量值分別為,則有:(簡單算術平均數(shù))(加權算術平均數(shù))或一抽樣推斷概述方差:(簡單式)(加權式)或一抽樣推斷概述標準差:(簡單式)(加權式)或一抽樣推斷概述對于從屬性總體中選出來的樣本,設樣本n個單位中,有n1個單位具有某種屬性,n0個單位不具有某種屬性,則有:由于從一個總體中可以抽取多個樣本,樣本不同,樣本指標的數(shù)值也不同,所以樣本指標不是唯一確定的,是個隨機應量,因此,樣本指標也稱為樣本統(tǒng)計量。屬性總體的平均數(shù)就是成數(shù)P,即:其方差和標準差分別為:一抽樣推斷概述四、抽樣推斷的理論基礎大數(shù)定律與中心極限定理是與統(tǒng)計學密切相關的重要數(shù)學定理,它們?yōu)槌闃油茢嗵峁┝藬?shù)學理論基礎。獨立同分布的隨機變量,并且有數(shù)學期望和方差

,則對任意的正數(shù),有(一)大數(shù)定律一抽樣推斷概述該定理說明,當充分大時,獨立同分布的一系列隨機變量,其平均數(shù)與它們共同的期望值之間的偏差,可以有很大把握被控制在任意給定的范圍之內。由于從總體中抽出的樣本是獨立且與總體同分布的,因此當樣本容量充分大時,樣本平均與總體平均之間的誤差可以有很大的把握被控制在任意給定的要求之內,這就是用樣本平均估計總體平均的理論依據(jù)。一抽樣推斷概述由于比率指標是一個特殊的平均數(shù),大數(shù)定律對比率指標自然也成立,設是次試驗中事件發(fā)生的次數(shù),是事件發(fā)生的概率,則對于任意的正數(shù),有即當充分大時,事件發(fā)生的頻率接近(依概率收斂于)事件發(fā)生的概率,反映了頻率在大量重復試驗過程中的穩(wěn)定性。該定理稱為貝努里大數(shù)定律,它提供了用頻率代替概率的理論依據(jù)。一抽樣推斷概述大數(shù)定律表明:盡管個別現(xiàn)象受偶然因素影響,有各自不同的表現(xiàn),但是對總體在大量觀察后進行平均,就能使偶然因素的影響相互抵消,消除由個別偶然因素引起的極端性影響,從而使總體平均數(shù)穩(wěn)定下來,反映出事物變化的一般規(guī)律。一抽樣推斷概述(二)正態(tài)分布再生定理如果變量服從正態(tài)分布,總體平均數(shù)是,標準差是,從這個總體中抽出一個容量是的樣本,則樣本平均數(shù)也服從正態(tài)分布,其平均數(shù)仍是,其標準差是。從正態(tài)分布的再生定理可以看出,只要總體變量服從正態(tài)分布,則從中抽取的樣本,不管是多少,樣本平均數(shù)都服從正態(tài)分布。但是在客觀實際中,總體并非都是正態(tài)分布。對于從非正態(tài)分布總體中抽取的樣本平均數(shù)的分布問題,需要由中心極限定理來解決。一抽樣推斷概述(1)樣本平均數(shù)的中心極限定理。從任一比率為,方差為的0-1分布總體中,抽取容量為的樣本,其樣本比率的分布會隨著的增大而趨近于平均數(shù)為,標準差為的正態(tài)分布。

(2)樣本比率的中心極限定理。(三)中心極限定理從任一比率為,方差為的0-1分布總體中,抽取容量為的樣本,其樣本比率的分布會隨著的增大而趨近于平均數(shù)為,標準差為的正態(tài)分布。第二節(jié)抽樣誤差2二抽樣誤差一、抽樣誤差的概念及影響因素(一)抽樣誤差的概念抽樣誤差是指樣本指標和全及指標之間的差數(shù)。具體來說,就是樣本平均數(shù)和全及平均數(shù)之間的差數(shù),或是樣本成數(shù)和全及成數(shù)之間的差數(shù)。因為抽樣調查只是從全及總體中抽取一部分單位進行調查,即使做到嚴格地遵守隨機原則,要使樣本總體的結構與全及總體的結構完全一致是不可能的,只要樣本總體的結構與全及總體的結構稍有不同,計算出來的樣本指標就不會與全及指標完全一致,而是存在一定的差異。在抽樣調查過程中,會發(fā)生許多種誤差。一種是登記性誤差,這是由于沒有如實登記,或者登記、匯總錯誤等造成的。這種登記性誤差可以通過提高調查人員的思想和業(yè)務水平,改進調查方法和組織工作,建立嚴格的工作責任制等加以避免。另一種誤差是代表性誤差,它又分為兩種情況:其一是在抽樣過程中,沒有按照隨機原則取樣,存在人為的主觀因素在內,是因破壞了隨機原則造成的。這種誤差叫偏差,是應該避免的。其二是在抽樣過程中,嚴格按照隨機原則取樣(消除登記性誤差和偏差的條件下),由于用樣本指標代替全及總體指標所引起的誤差。這種誤差是不可避免的,而且是按隨機原則產(chǎn)生的,稱為隨機誤差。抽樣誤差一般是指隨機誤差。抽樣誤差是衡量抽樣調查準確性的指標。抽樣誤差越大,表明樣本總體對全及總體的代表性越小,抽樣調查的結果越不可靠。反之,抽樣誤差越小,表明樣本總體的代表性越大,抽樣調查越準確可靠。二抽樣誤差(二)影響抽樣誤差大小的因素1.樣本單位數(shù)的多少在其他條件不變的情況下樣本單位數(shù)越多,抽樣誤差越小;反之,樣本單位數(shù)越少,抽樣誤差越大。這是因為隨著樣本單位數(shù)的增加,樣本結構就越接近總體的結構。二抽樣誤差2.總體標志變異程度的大小在其他條件不變的情況下,總體被研究標志的變異程度越大,抽樣誤差也越大;反之,總體被研究標志的變異程度越小,抽樣誤差也越小。這是因為總體標志變異程度小,表示總體各單位標志值之間的差異小,則抽樣指標與總體指標之間的差異可能也小。如果總體各單位標志值相等,即標志變動度等于零,這時抽樣指標就完全等于總體指標,抽樣誤差也就不存在了。所以,抽樣誤差的大小是同全及總體被研究標志的變異程度成正比的。二抽樣誤差3.抽樣調查的組織方式不同的組織方式產(chǎn)生的誤差不同。一般說來,機械抽樣和分類抽樣由于先把全及總體各單位分組排隊,因而較其他抽樣組織方式更能保證樣本單位在全及總體中分布均勻,從而提高樣本的代表性。因此,這種抽樣組織方式比其他方式抽樣誤差小。二抽樣誤差4.抽樣方法抽樣方法不同,抽樣誤差也不同,一般來說,重復抽樣比不重復抽樣的誤差要大些。二、抽樣平均誤差抽樣平均誤差是抽樣誤差的一般水平,它的數(shù)值隨著可能抽取的樣本不同而或大或小,所以是個隨機變量。為了總的衡量樣本代表性的高低,就需要計算抽樣誤差的一般水平,抽樣平均誤差就是反映抽樣誤差一般水平的指標。通常是用抽樣平均數(shù)的標準差或抽樣成數(shù)的標準差來作為衡量誤差一般水平的尺度。這是因為,抽樣平均數(shù)的平均數(shù)等于總體平均數(shù),而抽樣成數(shù)的平均數(shù)等于總體成數(shù),所以抽樣標準差恰好反映了抽樣指標的平均離差程度。二抽樣誤差設以表示抽樣平均數(shù)的平均誤差,表示樣本平均數(shù),表示總體平均數(shù),表示樣本可能數(shù)目,則設為抽樣成數(shù)的平均誤差,為樣本成數(shù),為總體成數(shù),則二抽樣誤差以上公式表明了抽樣平均誤差的意義。但是由于樣本可能數(shù)目很多,總體指標與

也是不知道的,故按上述公式來計算抽樣平均誤差實際上是不可行的。在實用上要推導出其他公式來計算,下面直接給出這些公式并加以討論。(一)抽樣平均數(shù)的平均誤差1.重復抽樣【例題】數(shù)理統(tǒng)計證明:在純隨機重復抽樣條件下,抽樣平均誤差與全及總體的標準差成正比,而與樣本總體單位數(shù)的平方根成反比。根據(jù)這個關系可得出純隨機重復抽樣平均數(shù)抽樣誤差的計算公式為:式中,為全及總體的標準差,為全及總體方差;為樣本總體的單位數(shù)。解二抽樣誤差【例7-1】設有4個工人的全及總體,他們的月工資是:甲140元、乙150元、丙170元、丁180元,則其平均工資和工資標準差為:二抽樣誤差現(xiàn)以重復抽樣方法從4人總體中隨機抽取2人組成樣本,計算樣本平均工資,用以代表4人總體的工資水平,共可組成16個樣本。每個樣本都可算出平均收入(),它們與總體平均收入()都有個離差,下面用表7-1列示出來。二抽樣誤差表7-1重復抽樣誤差計算表二抽樣誤差樣本工資收入/元樣本平均數(shù)離差離差平方甲甲140140140-20400甲乙140150145-15225甲丙140170155-525甲丁140180160-00乙甲150140145-15225乙乙150150150-10100乙丁150180165+525丙甲170140155-525丙丙170170170+10100丙丁170180175+15225丁乙180150165+525丁丙180170175+15225丁丁180180180+25400合計—2560—200016個樣本平均的平均數(shù)為:按定義:二抽樣誤差抽樣平均誤差按純隨機重復抽樣平均數(shù)抽樣誤差的計算公式:按定義和按公式計算的抽樣平均誤差完全相同。從以上計算過程,可以得出幾個基本關系:(1)抽樣平均數(shù)的平均數(shù)等于總體平均數(shù),即。(2)抽樣平均誤差小于總體標準差,即<,重復抽樣時僅為總體標準差的,所以抽樣平均數(shù)作為估計量更是有效的。(3)抽樣平均誤差和總體標準差是成正比的,與樣本單位數(shù)的平方根成反比。因此,要想減少抽樣平均誤差以提高抽樣指標的代表性,只能增大樣本單位數(shù),因為總體標準差是不能改變的(它是客觀存在的)。例如,抽樣平均誤差減少1/2,則樣本單位數(shù)必須增大到4倍;抽樣平均誤差要減少到原來的1/3,則樣本的單位數(shù)就要擴大到9倍。二抽樣誤差2.不重復抽樣有不重復抽樣的條件下,抽樣平均數(shù)的平均誤差不但和總體變異程度、樣本單位數(shù)有關,而且和總體單位數(shù)N的多少有關。其計算公式為:當總體單位數(shù)N很大時,公式中的N-1可以用N代替。所以,在實際計算時,不重復抽樣的抽樣平均的平均誤差可用下式計算:二抽樣誤差將上面重復抽樣和不重復抽樣的平均誤差公式相比,兩者相差一個修正系數(shù)(1-n/N),這個修正系數(shù)是大于0而小于1的正數(shù)??梢?,在同樣條件下,不重復抽樣的平均誤差永遠小于重復抽樣的平均誤差。在不重復抽樣情況下,如果全及總體單位數(shù)很多,樣本單位數(shù)又很少時,n/N的數(shù)值接近于零,(1-n/N)接近于1,于是修正系數(shù)的作用不大了。又因為許多社會經(jīng)濟現(xiàn)象不能進行重復抽樣,所以在實際抽樣調查中,一般都采用不重復抽樣方法進行抽樣,而采用重復抽樣的公式計算抽樣平均誤差,這樣計算的結果偏大。二抽樣誤差【例7-2】現(xiàn)仍以【例7-1】中4個工人工資的例子,用不重復抽樣的方法從總體中隨機抽取2人組成樣本,則可能出現(xiàn)的樣本情況如表7-2所示。二抽樣誤差樣本工次收入/元樣本平均數(shù)離差離差平方甲乙140150145-15225甲丙140170155-525甲丁1401801600.0乙甲150140145-15225乙丁150180165+525丙甲170140155-525丙丁170180175+15225丁乙180150165+525丁丙180170175+15225合計

1920—1000表7-2不重復抽樣誤差計算表按定義抽樣平均誤差:12個樣本平均數(shù)的平均數(shù):二抽樣誤差按公式抽樣平均誤差:兩者計算結果完全相同。由上可知,在不重復抽樣的條件下,抽樣平均數(shù)的平均數(shù)仍然等于總體平均數(shù),而它的抽樣平均誤差9.13元則比重復抽樣的平均誤差11.18元小。3.總體方差的確定方法上面介紹的重復或不重復條件下的抽樣平均誤差公式,只有掌握總體標準差的數(shù)值才能計算,但是總體標準差一般是不知道的。二抽樣誤差實際工作中常用下面的方法來確定:(1)用樣本標準差代替總體標準差,即用代替。理論和實踐都證明,只要樣本總體單位數(shù)量多(n>50)時,抽樣總體的標準差與全及總體的標準差是相當接近的。所以,這種方法是可行的。但是只能在抽樣調查之后方能計算。(2)用過去調查資料的標準差。如果歷史上做過同類型的全面調查或抽樣調查,就使用過去所掌握的總體標準差或樣本標準差。(3)抽取一個小樣本進行估計。如果既沒有歷史資料,又需要在調查之前就要計算抽樣平均誤差,則可組織一次小規(guī)模的試驗性抽樣調查,計算出抽樣標準差作為總體標準差的估計值。二抽樣誤差【例7-3】一批新燈泡共500只,用純隨機抽樣方式從中抽取25只進行燈泡壽命的檢驗。經(jīng)計算,燈泡的平均壽命為1500h,樣本標準差為60h,求抽樣平均誤差。重復抽樣:解二抽樣誤差不重復抽樣:計算結果表明,樣本平均壽命為1500h,它的總體平均壽命的抽樣平均誤差在重復抽樣時為12h,不重復抽樣時為11.70 h。(二)抽樣成數(shù)的平均誤差抽樣成數(shù)平均誤差的計算方法與平均數(shù)抽樣誤差的計算方法基本上是一樣的,首先要求出成數(shù)的總體方差。要計算成數(shù)的總體方差,須先求出成數(shù)的平均數(shù)。前面講過,某一現(xiàn)象有兩種表現(xiàn)時,例如合格或不合格,用N1代表具有某種表現(xiàn)的總體單位數(shù),N0代表不具有某種表現(xiàn)的總體單位數(shù);假定N1的變量值為1,N0的變量值為0,則它們的平均數(shù)為:二抽樣誤差由此可見,成數(shù)的平均數(shù)是成數(shù)本身,即成數(shù)是一種最簡單的平均數(shù),是只取0和1兩個變量值的變量的平均數(shù)。根據(jù)標準差的計算公式,成數(shù)的標準差為:由此可見,成數(shù)的標準差就是具有某一標志表現(xiàn)的單位在總體中的成數(shù)和不具有這一標志表現(xiàn)的單位在總體中的成數(shù)二者乘積的平方根。二抽樣誤差因此可以從抽樣平均數(shù)的平均誤差和總體標準差的關系推出抽樣成數(shù)平均誤差的計算公式為:抽樣成數(shù)平均誤差公式中的P是總體的成數(shù),一般也是無法知道的。這時我們也可以用實際抽樣的樣本成數(shù)來代替,或用已掌握的歷史同類現(xiàn)象的相應成數(shù)來代替。二抽樣誤差在總體單位數(shù)N較大的情況下,近似地為:不重復抽樣:重復抽樣:【例7-4】從10000件產(chǎn)品中隨機抽取200件進行質量檢查,發(fā)現(xiàn)其中有10件不合格,問合格率的抽樣平均誤差是多少?先求樣本產(chǎn)品的合格率,即抽樣成數(shù):解二抽樣誤差用重復抽樣計算成數(shù)抽樣平均誤差:用不重復抽樣計算成數(shù)抽樣平均誤差:計算結果表明,樣本的合格率為95%,它與總體合格率之間的抽樣平均誤差為1.53%。三、抽樣極限誤差(一)抽樣極限誤差的意義抽樣極限誤差是指抽樣指標與總體指標之間抽樣誤差的可能范圍,又叫抽樣誤差范圍。用樣本指標來估計總體指標,總是要產(chǎn)生誤差,兩者完全相等幾乎是不可能的。由于樣本是隨機抽取的,樣本指標是隨機變量,所以要確切地指出某一抽樣指標究竟誤差有多大,也幾乎是不可能的,我們只能把抽樣誤差控制在一定的范圍內,這就需要研究抽樣極限誤差。二抽樣誤差由于總體指標是一個確定的數(shù),而抽樣指標則圍繞著總體指標左右變動,它與總體指標可能產(chǎn)生正離差,也可能產(chǎn)生負離差,抽樣指標變動的上限或下限與總體指標之差的絕對值就可以表示抽樣誤差的可能范圍,我們將這個抽樣誤差的可能范圍稱為抽樣極限誤差。二抽樣誤差設與分別表示抽樣平均數(shù)與抽樣成數(shù)的誤差范圍,則有:二抽樣誤差將上列等式變成相應不等式為:上式表明,抽樣平均數(shù)是以總體平均數(shù)為中心,在之間變動,區(qū)間(,)稱為平均數(shù)的估計區(qū)間,區(qū)間總長度為;同樣,抽樣成數(shù)是以總體成數(shù)為中心,在之間變動,區(qū)間(,)稱為成數(shù)的估計區(qū)間,區(qū)間總長度為

。由于總體平均數(shù)和成數(shù)是未知的,它需要靠實測的抽樣平均數(shù)和成數(shù)來估計,因而抽樣限誤差的實際意義是希望總體平均數(shù)落在抽樣平均數(shù)的范圍內,總體成數(shù)落在抽樣成數(shù)的范圍內,因此上述不等式應該變換為:容易驗證后面兩個不等式和前面兩個不等式是完全等價的,前面兩個不等式成立,后面的兩個不等式也同樣成立?!纠?-3】中的25只樣本燈泡的平均壽命為1500h,抽樣平均誤差為12h,用這個誤差來推斷全部500只燈泡的平均壽命:,即總體的平均壽命在1488~1512h之間。二抽樣誤差(二)抽樣誤差的可靠程度抽樣極限誤差的估計總是要和一定的概率保證程度聯(lián)系在一起的。因為既然抽樣誤差是一個隨機變量,就不能期望抽樣平均數(shù)(或成數(shù))落在一定區(qū)間內是一個必然事件,而只是給予一定的概率保證而已。所以在進行抽樣估計時,不但要考慮抽樣誤差的可能范圍有多大,而且還必須考慮落到這一范圍的概率有多大。數(shù)理統(tǒng)計證明,如果抽樣單位數(shù)達到足夠多的條件下,抽樣誤差范圍的變化和抽樣的可靠程度之間具有密切聯(lián)系,抽樣誤差范圍越擴大,抽樣的可靠程度也越高;反之,當抽樣誤差范圍越小時,抽樣的可靠程度也越低。二抽樣誤差數(shù)理統(tǒng)計還證明,在大樣本條件下,抽樣平均數(shù)服從正態(tài)分布。因此抽樣誤差范圍同概率的關系是這樣的:當誤差范圍為1倍平均誤差時,其概率為0.6827,即68.27%;當誤差范圍擴大為2時,其概率為0.9545,即95.45%;當誤差范圍擴大為3時,其概率為0.9973,即99.73%。二抽樣誤差上面列舉的抽樣誤差擴大的倍數(shù),叫概率度,用符號t表示。而擴大或縮小后的誤差就是極限誤差(或允許誤差),用符號表示?!纠?-3】中500只燈泡的估計中,當概率度t=1時,允許誤差為h,估計的概率為68.27%,當t=2時,許誤差

h,估計的概率為95.45%。由此得出,允許誤差、概率度和抽樣平均誤差三者之間的關系式為:二抽樣誤差抽樣極限誤差通常是以抽樣平均誤差作為標準來衡量的,用或分別除或,得出相對數(shù)為t概率度,表示相對誤差范圍。其計算公式為:二抽樣誤差抽樣極限誤差也可以表示為抽樣平均誤差的若干倍,其倍數(shù)即是概率度(t),用公式表如下:抽樣極限誤差(△)可以用倍的抽樣平均誤差()來表示,在抽樣平均誤差一定的條件下,概率度的數(shù)值越大,則抽樣極限誤差的范圍也越大,抽樣指標代表總體指標所作的估計的可靠程度也就越高;反之,概率度的數(shù)值越小,則抽樣極限誤差的范圍也越小,抽樣指標代表總體指標所作的估計的可靠程度也就越低。如果把可靠程度(即概率)用P來表示,那么就是

t

的函數(shù),也就是P=f(t),表明概率分布是概率度的函數(shù)。二抽樣誤差從一個全及總體中連續(xù)進行多次抽樣,可以得到一系列的樣本,分別求出各個樣本的平均數(shù)(或成數(shù)),便可形成一個抽樣平均數(shù)(或成數(shù))的概率分布。根據(jù)中心極限定理證明,不論全及總體是否屬于正態(tài)分布,只要當抽樣總體單位數(shù)足夠多時(一般以n>30為標準),則抽樣平均數(shù)(或成數(shù))的分布,逼近于以全及平均數(shù)(或成數(shù))為對稱中心的正態(tài)分布。二抽樣誤差其主要特點是:(1)若干個抽樣平均數(shù)(或成數(shù))大于或小于全及平均數(shù)(或成數(shù))的概率分布是完全對稱的,即正誤差和負誤差的可能性(即概率)是完全一致的。(2)抽樣平均數(shù)(或成數(shù))越接近全及平均數(shù)(或成數(shù)),其出現(xiàn)的可能性越大;反之,抽樣平均數(shù)越遠離全及平均數(shù),其出現(xiàn)的可能性越小。隨著概率度的增大,概率的數(shù)值也隨之增大,逐漸接近于1。這說明預定的概率保證程度越大,則抽樣推斷估計的可靠程度越大。二抽樣誤差為了方便計算,在實際工作中,按不同t的值和相應的F(t)編制成正態(tài)分布概率表供查用。下面列舉幾個常用的概率度和概率之間的函數(shù)數(shù)量關系,詳見表7-3。利用概率表,我們可以根據(jù)概率度查出相應的概率保證程度,也可以按規(guī)定的概率保證程度來估計可能的誤差范圍。二抽樣誤差表7-3概率度和概率的函數(shù)關系表tF(t)1.000.68274.6450.90001.960.95002.000.95452.580.99003.000.9973(三)抽樣極限誤差的計算1.平均數(shù)的抽樣極限誤差重復抽樣:不重復抽樣:二抽樣誤差2.成數(shù)的抽樣及限誤差二抽樣誤差重復抽樣:不重復抽樣:【例7-5】解二抽樣誤差某燈泡廠檢查一批燈泡,按隨機原則抽取100只進行壽命檢驗,查得平均使用壽命為1600h,標準差為50h,在概率為95%的保證下,求抽樣極限誤差。根據(jù)題意s=50,n=100,由F(t)=95%,查表得t=1.96,按重復抽樣公式計算:【例7-6】解二抽樣誤差根據(jù)題意,由N=6000,n=300,n0=45,F(xiàn)(t)=95.45%,查表得t=2,于是樣本合格率為:按不重復抽樣公式計算:從6000件產(chǎn)品中,隨機抽查300件,發(fā)現(xiàn)45件不合格,在概率為95.45%時,求抽樣極限誤差。=4.06%第三節(jié)參數(shù)估計3三參數(shù)估計一、估計量及其評價標準參數(shù)估計是用樣本統(tǒng)計量去估計總體參數(shù),如用樣本均值估計總體均值,樣本比例估計總體比例。用來估計總體參數(shù)的統(tǒng)計量稱為估計量。如果估計總體均值時,樣本均值、樣本中位數(shù)或者樣本眾數(shù),哪一個是最好的估計量?統(tǒng)計學家給出了以下三個評價估計量的標準,滿足這些標準的估計量才是優(yōu)良估計量。三參數(shù)估計(一)無偏性如果估計量的數(shù)學期望等于被估計的總體參數(shù),即則該估計量為無偏估計量。從總體中抽出不同的樣本就可以計算出不同的估計值,估計值與被估計的總體參數(shù)的真實值之間有偏差,但是如果把所有的樣本都抽選出來,估計值的均值等于被估計總體參數(shù)的真實值,也就是說雖然某個估計值與總體參數(shù)有偏差,但平均而言估計是沒有偏差的。三參數(shù)估計(二)有效性估計量的方差越小,則估計就越有效。如果有兩個無偏估計量,具有較小方差的估計量的值更接近總體參數(shù),估計量的所有取值應該集中在被估計總體參數(shù)真實值的周圍,從而使得估計更加準確。三參數(shù)估計(三)一致性一致性就是指隨著樣本容量的增大,估計量的值越來越接近被估計總體的參數(shù)。換句話講,對于一個具有一致性的估計量,一個大容量樣本的估計值要比一個小容量樣本的估計值更接近總體參數(shù)??梢宰C明,樣本均值、樣本比例和樣本方差符合無偏性、有效性和一致性三個標準,它們分別是總體均值、總體比例和總體方差的優(yōu)良估計量。三參數(shù)估計二、參數(shù)估計的方法(一)點估計點估計就是直接將估計量的一個樣本觀察值作為被估計總體參數(shù)的估計值。根據(jù)前面介紹的估計量評價標準,樣本均值、樣本比例以及樣本方差分別是總體均值、總體比例以及總體方差的優(yōu)良估計量,因而隨機抽取一個樣本,計算得到其樣本均值、樣本比例以及樣本方差的具體數(shù)值,即可估計出總體均值、總體比例以及總體方差的數(shù)值。參數(shù)估計的方法有點估計和區(qū)間估計兩種。三參數(shù)估計【例7-7】試用點估計的方法估計這批酸奶的平均容量以及容量的標準差。根據(jù)估計量的評價標準,樣本均值是總體均值的優(yōu)良估計量,因而整批酸奶平均容量的估計值為解某市某乳業(yè)公司欲估計某一批酸奶平均每盒的容量,隨機從生產(chǎn)線中抽取24盒,測得這24盒酸奶的容量如下(單位為mL):239.5240.4239.0241.0237.5239.4239.0238.6238.6240.3239.6240.0237.9238.4239.5239.6238.5240.5240.0239.8239.5240.4240.0240.6三參數(shù)估計點估計的優(yōu)點是能夠提供總體參數(shù)的具體估計值,且方法簡單,但不能說明估計結果的準確程度和置信程度,所以經(jīng)常采用區(qū)間估計的方法。而這些批酸奶每盒容標準差的估計值為三參數(shù)估計(二)區(qū)間估計1.區(qū)間估計的概念在統(tǒng)計分析中,常常用一個區(qū)間及其出現(xiàn)的概率來估計總體參數(shù)。這種估計總體參數(shù)的方法稱為區(qū)間估計。具體地說,區(qū)間估計是用估計量或所構成的區(qū)間來估計總體參數(shù),并以一定的概率保證總體參數(shù)將落在所估計的區(qū)間內。這一概率保證程度稱為置信度,這種估計區(qū)間稱為置信區(qū)間。例如即三參數(shù)估計2.區(qū)間估計的方法及要素1.總體平均數(shù)的區(qū)間估計或2.總體比例的區(qū)間估計或由上述區(qū)間估計公式可概括出區(qū)間估計的基本要素:①估計值或;②抽樣極限誤差或;③置信度(概率保證程度)。三參數(shù)估計3.區(qū)間估計的步驟1)置信度約束下的區(qū)間估計步驟根據(jù)抽樣估計原理,自總體中抽取容量為的樣本,在置信度一定的情況下,我們可以采取如下步驟進行區(qū)間估計(1)明確置信水平()或。常用的置信水平主要有95%,95.45%,99.73%等。(2)確定概率度t(即臨界值水平)。根據(jù)置信度,查標準正態(tài)概率雙側臨界值表確定概率度(臨界值)。(3)計算統(tǒng)計量的值。對總體平均數(shù)進行估計時,要計算樣本平均數(shù)及抽樣平均誤差和允許誤差;對總體比例(比例)進行估計時,要計算樣本比例和抽樣平均誤差及允許誤差,對總體方差進行估計時,要計算樣本修正方差及其抽樣誤差和允許誤差。(4)構造置信區(qū)間。置信區(qū)間是“優(yōu)良的統(tǒng)計量±允許誤差”構成的,對于總體平均數(shù)在某置信度約束下的置信區(qū)間就是“樣本平均數(shù)±允許誤差”。三參數(shù)估計【例7-8】則65-1.86≤≤65+1.86即95%的估計區(qū)間為:63.14≤≤66.86。解某制造廠的產(chǎn)品質量服從正態(tài)分布,其總體標準差=15千克,平均質量未知?,F(xiàn)隨機抽取一個n=250的樣本,計算結果是=65千克。以95%的置信度估計總體平均質量的置信區(qū)間。已知條件為:樣本容量n=250,X~N(65,15);置信水平為95%,查表有:t=1.96。計算結果說明,我們有95%的把握程度認為總體平均數(shù)介于63.14~66.86千克之間。三參數(shù)估計【例7-9】又該廠質量規(guī)定使用壽命在3000小時以下為不合格。(1)按不重復抽樣方法,以95.45%的概率保證程度估計該批燈泡的平均使用壽命。(2)按不重復抽樣方法,以68.27%的置信度估計該批燈泡的合格率。從某廠生產(chǎn)的5000只燈泡中,隨機不重復抽取100只,對其使用壽命進行調查,調查結果見表7-4。表7-4抽取燈泡結果使用壽命/小時組中值x產(chǎn)品數(shù)量fxf()3000以下250025000-148067712003000~4000350030105000-840211680004000~500045005022500016012800005000以上55001899000116024220800

—100434000—53440000三參數(shù)估計樣本標準差解(1)因為。所以,樣本平均數(shù)樣本平均壽命抽樣平均誤差小時小時三參數(shù)估計(2)因為。所以,樣本合格率樣本合格率的抽樣平均誤差總體平均壽命所在的置信區(qū)為:下限4340-144.71=4195.26小時上限4340+144.74=4484.74小時即可以95.45%的概率保證程度估計該批燈泡的平均使用壽命在4484.74~4195.26小時之間。三參數(shù)估計總體合格率所在的置信內間為:下限上限即可以68.27%的置信度估計該燈泡的合格率為96.6%~99.4%三參數(shù)估計【例7-10】廢品率解對某些成品按不重復抽樣方法抽選200件檢查,其中廢品8件,又知樣本容量為成品總量的(1/20)。以95%的概率保證程度估計該批成品的廢品率范圍??傮w比例所在的區(qū)間上下限為上限下限即可以95%的把握程度估計該批成品的廢品率范圍在1.35%~6.65%之間。三參數(shù)估計如果在區(qū)間估計中,先給定允許誤差,我們也可以根據(jù)上述原理,推算出置信區(qū)間和置信度,具體步驟如下:(1)明確極限誤差(允許誤差)。(2)計算樣本統(tǒng)計量。根據(jù)樣本統(tǒng)計量與允許誤差構成估計(置信)區(qū)間,即區(qū)間為[統(tǒng)計量±允許誤差](3)計算抽樣平均誤差。據(jù)允許誤差和抽樣平均誤差的關系求得臨界值,如平均數(shù)的臨界值為(4)確定置信度。查標準正態(tài)概率雙側臨界值表,確定置信區(qū)間所對應的置信概率()水平。2)允許誤差約束下的區(qū)間估計步驟三參數(shù)估計【例7-11】從全校近萬名學生中,隨機抽取100名學生測得其平均身高160cm。根據(jù)以往經(jīng)驗學生身高的標準差為3cm,現(xiàn)要求以最大不超過0.6cm的允許誤差,來估計全體學生的平均身高。解因為所以估計的區(qū)間為[159.4,160.6]。又因為則查正態(tài)概率雙側臨界值表有=0.9545??梢娫搶W校學生平均身高為159.4~160.6cm的可能性有95.45%。三參數(shù)估計三、樣本容量的確定(一)確定樣本容量的意義我們探討一下樣本容量、抽樣誤差及調查費用之間的關系。由于抽樣極限誤差為

,在固定的概率保證度下,樣本容量越大,誤差越小,區(qū)間估計的精度(等于)也越高,但是調查費用也越大。小樣本容量節(jié)省費用但調查誤差大,大樣本容量調查精度高但費用較大,兩者之間如何取舍?在實際工作中,有兩種不同的方案。一種方案是:找出在規(guī)定誤差范圍內的最小樣本容量,這樣確定的樣本容量可以在保證滿足誤差要求下,使得調查費用最??;另一種方案是:找出在限定費用范圍內的最大樣本容量,這樣確定的樣本容量可以保證在滿足費用要求下,使得調查誤差最小。在本節(jié)中,主要討論第一種方案的樣本容量的確定。三參數(shù)估計(二)估計均值時的樣本容量1.總體方差已知,重復抽樣情形因為抽樣極限誤差為,所以這就是在給定抽樣極限誤差和概率保證度下,至少應抽取的樣本容量。三參數(shù)估計2.總體方差已知,不重復抽樣情形這時,因為抽樣極限誤差為,兩邊平方并進行整理,可得:

以上兩種情形都要求方差或樣本方差必須事先知道,但通常樣本容量需要在調查之前確定,而此時方差或樣本方差是未知的。實際工作中,一般按以下方法確定其估計值:(1)用歷史資料中的方差或樣本方差代替。(2)在正式抽樣前進行若干次試驗性調查,用試驗中方差的最大值代替總體方差。注意:計算結果中小數(shù)點通常要向上進位,例如n=50.05,就要取51而不是50。三參數(shù)估計【例7-12】某地碩士研究生畢業(yè)第一年年薪的標準差大約為2000元人民幣。如果以95%的置信度估計其平均年薪,并且希望抽樣極限誤差分別不超過500元和100,重復抽樣條件下樣本容量應為多少?解置信度為95%,查表得t=1.96,標準差=2000元。抽樣極限誤差分別不超過500元時,至少應抽取的樣本容量:

抽樣極限誤差分別不超過100元時,至少應抽取的樣本容量:

三參數(shù)估計(三)估計成數(shù)時的樣本容量假設總體成數(shù)為P,樣本成數(shù)為p。在重復抽樣情況下,樣本成數(shù)的抽樣平均誤差為:兩邊平方并整理后,得到樣本成數(shù)的抽樣極限誤差為:這就是在給定抽樣極限誤差和概率保證度下,至少應抽取的樣本容量。三參數(shù)估計在不重復抽樣情況下,樣本成數(shù)的抽樣平均誤差為:兩邊平方并整理后,得到樣本成數(shù)的抽樣極限誤差為:這就是在給定抽樣極限誤差和概率保證度下,至少應抽取的樣本容量。三參數(shù)估計同樣,以上兩種情形都要總體成數(shù)P或者樣本成數(shù)p必須事先知道,但通常是未知的。實際工作中,一般按以下方法確定其估計值:(1)用歷史資料中樣本成數(shù)p代替。(2)在正式抽樣前進行若干次試驗性調查,用試驗中樣本成數(shù)p代替。(3)在完全缺乏資料的情況下,就取p=0.5。三參數(shù)估計【例7-13】某網(wǎng)站一個由400名使用者組成的樣本表明,該網(wǎng)站的使用者中26%的使用者為女性。在95%的置信度下,若希望將抽樣極限誤差控制在3%,則樣本容量應為多少?解總體單位數(shù)很大,可以看作重復抽樣。已知抽樣極限誤差為3%,,p=95%的置信度,查表得t=1.96,因此,樣本容量至少應為:樣本容量至少應為822人。(人)三參數(shù)估計【例7-14】從一個企業(yè)全部職工中任意抽取400人,計算得知其平均月收入為1400元,標準差為4000元,月工資在1500元以上的職工人數(shù)有244人。如果要求平均工資的允許誤差范圍不超過400元,月工資在1500元以上的職工所占的比重的允許誤差范圍不超過5%,置信度都要求是95.45%,問至少應抽取多少名職工?解本例同時包含了平均數(shù)和成數(shù)的誤差要求,因此應分別計算兩個樣本容量,然后取兩者中的最大者。估計平均工資:標準差為s=4000元,允許誤差范圍不超過400元,即,置信度要求是95.45%,查表得到t=2。因此,樣本容量至少應為:(人)三參數(shù)估計估計月工資在1500元以上的職工所占的比重為:樣本成數(shù),允許誤差范圍不超過5%,即,樣本容量至少應為:所以,為了同時滿足兩個誤差要求,樣本容量至少應為400人。(人)第四節(jié)抽樣調查的組織方式4四抽樣調查的組織方式一、簡單隨機抽樣在進行抽樣調查工作時,必須根據(jù)研究總體本身的特點和抽樣調查的目的要求,對抽取樣本的程序和方式講行周密的設計和安排,這些工作概括來說稱為抽樣調查組織方式。針對不同的調查目的和不同的調查對象特點,應當采用不同的抽樣組織方式。在抽樣調查實踐中常用的組織方式主要有五種,即簡單隨機抽樣、類型抽樣(又稱分層抽樣)、等距抽樣(又稱機械抽樣)、整群抽樣和多階段抽樣。四抽樣調查的組織方式一、簡單隨機抽樣(一)簡單隨機抽樣的概念與特點簡單隨機抽樣又稱純隨機抽樣,它是按照隨機原則直接從全及總體個單位中抽取個單位作為樣本進行調查的組織方式。這種抽樣方式除了需用全及總體單位名單外,基本不需要其他信息。全部抽樣推斷理論都是建立在簡單隨機抽樣基礎上的,因此簡單隨機抽樣是抽樣推斷理論的基礎。四抽樣調查的組織方式從本質上講,簡單隨機抽樣最符合隨機抽樣原則。但從抽樣推斷效果上考察,它的應用卻受到客觀條件的限制。一般來說,它只適用于均勻總體(即具有被研究特征的單位均勻地分布在全及總體的各個部分),且各單位之間被研究標志值的差異較小,總體單位數(shù)較少,且便于編號和抽取。簡單隨機抽樣的不足是沒有充分利用全及總體已知信息或輔助資料;在總體單位很多、編號困難甚至不可能時,無法組織抽樣;有時抽到的單位很分散,致使調查工作十分困難。四抽樣調查的組織方式(二)簡單隨機抽樣下的取樣方法1.直接抽選法在簡單隨機抽樣下,抽取樣本的具體方法主要有直接抽選法、抽簽法和隨機數(shù)表法等。即直接從全及總體中隨機抽取樣本單位的方法。如從糧食倉庫中不同地點取出若干袋糧食進行質量檢驗,從正在教室聽課的坐位不同排不同行的學生中,隨機抽取若干名調查教學情況等。四抽樣調查的組織方式2.抽簽法即先給每個總體單位編號,然后在遵循隨機原則的前提下,采用一定方法抽取號碼(如將各單位號碼寫在紙片上,捏成外表看不到號碼的紙砣,然后隨機取號;用搖號機器取號;或利用隨機數(shù)表取號等),確定中選單位。隨機數(shù)表上數(shù)字的出現(xiàn)及其排列是隨機形式的,從0到9共10個數(shù)字,每個數(shù)字各占1/10,而且表上數(shù)字組成的多位數(shù)(兩位數(shù)、三位數(shù)、四位數(shù)、五位數(shù)等)也有大體相同的出現(xiàn)機會。使用時從表中任一行任一列開始,按照事先設定的樣本單位數(shù)目的位數(shù),依次抽取數(shù)字,直到取夠預定單位數(shù)為止。四抽樣調查的組織方式二、類型抽樣(一)類型抽樣的概念類型抽樣又稱分層抽樣,它是先對調查總體各單位按主要標志加以分組,然后再從各組中按照隨機原則抽取一定數(shù)量的單位組成樣本,進行調查和推斷的一種抽樣組織方式。例如,在學生學習情況抽樣調查中,先按已掌握的學生學習成績將學生分成優(yōu)秀、良好和一般三類,然后按預定樣本容量在各類中抽取學生組成調查樣本;在勞動者工資收入抽樣調查中,先按工作性質將勞動者分為工業(yè)、商業(yè)、交通、教育、衛(wèi)生、農(nóng)業(yè)、公務員等部門,然后再按一定方法抽取預定數(shù)目勞動者組成調查樣本等。四抽樣調查的組織方式類型抽樣中又有類型比例抽樣和類型非比例抽樣兩種。類型非比例抽樣就是分類后確定各類應抽取的樣本單位數(shù)時,不考慮各類單位數(shù)占總體單位數(shù)的比重。而類型比例抽樣則是在分類的基礎上,按照各類單位數(shù)占總體單位數(shù)的比重確定應抽取的樣本單位數(shù)。類型比例抽樣可使樣本變量值的分布結構與總體變量值的分布結構趨向一致,從而進一步提高樣本的代表性,縮小抽樣誤差。一般來說,類型比例抽樣的抽樣平均誤差比完全隨機抽樣小得多。四抽樣調查的組織方式類型比例抽樣實際上是統(tǒng)計分組和隨機抽樣的結合應用。劃分類型時必須界限清楚,準確掌握各類的單位數(shù)及其在總體中的比重;同時,組數(shù)不宜太多。通過分類,把總體中變量值比較接近的單位歸為一類,使各類變量值的分布比較均勻,而且保證各類變量值都有中選機會,這樣抽樣平均數(shù)的變異程度就比較小。在總體各單位變量值差異較大的情況下,運用類型抽樣對比簡單隨機抽樣來說可以取得更理想的效果,因此類型抽樣的特點是樣本代表性強、抽樣誤差小。在一定情況下,必要樣本單位數(shù)可以減少。四抽樣調查的組織方式(二)類型抽樣單位的分配方法1.等比例分類抽樣類型抽樣單位在各類中的分配有等比例和不等比例兩種分配方法。即在對各類分配樣本數(shù)目時,按照各類單位數(shù)在總體單位數(shù)中的比例確定。即某類在樣本總體中占的比重與其在全及總體中所占比重相同。一般來說,這種方法簡便易行,分配比例比較合理,計算方法也很簡便。因此,該方法在實踐中使用較多。四抽樣調查的組織方式2.不等比例分類抽樣不等比例分類抽樣是針對一些特殊情況進行的分類抽樣。如在各類型總體單位數(shù)相差懸殊,等比例抽樣會影響樣本代表性時,可以采用不等比例抽樣方法。再如,當各類中變量值差異程度較大時,也不宜采用等比例抽樣。這時,對變量值差異程度(方差)大的類,應適當多抽樣一些單位;對變量值差異程度(方差)小的類,可適當少抽樣一些單位。四抽樣調查的組織方式(三)類型抽樣推斷步驟類型抽樣推斷工作主要有以下幾個步驟:(1)抽取樣本,計算樣本各類(組)平均數(shù)(成數(shù)).樣本各類(組)平均數(shù):樣本各類(組)成數(shù):四抽樣調查的組織方式(2)計算樣本各類(組)平均數(shù)(成數(shù))方差樣本各類(組)平均數(shù)方差:樣本各類(組)成數(shù)方差:四抽樣調查的組織方式(3)計算樣本平均(成數(shù))組內方差的平均數(shù)樣本平均數(shù)組內方差的平均數(shù):樣本成數(shù)組內方差的平均數(shù)四抽樣調查的組織方式(4)計算類型抽樣樣本平均數(shù)(成數(shù))類型抽樣的樣本平均數(shù)類型抽樣的樣本成數(shù)四抽樣調查的組織方式(5)計算類型抽樣平均誤差類型抽樣平均數(shù)平均誤差類型抽樣成數(shù)平均誤差(重復抽樣)(不重復抽樣)(重復抽樣)(不重復抽樣)四抽樣調查的組織方式【例7-15】某縣有5萬農(nóng)戶,根據(jù)地理情況分為平原和丘陵兩類,其中平原3萬戶,丘陵2萬戶。本年按1%比例抽取樣本單位進行平均年收入調查,調查結果如表7-5所示。要求:(1)以95%的概率估計本年該縣農(nóng)戶平均年收入;(2)估計本年收入達到5萬元的農(nóng)戶比重;(3)若明年仍進行該項調查,概率保證程度為95.45%,允許誤差不超過0.15萬元,應當抽多少農(nóng)戶進行調查,其中平原和丘陵各抽多少戶。表7-5某縣農(nóng)戶年收入抽樣調查資料戶年收入(萬元)2以下2~44~66~88以上合計平原地區(qū)(戶)10501854015300丘陵地區(qū)(戶)20100502010200合計301502356025500四抽樣調查的組織方式(1)估計該縣本年農(nóng)戶平均年收入1)計算樣本各類平均數(shù)平原農(nóng)戶收入平均數(shù):(萬元)解丘陵農(nóng)戶收入平均數(shù):(萬元)四抽樣調查的組織方式2)計算樣本各類平均數(shù)(萬元)四抽樣調查的組織方式3)計算樣本各類平均數(shù)(萬元)平原農(nóng)戶收入方差:四抽樣調查的組織方式(萬元)丘陵農(nóng)戶收入方差:四抽樣調查的組織方式4)計算樣本方差(即組內方差平均數(shù))(萬元)5)計算抽樣平均誤差(萬元)四抽樣調查的組織方式6)計算抽樣極限誤差(萬元)∵∴7)計算抽樣極限誤差(萬元)農(nóng)戶平均年收入下限:農(nóng)戶平均年收入上限:(萬元)四抽樣調查的組織方式(2)估計該縣本年農(nóng)戶平均年收入1)計算類型抽樣成數(shù)平原地區(qū):丘陵地區(qū):四抽樣調查的組織方式2)計算抽樣極限誤差平原地區(qū):平原地區(qū):樣本成數(shù)方差:四抽樣調查的組織方式3)計算樣本成數(shù)抽樣平均誤差4)計算抽樣極限誤差∵∴四抽樣調查的組織方式5)估計本年收入達到5萬元的農(nóng)戶比重農(nóng)戶年收入達5萬元的比重下限:農(nóng)戶年收入達5萬元的比重上限:即農(nóng)戶年收入達5萬元的比重在60.18%~67.82%之間,其可靠程度為95%。四抽樣調查的組織方式(3)計算明年進行同樣調查的樣本容量∵∴不重復抽樣樣本平均數(shù)樣本容量為(戶)四抽樣調查的組織方式三、等距抽樣(一)等距抽樣的概念和特點等距抽樣又稱機械抽樣或系統(tǒng)抽樣。它是事先將全及總體各總體按某種標志排列,然后依固定順序和間隔抽取調查單位的一種抽樣組織形式。等距抽樣方式能使抽取的調查單位更均勻地分布在全及總體中因而其抽樣誤差一般較簡單隨機抽樣小。特別是當研究現(xiàn)象變異程度大,而在實際工作中又不可能抽取更多單位時,等距抽樣比簡單隨機抽樣更有效。四抽樣調查的組織方式(二)等距抽樣方法等距抽樣方法按照將總體單位排隊時所依據(jù)的標志不同,分為無關標志排隊和有關標志排隊兩種。無關標志排隊即指用來排隊的標志與調查研究的目的無關,如研究學生學習情況時將學生按照姓氏筆畫順序排隊。有關標志排隊即指用來排隊的標志與調查研究的目的有關,如研究職工的收入水平時將職工按照職務或技術等級順序排隊。顯然,按有關標志排隊的調查效果會優(yōu)于按無關標志排隊的調查效果。等距抽樣樣本平均數(shù)、抽樣平均誤差、極限誤差以及對全及總體指標的估計等計算方法與簡單隨機抽樣相同。四抽樣調查的組織方式(三)等距抽樣的具體組織1.隨機起點等距抽樣等距抽樣有三種具體組織方法,即隨機起點等距抽樣、半距起點等距抽樣和隨機起點對稱等距抽樣。即根據(jù)事先預定的樣本單位數(shù)n,將全及總體所有單位分成n等份(即n組),每組的單位數(shù),也即抽樣距離為k。抽樣起點在第一組的個單位之間隨機確定。若設第1個抽中單位為第1組的第r個單位,則各抽中單位可表示為第1個抽中單位為第r個單位;第2個抽中單位為第r+k個單位;第3個抽中單位為第r+2k個單位;第4個抽中單位為第r+3k個單位;……確定隨機起點時,要注意回避全及總體的某種規(guī)律性變動,以免產(chǎn)生系統(tǒng)性偏差。四抽樣調查的組織方式2.半距起點等距抽樣半距起點就是選第1組的第個單位k/2為第一個抽取的樣本單位。即第1個抽中單位為第k/2個單位;第2個抽中單位為第k/2

+k個單位;第3個抽中單位為第k/2+2k個單位;第4個抽中單位為第k/2+3k個單位;……半距起點等距抽樣在社會經(jīng)濟調查中應用較廣,但也存在一定局限,這就是隨機性不夠明顯,只有在組距半數(shù)起點系統(tǒng)中的單位才能被抽中。同時,它只能抽出一個樣本,抽樣框的利用率較低,且不能在一個抽樣框中進行交叉樣本和輪換樣本的抽樣設計。四抽樣調查的組織方式3.隨機起點對稱等距抽樣這種方法就是通過隨機起點,系統(tǒng)抽出對稱樣本。它要求每兩個組距合成一個大組,在每兩個組距中對稱抽出兩個樣本單位,而且要求各對稱樣本與其相近的下限或上限的距離是相等的,即都等于r值。其抽樣程序為:①編制抽樣框;②計算組距;③決定隨機起點,即在1-k中,利用隨機數(shù)表或計算機(計算器)中的隨機函數(shù)確定;④計算各樣本單位的位置值,即:第1個抽中單位為第r個單位;第2個抽中單位為第2k-r個單位;第3個抽中單位為第2k+r個單位;第4個抽中單位為第4k-r個單位;第5個抽中單位為第4k+r個單位;……四抽樣調查的組織方式【例7-16】某社區(qū)住戶按家庭年收入高低排隊,然后每隔20戶抽1戶,共抽取100戶,得知他們的家庭年平均收入為30000元,樣本標準差為5000元,試計算該社區(qū)住戶家庭年平均收入的抽樣平均誤差。這是按有關標志排隊的等距抽樣,已知N=2000,n=100,x=30000,sx=5000則解(元)四抽樣調查的組織方式四、整群抽樣(一)整群抽樣的概念和特點整群抽樣是先將全及總體劃分為若子組群,然后從中隨機抽取一些群,對中選群的所有單位進行全面調查的抽樣組織形式。例如,在冷庫裝箱鮮蛋檢驗中,以箱為單位抽出進行檢驗;在人口普查質量檢驗中,以村、鄉(xiāng)或縣為單位進行抽樣檢查;在大量連續(xù)生產(chǎn)的產(chǎn)品質量檢驗中,每隔1小時抽取10分鐘的產(chǎn)品進行檢驗等,都屬于整群抽樣。四抽樣調查的組織方式整群抽樣是在各群間進行抽樣,對中選的群進行全面調查。所以,整群抽樣誤差的大小取決于群間差異(方差)的大小和樣本群數(shù)的多少。在其他條件不變的情況下,各群間平均變異程度越小,則抽樣結果就越準確;同理,抽取的樣本群數(shù)越多,則抽樣誤差就越小。整群抽樣劃分組群時,要注意盡量使各群內單位標志變異較大,而各群間單位標志變異較小。整群抽樣的優(yōu)點是抽選的單位比較集中,調查方便,可以節(jié)省人力、物力和財力。特別適合總體單位很多且缺乏可靠的登記資料(如名冊),或雖可編制抽樣名冊、但費用太高的情況。四抽樣調查的組

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論