抽樣技術(shù)主要概念、術(shù)語與問題(兼作復(fù)習(xí)提綱)(參考答案)_第1頁
抽樣技術(shù)主要概念、術(shù)語與問題(兼作復(fù)習(xí)提綱)(參考答案)_第2頁
抽樣技術(shù)主要概念、術(shù)語與問題(兼作復(fù)習(xí)提綱)(參考答案)_第3頁
抽樣技術(shù)主要概念、術(shù)語與問題(兼作復(fù)習(xí)提綱)(參考答案)_第4頁
抽樣技術(shù)主要概念、術(shù)語與問題(兼作復(fù)習(xí)提綱)(參考答案)_第5頁
已閱讀5頁,還剩7頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、真誠(chéng)為您提供優(yōu)質(zhì)參考資料,若有不當(dāng)之處,請(qǐng)指正。一、主要概念、術(shù)語1、(作為數(shù)據(jù)收集方法的)觀察研究,普查與抽樣調(diào)查,實(shí)驗(yàn)設(shè)計(jì)數(shù)據(jù)收集有三種類型:觀察研究(observational investigations or studies)、普查與抽樣調(diào)查(censuses and sample surveys)、實(shí)驗(yàn)設(shè)計(jì)(Experiment Designs)。在觀察研究中,把觀察到的事實(shí)都記錄下來,而不考慮或很少考慮它們對(duì)總體的代表性。在普查與抽樣調(diào)查中,基于樣本代表性的觀念,把對(duì)總體或樣本中的每一個(gè)成員進(jìn)行觀察得到的事實(shí)記錄下來。在實(shí)驗(yàn)設(shè)計(jì)中,涉及實(shí)驗(yàn)條件的控制。一個(gè)有控制的實(shí)驗(yàn)應(yīng)滿足三個(gè)條

2、件,而觀察數(shù)據(jù)(observational data)至少不滿足其中一條:(a) 實(shí)驗(yàn)在相同的條件下重復(fù)進(jìn)行,從而產(chǎn)生一個(gè)非控制誤差(uncontrolled variation)的測(cè)度;(b) 重復(fù)實(shí)驗(yàn)是相互獨(dú)立的;(c) 重復(fù)實(shí)驗(yàn)所產(chǎn)生的非控制誤差源于實(shí)驗(yàn)的隨機(jī)化性質(zhì)??瓶藗愓J(rèn)為觀察研究有兩個(gè)顯著的特征:(a) 其目的是研究可能存在的因果關(guān)系(cause-effect relationships);(b) 這種研究通過將研究對(duì)象以預(yù)先確定的非隨機(jī)方式分成不同的處理組。但事實(shí)上,來自觀察研究的數(shù)據(jù)不能用于檢驗(yàn)是否存在因果關(guān)系它僅能暗示這種關(guān)系,其程度影響是否值得進(jìn)一步的實(shí)驗(yàn)設(shè)計(jì)。“觀察研究”

3、最一般的含義是“任何非實(shí)驗(yàn)研究”(any investigation that is not an experiment),包括總體的描述性調(diào)查(即抽樣調(diào)查),其基本特征即未對(duì)研究對(duì)象作任何方式的處理或操縱。自Wold與Cochran始,“觀察研究”則用于指稱上述集合中的一個(gè)子集:即那些目的在于對(duì)假設(shè)的因果關(guān)系(cause-effect relationship)的研究。2、非概率抽樣;判斷抽樣,方便抽樣,自愿樣本,配額抽樣,滾雪球抽樣偶遇抽樣(方便抽樣)(便利樣本)即事先不預(yù)定樣本,碰到即問或自動(dòng)回答者。例如:未經(jīng)許可的街頭隨訪或攔截式訪問,野生動(dòng)物的捕獲。這是抽樣之初始觀念形態(tài),觸目皆是。

4、既不求(不愿,不能)問題之甚解,當(dāng)不以科學(xué)的態(tài)度對(duì)待。判斷抽樣(立意樣本)即基于調(diào)研者對(duì)總體的了解和經(jīng)驗(yàn),從總體中抽選有代表性的典型的單位作為樣本。例如:對(duì)民間代表,意見領(lǐng)袖,學(xué)者,專家的訪談。該方法常為社會(huì)學(xué)研究采用。是否典型,非外行所能把握。故此法不宜為統(tǒng)計(jì)學(xué)研究所用也。配額抽樣即按母體某些特征予以配置樣本,但抽樣時(shí)卻由調(diào)查員任意抽取。例如:1921年意大利人口普查。此法曾迷惑了統(tǒng)計(jì)學(xué)家的智慧,但終于有建議以“分層隨機(jī)抽樣”取而代之。滾雪球抽樣(滾式樣本)(輻射樣本)即利用樣本尋找樣本。例如:都市中的原住民土著人樣本。樣本已是如此的稀有,再要求得方法之“科學(xué)”即為奢望。此外,有一所謂“逆抽

5、樣”的概率抽樣方法試圖解決之。3、概率抽樣;有限總體,樣本及其四種類型,選取概率;抽樣設(shè)計(jì);抽樣單位,目標(biāo)單位,抽樣框即。其中,為一確定的有限總體,它是標(biāo)號(hào)的序列;是所有可能的樣本的集合,是某些標(biāo)號(hào)的序列,它是有順序的或無順序的,它是有重復(fù)的或無重復(fù)的,在這樣的意義下,是確定的;是選取概率的集合,是取中樣本的概率,它也是確定的。也可記為,稱抽樣設(shè)計(jì)。一個(gè)抽樣單元或直接是抽樣總體中的一個(gè)個(gè)體的具體表現(xiàn)或其對(duì)應(yīng)之物,或是抽樣總體中的一個(gè)個(gè)體集的具體表現(xiàn)或其對(duì)應(yīng)之物。抽樣單元可以有層次結(jié)構(gòu):初級(jí)單元由二級(jí)單元構(gòu)成。目標(biāo)單位組成目標(biāo)總體,抽樣單位(單元)組成抽樣總體。目標(biāo)總體是所要研究對(duì)象的全體,抽樣

6、總體是從中抽取樣本的總體,它們?cè)趯?shí)踐中并非皆一致。抽樣框由抽樣單元組成,是抽樣總體的具體表現(xiàn)或其對(duì)應(yīng)之物。常有名錄框,區(qū)域框,自然框;可為多重抽樣框。4、均方誤差(MSE),估計(jì)量的方差,估計(jì)量的偏差以估計(jì),所產(chǎn)生的均方誤差(Mean Squared Error,MSE)定義為,所產(chǎn)生的估計(jì)量的方差定義為,所產(chǎn)生的估計(jì)量的偏差定義為。三者之間存在如下關(guān)系:。5、抽樣誤差,非抽樣誤差抽樣誤差是由于抽取樣本的隨機(jī)性造成的樣本值與總體值之間的差異,只要采用抽樣調(diào)查,抽樣誤差就不可避免。抽樣誤差是一個(gè)一般性的概念,它可以用估計(jì)量的方差或估計(jì)量的標(biāo)準(zhǔn)差度量。在抽樣調(diào)查中,抽樣誤差可以控制,其基本方法是改

7、變樣本容量。非抽樣誤差是相對(duì)于抽樣誤差而言的,它的產(chǎn)生不是由于抽樣的隨機(jī)性,而是由于其他多種原因引起的估計(jì)值與總體參數(shù)之間的差異。這些原因主要分為三類:抽樣框引起的誤差,無回答引起的誤差,計(jì)量工具引起的測(cè)量誤差。6、SRSWOR(數(shù)學(xué)定義,直觀定義)SRSWOR的數(shù)學(xué)定義:為有限總體,記為的所有子集,。如果樣本的選取概率為:則稱此抽樣設(shè)計(jì)為不放回的簡(jiǎn)單隨機(jī)抽樣(SRSWOR, Simple Random Sampling Without Replacement)。SRSWOR的直觀定義:為有限總體,逐個(gè)不放回地抽取次:每次抽取時(shí),總體中余下的單元被抽中的概率相等。7、樣本的三種形式樣本的三種形

8、式可分別記為:,。其中,是標(biāo)號(hào)的集合,之下標(biāo)沒有獨(dú)立的意義;,是標(biāo)號(hào)的序列,分別是第次抽中的標(biāo)號(hào);是維隨機(jī)向量,定義如下:8、分層抽樣,分層隨機(jī)抽樣分層抽樣是這樣一類概率抽樣,其中:,即有限總體可分為層;,即樣本從各層獨(dú)立抽?。皇墙o定的選取概率的集合,但如何確定卻又各種方法。分層隨機(jī)抽樣是這樣一類概率抽樣,其中:,即有限總體可分為層;,即樣本從各層獨(dú)立抽?。皇墙o定的選取概率的集合,且,即各層樣本以SRSWOR方式抽取。9、樣本的代表性樣本的代表性即樣本對(duì)總體的代表性。歷史上,關(guān)于樣本的代表性有兩種不同的觀點(diǎn)。一種觀點(diǎn)可稱之為立意選?。≒urposive Selection),即最具代表性的樣本

9、應(yīng)與總體在主要變量方面結(jié)構(gòu)一致。另一種觀點(diǎn)可稱之為隨機(jī)抽?。≧andom Selection),即樣本應(yīng)以概率抽樣方式隨機(jī)取出,其對(duì)總體的代表性則以估計(jì)量的均方誤差度量。兩種觀點(diǎn)的分歧隨Jerzy Neyman于1934年以論文“On the Two Different Aspects of the Representative Method:The Method of Stratified Sampling and the Method of Purposive Selection”建立抽樣理論而消彌。所謂樣本的代表性,即只有以概率抽樣方式取得的樣本,方可用估計(jì)量的均方誤差度量其對(duì)總體的代表

10、性。10、按比例分配樣本,奈曼分配,最優(yōu)分配按比例分配樣本即以方式分配樣本,奈曼(Neyman)分配即以方式分配樣本,最優(yōu)分配即以方式分配樣本。當(dāng)費(fèi)用函數(shù)為線性形式時(shí),最優(yōu)分配將在給定費(fèi)用時(shí)使估計(jì)量的方差最小或在給定方差時(shí)使費(fèi)用最小。11、查特吉法,累計(jì)法查特吉(Chatterjee)法是用于解決多目標(biāo)變量情況下樣本分配問題的一種方法。大略如下:累計(jì)法是用于確定分層界限的一種常用方法。例示如下:12、事后分層在抽樣設(shè)計(jì)中,當(dāng)幾個(gè)輔助變量都適宜于分層時(shí)(各層比重已知),一個(gè)單位屬于哪一層要在數(shù)據(jù)收集到以后才知道(或:各層沒有抽樣框),因此不能在抽取樣本時(shí)采用分層抽樣。此時(shí),可在抽取時(shí)采用,但在估

11、計(jì)時(shí)采用分層估計(jì)量。比如,估計(jì)總體均值的事后分層估計(jì)量為,其中,。與一般分層估計(jì)量不同的是,此處,為隨機(jī)變量。13、簡(jiǎn)單估計(jì),(分別、聯(lián)合)比率估計(jì),(分別、聯(lián)合)回歸估計(jì),簡(jiǎn)單估計(jì)是指當(dāng)沒有任何輔助信息的情況下,樣本以SRSWOR方式抽取,估計(jì)量為樣本數(shù)據(jù)的線性組合,為各抽中單位所賦權(quán)重是相同的。具體而言,指以,或估計(jì)總體均值,以估計(jì)總體總值。比率估計(jì)是用輔助信息改進(jìn)估計(jì)程序的一種方法。在樣本以SRSWOR方式抽取的條件下,比率估計(jì)以估計(jì)總體比率,以估計(jì)總體均值,以估計(jì)總體總值。若樣本以分層隨機(jī)抽樣方式取得(即輔助信息用于抽樣設(shè)計(jì)),比率估計(jì)可以兩種方式進(jìn)行。以總體均值的估計(jì)為例,乃分別比率

12、估計(jì),乃聯(lián)合比率估計(jì)。回歸估計(jì)是用輔助信息改進(jìn)估計(jì)程序的一種方法。在樣本以SRSWOR方式抽取的條件下,回歸估計(jì)以(為已知的數(shù))或(為樣本回歸系數(shù))估計(jì)總體均值。若樣本以分層隨機(jī)抽樣方式取得(即輔助信息用于抽樣設(shè)計(jì)),比率估計(jì)可以兩種方式進(jìn)行。以總體均值的估計(jì)為例,(為已知的數(shù))或(為樣本回歸系數(shù))乃分別回歸估計(jì),(為已知的數(shù))或(其中,)乃聯(lián)合回歸估計(jì)。14、(總體、樣本)回歸系數(shù)總體回歸系數(shù)定義為:樣本回歸系數(shù)定義為:15、整群抽樣,群內(nèi)相關(guān)系數(shù),設(shè)計(jì)效應(yīng)當(dāng)在實(shí)際中準(zhǔn)備采用某種抽樣方式,或者如果對(duì)此尚未作出決定,正在考慮采用某種抽樣方式時(shí),應(yīng)該經(jīng)常把這些抽樣方式下采用的各種不同單位加以比較

13、。當(dāng)較大的抽樣單位由若干目標(biāo)總體單位組成時(shí),這種較大的抽樣單位可稱為群。一旦某一抽樣單位被取中,則組成該抽樣單位的所有目標(biāo)總體單位皆被調(diào)查,這種抽樣稱整群抽樣。群內(nèi)相關(guān)系數(shù)定義如下:其中可用估計(jì),可用估計(jì)。在規(guī)模相等的整群抽樣中,群內(nèi)相關(guān)系數(shù)用于表示其抽樣效率:即整群抽樣的抽樣效率為。設(shè)計(jì)效應(yīng)指與SRSWOR相比,其他抽樣設(shè)計(jì)的設(shè)計(jì)效應(yīng)。設(shè)計(jì)效應(yīng)定義為:,是其他抽樣設(shè)計(jì)的估計(jì)量的方差,是SRSWOR的估計(jì)量的方差。16、有放回不等概率抽樣,抽取概率,PPS抽樣,HH估計(jì)有放回不等概率抽樣是這樣一類概率抽樣,其中,中之乃有放回抽取所得,且存在,使。抽取概率(drawing probability

14、)定義為:,指當(dāng)容量為的樣本被逐次取出時(shí),第次取到標(biāo)號(hào)的概率。PPS抽樣按如下方式抽取容量為的樣本:(1)以同樣的方式有放回抽取次;(2)每一次都有與抽樣單元大小成比例的抽取概率:。HH估計(jì)指PPS抽樣中,以估計(jì)量估計(jì)總體總值,其中乃對(duì)第次所取到的抽樣單元調(diào)查所得的數(shù)據(jù),乃第次所取到的抽樣單元的相對(duì)大小。17、不放回不等概率抽樣,(一階、二階)包含概率,PS抽樣,HT估計(jì),布魯爾法,水野法,耶茨格倫迪法,Raj估計(jì)量不放回不等概率抽樣是這樣一類概率抽樣,其中,中之乃不放回抽取所得,且存在,使。一階包含概率(1-level inclusion probability)定義為: ,即抽樣單元在樣本

15、中的概率。二階包含概率(2-level inclusion probability)定義為: ,即抽樣單元、在樣本中的概率。PS抽樣按如下方式抽取容量為的樣本:(1)樣本以不放回的方式抽??;(2)一階包含概率(1-level inclusion probability)與抽樣單元大小成比例:。HT估計(jì)指PS抽樣中,以估計(jì)量估計(jì)總體總值,其中乃對(duì)樣本中抽樣單元調(diào)查所得的數(shù)據(jù),乃抽樣單元的一階包含概率。布魯爾(Brewer)法以如下步驟抽取樣本:其一階、二階包含概率為:水野(Midzuno)法以如下步驟抽取樣本:其一階、二階包含概率為:耶茨格倫迪(Yates-Grundy)方法以如下步驟抽取樣本:

16、其一階、二階包含概率并無一般計(jì)算公式,故不用HT估計(jì)而用Des Raj估計(jì):二、主要問題1、抽樣調(diào)查主要有哪些作用?(見教材P6)2、抽查調(diào)查與普查相互關(guān)系如何?表現(xiàn)在哪些方面?(見教材P7)3、抽樣框有哪些主要類型?試各舉一例。(見教材P910)4、試分析估計(jì)量的偏差對(duì)統(tǒng)計(jì)推斷的可靠性的影響。實(shí)際工作中,當(dāng)時(shí),此影響可忽略不計(jì)。5、試分析估計(jì)量的偏差對(duì)基于MSE的統(tǒng)計(jì)推斷的可靠性的影響。實(shí)際工作中,當(dāng)時(shí),此影響可忽略不計(jì)。6、為什么在確定樣本容量時(shí)需預(yù)先估計(jì)總體方差?總體方差的預(yù)先估計(jì)一般有哪些方法?樣本容量根據(jù)調(diào)查要求或確定。調(diào)查要求的方差記為,估計(jì)量的方差為,通過以確定樣本容量。但的理論

17、公式與總體方差有關(guān),一般用樣本方差估計(jì),但樣本尚未取出,故實(shí)際是不可用樣本數(shù)據(jù)估計(jì)的,故需預(yù)先估計(jì)??傮w方差可用如下方式預(yù)先估計(jì):(1)分兩步抽取樣本,先有一個(gè)含量為 的簡(jiǎn)單隨機(jī)樣本,從它估計(jì)和,然后得所要的;(2)采用試點(diǎn)調(diào)查的結(jié)果;(3)采用以前同一總體或同類總體抽樣的結(jié)果;(4)猜測(cè)總體的結(jié)構(gòu),并利用數(shù)學(xué)的結(jié)論。7、采用分層抽樣有哪些實(shí)際理由?使用“分層抽樣”的實(shí)際理由通常有(Cochran,P128):(1)如果需要有總體的某些分類數(shù)據(jù),且要具有規(guī)定的精確度,則將每一個(gè)分類看作一個(gè)“總體”是合適的。(2)為便于行政管理而要求分層。(3)總體的各個(gè)不同部分的抽樣問題可能顯著地不同。(4)

18、分層可能提高整個(gè)總體參數(shù)估計(jì)值的精確度。8、歷史上關(guān)于樣本代表性有哪些不同觀點(diǎn)?你如何理解樣本代表性?歷史上,關(guān)于樣本的代表性有兩種不同的觀點(diǎn)。一種觀點(diǎn)可稱之為立意選?。≒urposive Selection),即最具代表性的樣本應(yīng)與總體在主要變量方面結(jié)構(gòu)一致。另一種觀點(diǎn)可稱之為隨機(jī)抽取(Random Selection),即樣本應(yīng)以概率抽樣方式隨機(jī)取出,其對(duì)總體的代表性則以估計(jì)量的均方誤差度量。兩種觀點(diǎn)的分歧隨Jerzy Neyman于1934年以論文“On the Two Different Aspects of the Representative Method:The Method of Stratified Sampling and the Method of Purposive Selection”建立抽樣理論而消彌。所謂樣本的代表性,即只有以概率抽樣方式取得的樣本,方可用估計(jì)量的均方誤差度量其對(duì)總體的代表性。9、試比較分析簡(jiǎn)單隨機(jī)抽樣(SR

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論