第七章第一次課抽樣原理與方法_第1頁
第七章第一次課抽樣原理與方法_第2頁
第七章第一次課抽樣原理與方法_第3頁
第七章第一次課抽樣原理與方法_第4頁
第七章第一次課抽樣原理與方法_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、授課章節(jié)第七章 抽樣原理與方法授課對象生物科學本科授課時數(shù)2學時授課時間第三學年下學期授課地點教學樓教學目的與要求掌握: 抽樣誤差的估計 ,樣本容量的確定 , 抽樣的基本方法 ,抽樣方案的制定。 熟悉:抽樣方案的制定。了解:調(diào)查研究的質(zhì)量控制;常用的調(diào)查研究方法教學重點與難點重點:抽樣方案制定的基本原則與內(nèi)容以及常用的抽樣研究方法。難點:抽樣誤差、樣本容量的確定。教學方法與組織安排教學方法:課堂講授為主。 時間安排:教學教師講授內(nèi)容85分鐘,課堂提問5分鐘。教學方法講授、課件、舉例 。教具多媒體教學提綱、課堂小結與課后練習一、教學提綱 1抽樣誤差的估計1.1樣本平均數(shù)的標準誤和置信區(qū)間1.2樣

2、本頻率的標準誤和置信區(qū)間2樣本容量的確定2.1平均數(shù)資料樣本容量的確定2.2頻率資料樣本容量的確定3.2成對資料和非成對資料樣本容量的確定3抽樣的基本方法3.1隨機抽樣3.2順序抽樣3.3典型抽樣4抽樣方案的制定1、抽樣方案制定的基本內(nèi)容:1.1確定調(diào)查目的和指標1.2確定調(diào)查對象和觀察單位1.3確定調(diào)查方法1.4估計樣本含量和抽樣分數(shù)1.5 總體單位編號2調(diào)查表的制定3抽樣調(diào)查的組織工作二、課堂小結對于客觀存在的現(xiàn)象進行直接或間接的詢問和觀察的研究方法統(tǒng)稱為調(diào)查研究.其主要特點是沒有人為地施加處理因素,而只能“被動”地觀察客觀實在.調(diào)查設計就是對整個調(diào)查研究做出完整的計劃,包括搜集資料,整理

3、資料和分析資料的計劃.其關鍵是調(diào)查表的制定,調(diào)查方法的選擇和樣本含量估計.其中調(diào)查計劃主要包括確定調(diào)查目的和指標,確定調(diào)查對象和觀察單位,確定調(diào)查方法,確定調(diào)查資料搜集方式,擬訂調(diào)查項目和調(diào)查表,估計樣本含量,制定調(diào)查的組織計劃.常用的抽樣方法為簡單隨機抽樣,系統(tǒng)抽樣,分層抽樣和整群抽樣. 第一節(jié) 抽樣方案的制定 在科學研究中,除了進行控制試驗外,有時也要進行調(diào)查研究。調(diào)查研究是對已有的事實通過各種方式進行了解,然后用統(tǒng)計的方法對所得數(shù)據(jù)進行分析,從而找出其中的規(guī)律性。例如,了解畜禽品種及水產(chǎn)資源狀況;探索和分析對某種疾病有效的防治規(guī)律、措施以及新的檢驗手段和方法等。由于現(xiàn)場調(diào)查立足于生產(chǎn)實際

4、,所以它是研究和解決實際問題的一種重要研究方法。同時,控制試驗的研究課題,往往是在調(diào)查研究的基礎上確定的;試驗研究的成果,又必須在其推廣應用后經(jīng)調(diào)查得以驗證。 為了使調(diào)查研究工作有目的、有計劃、有步驟地順利開展,必須事先擬定一個詳細的調(diào)查計劃。調(diào)查計劃應包括以下幾個內(nèi)容: (一) 調(diào)查研究的目的 任何一項調(diào)查研究都要有明確的目的,即通過調(diào)查了解什么問題,解決什么問題。例如,家畜健康狀況的調(diào)查的目的是評定家畜健康水平;畜禽品種資源調(diào)查的目的是了解畜禽品種的數(shù)量、分布與品種特征特性等情況。同時,調(diào)查研究的目的還應該突出重點,一次調(diào)查應針對主要問題收集必要的數(shù)據(jù),深入分析,為主要問題的解決提出相應的

5、措施和辦法。 (二) 調(diào)查的對象與范圍 根據(jù)調(diào)查的目的,確定調(diào)查的對象、地區(qū)和范圍,劃清調(diào)查總體的同質(zhì)范圍、時間范圍和地區(qū)范圍。例如,四川省家禽品種資源調(diào)查,調(diào)查地區(qū)為四川省,調(diào)查總體和對象為全省各市、縣的家禽,調(diào)查時間從2000年1月到2000年12月。 (三) 調(diào)查的項目 調(diào)查項目的確定要緊緊圍繞調(diào)查目的。調(diào)查項目確定的正確與否直接關系到調(diào)查的質(zhì)量。因此,項目應盡量齊全,重要的項目不能漏掉;項目內(nèi)容要具體、明確,不能模棱兩可。應按不同的指標順序以表格形式列示出來,以達到順利完成搜集資料的目的。例如,家禽品種資源調(diào)查項目有:種類(雞、鴨、鵝等)、品種(柴雞、來航、白洛克等),數(shù)量、體重、產(chǎn)蛋

6、性能等項目。 調(diào)查項目有一般項目和重點項目之分。一般項目主要是指調(diào)查對象的一般情況,用于區(qū)分和查找,如畜主姓名、住址及編號等。重點項目是調(diào)查的核心內(nèi)容,如品種資源調(diào)查中的品種、數(shù)量及生產(chǎn)性能等。調(diào)查表的形式分為一覽表和卡片,當調(diào)查的指標較少時多采用一覽表的形式,它可以填入許多調(diào)查動物情況。若調(diào)查的內(nèi)容多而復雜時可采用卡片的形式,一張卡片只填一個對象,以便匯總和整理,或輸入計算機。 (四) 樣本含量 在抽樣調(diào)查研究時,樣本含量的大小關系到調(diào)查結果的精確性。樣本含量太大,需耗費較多的人力、物力及資金;樣本含量太小,增大了偶然性,使抽樣誤差大,影響調(diào)查結果的精確性。確定樣本含量的方法將在本章第十節(jié)介

7、紹。 (五) 調(diào)查方法 調(diào)查分為全面調(diào)查和抽樣調(diào)查兩種。全面調(diào)查就是對總體的每一個個體逐一調(diào)查,其涉及的范圍廣、時間長、工作量大,因而需耗費大量的人力、物力和時間。 抽樣調(diào)查是指在全體調(diào)查對象中,通過某種方法抽取部分的有代表性的對象作調(diào)查,并以樣本去推斷總體。抽樣方法常用的有以下5種:1、完全隨機抽樣 首先將有限總體內(nèi)的所有個體全部編號,然后用抽簽或用隨機數(shù)字表的方法,隨機抽取若干個個體作為樣本。如欲抽樣調(diào)查某豬場母豬繁殖性能,應先將母豬逐一編號,再用抽簽或隨機數(shù)字表按所需數(shù)量抽樣,抽取的每一個體均為調(diào)查對象。完全隨機抽樣適用于個體均勻程度較好的總體。2、順序抽樣 也稱系統(tǒng)抽樣或機械抽樣。先將

8、有限總體內(nèi)的每個個體按其自然狀態(tài)編號,然后根據(jù)調(diào)查所需的數(shù)量,按一定間隔順序抽樣。如對某牧場500只奶山羊進行傳染性無乳癥的調(diào)查,抽查50只??砂淳幪栱樞蛎扛?0只抽一只,但第一個調(diào)查號應從110中隨機選取。此法簡便易行,適用于個體分布均勻的總體。3、分等按比例隨機抽樣 分等按比例隨機抽樣又稱分層按比例隨機抽樣。先按某些特征或變異原因?qū)⒊闃涌傮w分成若干等次(層次),在各等次(層次)內(nèi)按其占總體的比例隨機抽得各等次(層次)的樣本,然后將各等次(層次)抽取的樣本合并在一起即為整個調(diào)查樣本。如對某地奶山羊傳染性無乳癥的調(diào)查,經(jīng)初步了解得知,在欲調(diào)查的整個地區(qū)中,該病感染率為80%-90%的地區(qū)占10

9、%,感染率為60%-80%的地區(qū)占60%,感染率為20%-50%的地區(qū)占30%。若調(diào)查200只山羊,則應采用按比例分等抽樣,在感染率為80%-90%的地區(qū)隨機抽取20只,感染率為60%-80%的地區(qū)隨機抽取120只,感染率為20%-50%的地區(qū)隨機抽取60只。分等按比例隨機抽樣法能有效地降低抽樣誤差,適用于總體分布不太均勻或個體差異較大的總體。但分等不正確,會影響抽樣的精確性。4、隨機群組抽樣 此種抽樣是把總體劃分成若干個群組,然后以群組為單位隨機抽樣。即每次抽取的不是一個個體,而是一群動物。每次抽取的群體可大小不等,但應對被抽取群體的每一個個體逐一進行調(diào)查。隨機群組抽樣容易組織,節(jié)省人力、物

10、力,適用于群體差異較大,分布不太均勻的總體。5、多級隨機抽樣 當調(diào)查的總體很大、并可以系統(tǒng)分組時,常采用多級隨機抽樣的方法。例如,調(diào)查某城市奶牛305天的1胎產(chǎn)奶量,可采用三級抽樣:農(nóng)場為初級抽樣單位,分場為二級抽樣單位,奶牛個體為三級抽樣單位。多級抽樣可以估計各級的抽樣誤差和探討合理的抽樣方案。 (六) 調(diào)查的組織工作 調(diào)查研究是一項比較復雜的工作,要動員組織大量的人力,需要一定的經(jīng)費,安排一定的時間,因此,應做好人員分工、經(jīng)費預算、調(diào)查進程安排、調(diào)查表的準備及調(diào)查資料的整理等項工作,如此才能保證調(diào)查研究工作有計劃、有步驟地完成。一般在正式調(diào)查前,需進行預調(diào)查,以檢驗調(diào)查設計的可行性,并培訓

11、參予調(diào)查的工作人員,以統(tǒng)一標準和方法。 調(diào)查時若發(fā)現(xiàn)問題,應立即解決。特別要對資料進行檢查,保證資料完整、正確,如發(fā)現(xiàn)遺漏、錯誤應及時補充、糾正。資料檢查無誤后,應妥善保存,避免丟失。第二節(jié) 樣本含量的確定 如果我們要求調(diào)查研究或試驗結果精確性高,則樣本含量就要大,并且越大越好。但若樣本太大,就會花費過多的人力、物力和時間。特別是破壞性試驗,如畜牧試驗中豬、牛羊等動物的屠宰試驗。即使不是破壞性試驗,如在農(nóng)村進行活豬體重調(diào)查時,抓豬、拴豬也容易發(fā)生掉膘現(xiàn)象。所以,在實際調(diào)查與試驗研究中,卻要求樣本越小越好。但樣本太小必然影響精確性。因此,需要研究在一次調(diào)查或試驗中如何確定適宜樣本含量的問題。一、

12、調(diào)查研究中樣本含量的估計(一) 平均數(shù)抽樣調(diào)查的樣本含量估計 目前對調(diào)查研究所需樣本含量,還沒有一個精確的估計方法。根據(jù)以往研究,一般要求樣本含量占抽樣總體的5%為最小量,對變異較小的群體,則可低于5%。斯丹(C. Stein)認為,調(diào)查樣本含量與調(diào)查要求的準確性高低及所研究對象的變異度大小有關。因此,需要提出我們能夠接受的允許誤差,并初步了解調(diào)查指標變異度的大小。由標本平均數(shù)與總體平均數(shù)差異顯著性檢驗的t檢驗公式推出的樣本含量計算公式為: (12-9)式中:n為樣本含量; 為自由度n-1、兩尾概率為的臨界t值; S為標準差,由經(jīng)驗或小型調(diào)查估得; d為允許誤差,可根據(jù)調(diào)查要求的準確性確定;

13、1-為置信度。 在首次計算時,可先用df=時 (當置信度為95%時,t= t0.05=1.96;置信度為99%時,= t0.01=2.58)值代入,若算得n<30,再用df=n-1的代入計算,直到n穩(wěn)定為止。 【例12.9】 進行南陽黃母牛體高調(diào)查,已測得南陽黃母牛的體高的標準差S=4.07cm,今欲以95%的置信度使調(diào)查所得的樣本平均數(shù)與總體平均數(shù)的允許誤差不超過0.5cm,問需要抽取多少頭黃牛組成樣本才合適? 已知:S=4.07, d=0.5, 1-=0.95,先取t0.05=1.96,代入(12-9)式,得: n=1.962×4.072/0.52=254.54255 (頭

14、) 即對南陽黃母牛體高進行調(diào)查,至少需要調(diào)查255頭,才能以95%的置信度使調(diào)查所得樣本平均數(shù)與總平均數(shù)相差不超過5cm。 (二) 百分數(shù)抽樣調(diào)查樣本含量估計 如果我們調(diào)查的目的是對服從二項分布的總體百分數(shù)作出估計,由樣本百分數(shù)與總體百分數(shù)差異顯著性檢驗檢驗公式推出樣本含量計算公式為: (12-10)式中:n為樣本含量; p為總體的百分數(shù); q=1-p; 為兩尾概率為的臨界值,0.05=1.96, 0.01=2.58; d為允許誤差(-p),為樣本百分率,可由經(jīng)驗得出; 1-為置信度。 總體百分數(shù)如果事先未知,可先從總體中調(diào)查一個樣本估計?;蛄頿=0.5進行估算。 【例12.10】 欲了解某地

15、區(qū)雞新城疫感染率,已知道通常感染率約60%,若規(guī)定允許誤差為3%,取置信度1-=0.95,問至少需要調(diào)查多少只雞? 將 p=0.6, q=1-p=1-0.6=0.4, d=0.03, =1.96, 代入 (12-10) 式,得: n=1.962×0.6×0.4/0.0331025 (只) 即至少需要調(diào)查1025只雞,才能以95%的置信度使調(diào)查所得的樣本百分數(shù)與總體百分數(shù)相差不超過0.03。 此外,當樣本百分數(shù)接近0%或100%時,分布呈偏態(tài),應對x作轉(zhuǎn)換。此時估算公式為: (12-11) 【例12.11】 某地需抽樣調(diào)查牛結膜炎發(fā)病率,已知通常發(fā)病率為2%,若規(guī)定允許誤差為

16、0.1%,取置信度1-=0.95,問至少需要調(diào)查多少頭牛? 將 p=0.02, d=0.001, =1.96, 代入(12-11)式,得:(頭) 即至少需要調(diào)查1505頭牛,才能以95%的置信度使估計出的牛結膜炎發(fā)病率誤差不超過0.1%。二、試驗研究中重復數(shù)的估計 (一) 配對設計中重復數(shù)的估計 由配對設計t檢驗公式導出: (12-12)式中:n為試驗所需動物對子數(shù),即重復數(shù); 為差數(shù)標準誤,根據(jù)以往的試驗或經(jīng)驗估計; 為自由度n-1、兩尾概率為的臨界t值;為要求預期達到差異顯著的平均數(shù)差值();1-為置信度。 首次計算時以df=的值代入計算,若n15,則以df=n-1的t值代入再計算,直到n

17、穩(wěn)定為止。 【例12.12】 比較兩個飼料配方對豬增重的影響,配對設計,希望以95%的置信度在平均數(shù)差值達到1.5 kg時,測出差異顯著性。根據(jù)以往經(jīng)驗=2 kg,問需要多少對試驗家畜才能滿足要求? 將t0.05()=1.96, =2, =1.5代入 (12-12) 式,得: n=1.962×22/1.527(對) 因為n<15,再以df=7-1=6時,t0.05=2.477代入 (12-12) 式:n=2.4772×22/1.5211(對) 再以n=11, df=11-1=10時,t0.05=2.2代入 (12-12) 式:n=2.22×22/1.529(

18、對) 再以n=9, df=8時,t0.05=2.3代入(12-12) 式:n=2.32×22/1.529(對) n已穩(wěn)定為9,故該配對試驗至少需9對試驗家畜才能滿足試驗要求。 (二) 非配對試驗重復數(shù)的估計 對于隨機分為兩組的試驗,若n1=n2,可由非配對t檢驗公式導出: (12-13)式中:n為每組試驗動物頭數(shù),即重復數(shù); 為df=2(n-1)、兩尾概率為的臨界t值; 為標準差,根據(jù)以往的試驗或經(jīng)驗估計;()為預期達到差異顯著的平均數(shù)差值;1-為置信度。 首次計算時,以df=時的值代入計算,若算出的n15,則以df=2(n-1)的值代入再計算,直到n穩(wěn)定為止。 【例12.13】 對

19、【例12.12】,若采用非配對設計,根據(jù)以往經(jīng)驗S=2 kg,希望以95%的置信度在平均數(shù)差值達到1.5 kg時,測出差異顯著性,問每組至少需要多少頭試驗家畜才能滿足要求? 將t0.05()=1.96,=2,=1.5代入 (12-13) 式得:n=2×1.962×22/1.52=13.6614 (頭) 以n=14, df=2(14-1)=26的t0.05=2.056代入(12-9) 式:n=2×2.0562×22/1.52=15.0315 (頭) 再以n=15, df=2(15-1)=28的t0.05=2.048代入 (12-9) 式:n=2×

20、2.0482×22/1.52=14.9115 (頭) n已穩(wěn)定在15,即本次試驗兩組均至少需15頭試驗家畜才能滿足要求。 (三) 多個處理比較試驗中重復數(shù)的估計 當試驗處理數(shù)k3時,各處理重復數(shù)可按誤差自由度過dfe12的原則來估計。因為當dfe超過12時,F(xiàn)表中的F值減少的幅度已很小了。 1、完全隨機設計 由dfe =k(n-1)12,得重復數(shù)的估算公式為: n12/k+1 (12-14) 由(12-14) 式可知,若k=3,則n5;k=4,則n4;。但當處理數(shù)k>6時,重復數(shù)仍應不少于3。 2、隨機單位組設計 以dfe =(k-1) (n-1)12,得重復數(shù)的估算公式為:

21、n12/(k-1)+1 (12-15) 由公式(12-15)可知,若k=3,則n7;k=4,則n5;。但當處理數(shù)k>7時,重復數(shù)仍應不少于3。 3、拉丁方設計 若要求dfe=(k-1) (k-2)12,則重復數(shù)(此時等于處理數(shù))5。 所以,為了使誤差自由度不小于12,則應進行處理數(shù)(即重復數(shù))5的拉丁方試驗,即進行5×5以上的拉丁方試驗。當進行處理數(shù)為3、4的拉丁方試驗時可將3×3拉丁方試驗重復6次,4×4拉丁方試驗重復2次,以保證dfe=12。 (四) 兩個百分數(shù)比較試驗中樣本含量估計 設兩樣本含量相等:n1=n2=n,n的計算公式可由兩個樣本百分數(shù)差異顯

22、著性檢驗u檢驗公式推得: (12-16)式中:n為每組試驗的動物頭數(shù); 為合并百分數(shù),由樣本百分數(shù)計算,; 為預期達到差異顯著的百分數(shù)差值;為自由度等于、兩尾概率為的臨界值:0.05=1.96, 0.01=2.58;1-為置信度?!纠?2.14】 兩種痢疾菌苗對雞白痢病的免疫效果,初步試驗表明,甲菌苗有效率為2250 = 44%,乙菌苗有效率為2850 = 56%,今欲以95%的置信度在樣本的百分數(shù)差值達到10時檢驗出兩種菌苗免疫效果有顯著差異,問試驗時每組至少需接種多少只雞? 已知=2250 = 44%,=2850 = 56%,則兩個樣本百分數(shù)的合并百分數(shù)為: = (22+28) /(50+

23、50)= 0.50,=1-0.50=0.50 將代入 (12-16) 式算得: n=2×1.962×0.50×0.50/0.102 = 192 .08193(只) 即在正式接種試驗時,每組至少需接種193只雞方可滿足試驗要求。 注意,在配對試驗、非配對試驗和多個處理比較試驗中,同一處理的不同重復意味著同一處理實施在不同的試驗單位上。若試驗以個體為試驗單位,則同一處理的不同重復是指同一處理實施在不同個體上;若以群體為一個試驗單位,則同一處理的不同重復是指同一處理實施在不同群體上,這時如果每處理只實施在一個群體上,不管這群動物的數(shù)量有多少,實際上相當于只實施在一個試驗

24、單位上,只能獲得一個觀測值,也就無法估計試驗誤差。習 題1. 欲抽樣調(diào)查某一地區(qū)仔豬斷奶體重,已知S=3.4kg,若估計斷奶體重的置信度為99%,允許誤差為0.5kg,問樣本含量多少為宜?(n=308頭)2. 某地需抽樣調(diào)查豬蛔蟲感染率。根據(jù)以往經(jīng)驗,感染率一般為45%左右。若規(guī)定允許誤差為3.2%,選定=0.05,試求出樣本含量。(n=929頭)3. 某試驗比較4個飼料配方對蛋雞產(chǎn)蛋量的影響,采用隨機單位組設計,若以20只雞為一個試驗單位,問該試驗至少需要多少只雞方可滿足誤差自由度不小于12的要求?(400只)第十五章 抽樣調(diào)查農(nóng)業(yè)和生物學研究中有二種工具是十分重要的,一是試驗研究,一是調(diào)查

25、研究。對于農(nóng)業(yè)科學工作者來說,由于所研究的對象是生長在大田中的生物體,不論是作物還是病、蟲、草等,與控制試驗條件下相比,大田條件變化無窮,可供研究的內(nèi)容更為豐富。因而在一定意義上,抽樣調(diào)查這個工具更為常用,有時還必須應用,例如有些測定對觀察材料是破壞性的情況。通過調(diào)查研究可以掌握作物的生育動態(tài),了解病、蟲害發(fā)生及分布的情況,掌握田塊土壤肥力水平及變化情況,這些為制定田間措施,做好動態(tài)管理提供了事實依據(jù),尤其通過對比性的調(diào)查研究可以檢查農(nóng)業(yè)措施,諸如群體密度、施肥種類與水平、病蟲害防治措施等的效果。調(diào)查研究和試驗研究是互為補充的。通過調(diào)查研究獲得初步信息,在控制條件下進行試驗以驗證和發(fā)展調(diào)查研究

26、的結果;由試驗研究所獲得的結論,再在大田中廣泛使用,并通過調(diào)查研究進一步明確其實際效果。田間試驗發(fā)展了一系列的設計和統(tǒng)計分析方法;田間調(diào)查研究也發(fā)展了一系列的抽樣調(diào)查設計和統(tǒng)計分析方法。和試驗研究一樣,調(diào)查研究的目的是對所調(diào)查的總體作出估計和推論。但是所調(diào)查的總體往往包含有大量的單位,要窮盡是不可能的,也是不必要的,因而通常僅從總體中進行抽樣調(diào)查,由樣本的結果對總體的情況作出估計和推論。這里用樣本的統(tǒng)計數(shù)估計總體的參數(shù),便存在所獲統(tǒng)計數(shù)的準確性及精確性的問題。以平均數(shù)為例,用去估計,其準確性如何?其精確性(,即的抽樣誤差)又如何?科學的調(diào)查研究應該有嚴密的抽樣設計以便對所獲調(diào)查研究的結果作出準

27、確性和精確性的估計,從而有分寸地做出推論。第一節(jié) 抽樣調(diào)查方案進行調(diào)查研究,首先應制訂好抽樣調(diào)查計劃,計劃中應明確調(diào)查研究的總體或推論的總體。調(diào)查研究的總體有時包含有大量的個體,這時可以把該總體看作為一無限總體,例如一塊大田中有數(shù)以萬計的植株,如果以一個植株為單位,這個總體中便有數(shù)以萬計的單位。有時調(diào)查研究的總體本身包含的個體并不太多,例如一個小區(qū)有200個單株,若以一株為單位,而將這小區(qū)看作為一總體,則這一總體為有限總體。抽樣調(diào)查計劃中關鍵的問題是確定抽樣調(diào)查方案,而對總體性質(zhì)的了解是直接與抽樣調(diào)查方案有關的。一個調(diào)查計劃中,一般應包括目的要求,關于調(diào)查研究材料或?qū)ο蟮恼f明,抽樣調(diào)查方案,所

28、觀察的性狀和其標準,統(tǒng)計分析的方法,以及日程和人力安排等等。抽樣調(diào)查方案有著各種各樣的專業(yè)內(nèi)容,難以全面概括。簡單的抽樣調(diào)查方案其主要內(nèi)容是由樣本對總體作出估計;復雜的抽樣調(diào)查方案則涉及不同情況、處理間的比較,甚至涉及多個不同因素不同水平間的比較。對于這類具有比較性質(zhì)的抽樣調(diào)查研究,凡比較試驗所應遵循的原則,如處理間“唯一差異”原則等,也均適用。當然自然條件下尤其田間條件下,環(huán)境條件難以得到全面控制,設計抽樣調(diào)查方案時必須注意到力求相對一致,以保證不同處理間的可比性,并通過抽樣調(diào)查技術進行調(diào)節(jié)和彌補。鑒于抽樣比較的設計原則可參考試驗設計方面的有關要求,本章對此將不作進一步討論,而主要集中在抽樣

29、方案的三個基本內(nèi)容的設計方面,即抽樣單位、抽樣方法、以及樣本容量(也稱樣本含量)的設計方面,在有限總體的情況下還包括與樣本容量密切有關的抽樣分數(shù)的安排。此處的抽樣分數(shù)(sampling fraction)指一個樣本所包含的抽樣單位數(shù)占其總體單位數(shù)的成數(shù)。有時對正規(guī)試驗的觀察測定須通過抽樣調(diào)查完成,這種情況下每一小區(qū)便為一總體,往往是對有限總體的抽樣,而對全試驗的整個抽樣調(diào)查便成為試驗的一個部分或組成了一個復雜的抽樣調(diào)查方案。一、抽樣單位田間抽樣調(diào)查的抽樣單位(sample unit)是隨調(diào)查研究目的、作物種類、病蟲害種類、生育時期、播種方法等因素而不同的,可以是一種自然的單位,也可以是若干個自

30、然單位歸并成的單位,還可以用人為確定的大小、范圍或數(shù)量作為一個抽樣單位。常用的抽樣單位舉例如下:(1)面積 如0.5平方米或每平方米內(nèi)的產(chǎn)量、株數(shù)、害蟲頭數(shù)等。為便于田間操作,常用鐵絲或木料制成測框供調(diào)查時套用,撒播或小株密植的作物常用測框為抽樣單位。(2)長度 如12行若干長度內(nèi)的產(chǎn)量、株數(shù),若干長度內(nèi)植株上的害蟲頭數(shù)等。為便于田間操作,常用一定長度的木尺或繩子作工具。條播作物常采用一定長度為抽樣單位。(3)株穴 如棉花連續(xù)10株的結鈴數(shù),水稻連續(xù)20穴的苗數(shù)、分蘗數(shù)、結實粒數(shù)等。穴播或大株作物常以一定株、穴數(shù)為抽樣單位。(4)器官 如稻、麥千粒重,大豆百粒重,每100個棉鈴中紅鈴蟲頭數(shù),每

31、張葉片的病斑數(shù)等,以一定數(shù)量的器官作為一個抽樣單位。(5)時間 如單位時間內(nèi)見到的蟲子頭數(shù),每天開始開花的株數(shù)等。(6)器械 如一捕蟲網(wǎng)的蟲數(shù),一只誘蛾燈下的蟲數(shù),每一個顯微鏡視野內(nèi)的細菌數(shù)、孢子數(shù)、花粉發(fā)芽粒數(shù)等。(7)容量或重量 如每升或每公斤種子內(nèi)的混雜種子數(shù),每升或每公斤種子內(nèi)的害蟲頭數(shù)等。(8)其他 如一個田塊、一個農(nóng)場等概念性的單位。抽樣單位的確定與調(diào)查結果的準確度和精確度有密切關系。不同類型及大小的抽樣單位效果并不一樣。例如條播作物行距的變異小,株距的變異大,長度法常比測框或株、穴法好;撒播作物植株交錯,同樣面積下方形測框比狹長形的測框邊界小,計數(shù)株數(shù)的誤差將小些;1平方米的測框

32、比0.5平方米的測框效果好等等。二、抽樣方法基本的抽樣方法(sampling method)有以下三類。1順序抽樣(systematic sampling) 也稱機械抽樣或系統(tǒng)抽樣,按照某種既定的順序抽取一定數(shù)量的抽樣單位組成樣本。例如,按總體各單位編號中逢1或逢5或一定數(shù)量間隔依次抽取;按田間行次每隔一定行數(shù)抽取一個抽樣單位等等。田間常用的對角線式、棋盤式、分行式、平行線式、“Z”字形式(圖15.1)等抽樣方法都屬順序抽樣一類,順序抽樣在操作上較方便易行。對角線式棋盤式分行式平行線式Z字形式圖15.1 常用的順序抽樣方式以農(nóng)作物田間測產(chǎn)的抽樣調(diào)查為例,通常采用實收產(chǎn)量的抽樣調(diào)查或產(chǎn)量因素的抽

33、樣調(diào)查法,視測產(chǎn)的時間及要求決定。如小麥成熟前的測產(chǎn),在面積不大的田塊上常采用棋盤式五點抽樣,每樣點0.5或1平方米(抽樣單位為0.5或1m2的測框),計數(shù)樣點中有效穗數(shù),并從中連續(xù)數(shù)取2050個穗的每穗粒數(shù),根據(jù)品種常年千粒重及土地利用系數(shù)估計單位面積產(chǎn)量。2典型抽樣(typical sampling) 也稱代表性抽樣,按調(diào)查研究目的從總體內(nèi)有意識地選取一定數(shù)量有代表性的抽樣單位,至少要求所選取的單位能代表總體的大多數(shù)。例如小麥田間測產(chǎn)的抽樣調(diào)查,如果全田塊生長起伏較大,可以在目測有代表性的幾個地段上取點調(diào)查。在樣本容量較小時,相對效果常較好,但另一方面則可能因調(diào)查人員的主觀偏面性而有偏差。

34、3隨機抽樣(random sampling) 也稱等概率抽樣,在抽取抽樣單位時,總體內(nèi)各單位應均有同等機會被抽取。隨機抽樣要遵循一定的隨機方法。一般先要對總體內(nèi)各抽樣單位編號,然后用抽簽法或隨機數(shù)字法(隨機數(shù)字表或計算器上的隨機數(shù)字)抽取所需數(shù)量的抽樣單位,組成樣本。仍以小麥田間測產(chǎn)為例,隨機決定測框位置時,可先步測田塊的長、寬度,然后由隨機數(shù)字法決定各點的方位。設田塊長300米,寬170米,取五點,各點的長、寬位置分別隨機決定為(125,88),(240,9),(26,53),(80,71),(231,129)等,然后逐點步測設框調(diào)查。田間隨機抽樣在大株作物有固定株行距的情況要方便些。隨機抽

35、樣法除上述稱為簡單隨機抽樣法的以外,還有一系列衍生的隨機抽樣法,如下面將要詳細介紹的分層隨機抽樣法、整群隨機抽樣法、巢式隨機抽樣法,雙重隨機抽樣法、序貫抽樣法等。簡單隨機抽樣時,總體各單位被抽取的概率相同,一些復雜的隨機抽樣可以預先確定總體不同部分被抽取的概率。以上三類方法僅隨機抽樣法符合統(tǒng)計方法中估計隨機誤差并由所估誤差進行統(tǒng)計推斷的原理。在一個抽樣調(diào)查計劃中可以綜合地應用以上三種方法。例如,從總體內(nèi)先用典型抽樣法選取典型田塊或典型單位群,然后再從中進行隨機抽樣或順序抽樣。三、樣本容量樣本容量(或樣本含量sample size)指樣本所包括的抽樣單位數(shù)。樣本容量的大小與所獲抽樣調(diào)查結果的準確

36、度和精確度密切有關。抽樣單位的大小和樣本容量的大小決定了總調(diào)查工作量??偣ぷ髁恳欢〞r,常寧可樣本容量適當大些而抽樣單位適當小些,因之故。當然并不是容量越大越好,因為抽樣單位太小也將導入大量誤差。樣本容量和抽樣單位大小的最佳配置一般可由實驗綜合權衡后確定。樣本容量(n)與抽樣分數(shù)(,N為總體單位數(shù))是絕對值和相對值的關系。在總體屬有限性時,將有實際意義,由樣本估計總體時常須將考慮在內(nèi)。四、確定抽樣方案的一些因素設計抽樣方案時須考慮以下幾方面。 (1) 所要求的準確度與精確度,要求高時樣本容量應大。一定工作量條件下以增大抽樣單位為好還是增大樣本容量為好,一般先著重考慮針對誤差大的環(huán)節(jié)作出反應。(2

37、) 是否需估計置信限或作統(tǒng)計推論,一般隨機抽樣有合理的試驗誤差估計,可以做統(tǒng)計推論。而其他抽樣方法往往缺乏合理的誤差估計,統(tǒng)計分析有局限性。但是田間調(diào)查采用隨機抽樣手續(xù)又較麻煩,不甚方便,常常做某些變通。例如,綜合抽樣方法中將隨機抽樣放在比較方便的場合或階段。也有時使順序抽樣法帶有某些隨機性,例如棋盤式五點抽樣,在大體確定五個點的方位后,由拋擲測框或其它物件下落的偶然性決定各點的位置,從而減少主觀偏向和系統(tǒng)誤差的影響。這種情況下,有人借用隨機抽樣的統(tǒng)計分析方法作為近似的估計。(3) 與人力、物力、時間等條件相適應,抽樣單位大、樣本容量大、進行總體編號等都是較費事的,必須權衡需要與可能,在保證一

38、定精確性的情況下,盡量減低消耗。(4) 注意到調(diào)查研究對象的特點,例如某些害蟲發(fā)生量的調(diào)查方案,尤其抽樣方法,應適合于該昆蟲田間分布類型的特點,一般均勻分布的害蟲采用對角線式、棋盤式、分行式均可,稀密分布的害蟲則常采用平行線式、“Z”字形式等。第二節(jié) 常用抽樣方法的統(tǒng)計分析一、簡單順序抽樣及簡單典型抽樣法簡單順序抽樣(simple systematic sampling)通常只計算平均數(shù)作為總體的估計值。例15.1 設成熟期對水稻汕優(yōu)2號大田測產(chǎn),該田塊約5畝,生長較均勻。采用棋盤式抽樣,10個點,每點由12行間距計算平均行距。其中任選二行測查2m長度內(nèi)的穴數(shù)及有效穗數(shù)。再在其中拔連續(xù)5穴,將

39、稻穗分成大、中、小三級,按比例選取20穗,結合考查其他性狀計數(shù)每穗總粒數(shù)及空癟粒數(shù),從而算出結實粒數(shù)。每點其余稻穗脫粒,稱取千粒重。將10點數(shù)據(jù)匯總后求得每畝平均穴數(shù)4.2萬,每穴平均有效穗數(shù)9.2個,每穗平均結實粒數(shù)53.7粒,平均千粒重25.2克。計算平均數(shù)的公式為。本例中土地利用系數(shù)定為98%,則估計每畝產(chǎn)量為: =513.75(kg/畝)簡單典型抽樣法的分析同樣只計算。二、簡單隨機抽樣法簡單隨機抽樣(simple random sampling),每個抽樣單位具有相同概率被抽入樣本??傮w編號方法及隨機抽取方法依調(diào)查對象而定。例15.2 設在一休閑地上調(diào)查小地蠶蟲口密度每測框為1m2,隨

40、機取30點,調(diào)查結果列在表15.1。表15.1 30個單位的小地蠶幼蟲頭數(shù)每m2內(nèi)幼蟲頭數(shù)( y )0123456789101112 單位數(shù)(個)123844222100130 fy02624162012141690012131 fy20212726410072981288100144773 (頭/m2) (頭/m2) (頭/m2) (頭/m2)即該田塊小地蠶幼蟲約為3.385.34(頭/m2),折合每畝2253.43560.2頭,這個估計的可靠性為95%。以上將所調(diào)查研究的總體看為面積甚大的一個無限總體進行分析,設若該30個單位從336 m2的一塊田中抽出,這時調(diào)查研究的總體實為一有限總體,

41、有限總體的兩個參數(shù)為:平均數(shù) (15·1)標準差 (15·2)N為總體內(nèi)單位數(shù),即總體容量。樣本估計值仍為及,但估計抽樣誤差時應考慮到抽樣分數(shù)的影響。 (15·3)本例中(頭/m2)該有限總體平均數(shù)的95%置信限為: (頭/m2)即3.425.30(頭/m2),折合每畝2280.03533.4頭。在抽樣分數(shù)不大時,總體平均數(shù)的置信范圍與不考慮抽樣分數(shù)時相差并不太大。三、分層隨機抽樣法當所調(diào)查的總體有明顯的系統(tǒng)變異,能夠區(qū)分出不同的層次或段落時,可以采用分層抽樣法,即從各個層次或段落分別進行隨機抽樣或順序抽樣。這里著重介紹分層隨機抽樣法(stratified ran

42、dom sampling)。分層隨機抽樣有三個步驟:(1)將所調(diào)查的總體按變異情況分為相對同質(zhì)的若干部分、地段等稱為區(qū)層,各區(qū)層可以相等,也可以不等。區(qū)層數(shù)依所調(diào)查總體的異質(zhì)性情況決定,一般同一區(qū)層同質(zhì)程度愈高,抽樣調(diào)查結果的準確性和精確性愈好。(2)獨立地從每一區(qū)層按所定樣本容量進行隨機抽樣。各區(qū)層所抽單位數(shù)可以相同,也可以不同。抽樣單位總數(shù)在各區(qū)層的分配有: 比例配置法,指各區(qū)層大小不同時按區(qū)層在總體中的比例確定抽樣單位數(shù),若各區(qū)層大小相同,比例配置結果實際即為相等配置; 最優(yōu)配置法,指根據(jù)各區(qū)層的大小、變異程度以及抽取一個單位的費用綜合權衡,確定出抽樣誤差小、費用低的配置方案。這種方法事

43、先須有對區(qū)層變異程度的了解。根據(jù)所定抽樣計劃獲得數(shù)據(jù)后,分別計算各區(qū)層樣本的平均數(shù)(或百分數(shù)、總和數(shù))及標準差。(3)根據(jù)各區(qū)層的估計值,采用加權法估計總體參數(shù)??偲骄鶖?shù) (15·4) 總標準誤 (15·5)式中、等分別為各區(qū)層的平均數(shù)、標準差、抽樣單位數(shù)(樣本容量)、以及區(qū)層占總體的成數(shù)。若各區(qū)層總體方差相同,則 (15·6)進而,若各區(qū)層抽樣單位數(shù)按區(qū)層比例配置,則 (15·7)其中 (15·8)例15.3 設某場調(diào)查棉田伏桃數(shù),將棉田按茬口分類,冬閑占40%,調(diào)查40個點,每點查10株伏桃數(shù),再由密度折算為每畝伏桃數(shù),得3.5萬,s1=0

44、.81萬;元麥套棉占40%,調(diào)查50個點,得萬,s2=0.75萬;元麥后棉占20%,30點,萬,萬。 全場總平均伏桃數(shù)(萬/畝) 假定各區(qū)層總體方差相同,則 (15·9) (萬/畝)(萬/畝),若各區(qū)層總體方差不能假定相同,利用(9·4)估計,其有效自由度為: (15·10)其中,由查出t值,大樣本時可用正態(tài)離差u值作估計。抽樣調(diào)查結果間可以按非對比設計作兩兩平均數(shù)間的比較,如比較不同茬口伏桃數(shù)的差異顯著性。這里有三種茬口,也可按單向分組次數(shù)不等的方法做方差分析。全場平均結果也可和往年或他場作比較,如若該場去年100點調(diào)查結果,三種茬口每畝伏桃數(shù)總平均為2.7(萬

45、/畝),(萬/畝),則可按非對比設計做t測驗。有時為避免做兩個總體方差相等的假定,可做測驗 (萬/畝) 其有效自由度=式中為樣本A的自由度,為樣本B的自由度。1.98,比較結果2.681.98說明該年該場由于植棉技術的改進,伏桃數(shù)比去年顯著上升。實際在二個樣本容量均甚大時可不必計算有效自由度而可用正態(tài)離差u值。若在有限總體中進行分層抽樣,則: (15·11)各區(qū)層總體方差相等,抽樣分數(shù)相等,即按比例配置,則: (15·12)四、整群抽樣法當所調(diào)查的對象或總體可以區(qū)分為許多包含若干抽樣單位的群時,可采用隨機抽取整群的方法即整群隨機抽樣法(random group sampli

46、ng),被抽取的整群中各抽樣單位都進行調(diào)查,按群計算平均數(shù)及標準差,并估計其置信限。整群抽樣的“群”相當于擴大了的抽樣單位。如果將順序抽樣的五點棋盤式、三點對角線式等看作為一個群,而在群間進行隨機抽樣,則可以克服順序抽樣缺乏合理的誤差估計值不能計算置信限的不足。當然要記住“群”與“點”是不同級別的抽樣單位,此處“點”不隨機,而“群”隨機。例15.4 設某農(nóng)場調(diào)查水稻螟害發(fā)生情況,在全場100個條田中隨機抽取9條做調(diào)查,每田塊采用平行線式取10點,每點連續(xù)查20穴,經(jīng)初步整理后將結果列于表15.2。表15.2 某農(nóng)場螟害率抽樣調(diào)查結果田 塊123456789調(diào)查莖稈數(shù)19802062215425

47、1223152098242118672248螟害莖稈數(shù) 178 211 335 345 212 238 460 119 298螟害率%8.9910.2315.5513.749.1611.3419.006.3713.25這資料以條田為抽樣單位進行分析。 全場100條田平均螟害率95%的可能在9.0114.91%范圍內(nèi)。本例的總體實際上是一個N=100的有限總體,故更確切地應為: 即9.1514.77(%)間。此外,本例是百分數(shù)資料,如果田塊間的差異不大,可以采用百分數(shù)資料的分析方法,即由總調(diào)查莖稈數(shù)和總螟害莖稈數(shù)求出總螟害率,得 這樣,即11.6912.59(%)。這個區(qū)間比前面所估小得多,這是

48、因為前面以田塊為抽樣單位,而不是以莖稈為單位,除了有莖稈受害與否的隨機誤差外,還包含有田塊間的差異,所以此處不宜采用百分數(shù)的誤差估計方法。五、分級隨機抽樣法亦稱巢式隨機抽樣法(nested random sampling),最簡單的是二級隨機抽樣。例如全區(qū)的棉花結鈴數(shù),可以在區(qū)內(nèi)隨機抽取幾個鄉(xiāng),鄉(xiāng)內(nèi)隨機抽取若干戶進行調(diào)查。這時,鄉(xiāng)為初級抽樣單位,戶為次級抽樣單位。又例如研究農(nóng)藥在葉面上的殘留量,第一步隨機抽取單株,第二步在單株上隨機抽取葉片,分別作為初級和次數(shù)抽樣單位。以此為例,摘取部分數(shù)據(jù)列于表15.3。表15.3 某農(nóng)藥殘留量分析結果及其方差分析植 株各葉片內(nèi)的殘留量(單位數(shù))合計平均13

49、.283.093.033.0312.433.1123.523.483.383.3813.763.4432.882.802.812.7611.252.8143.343.383.233.2613.213.30變異來源自由度均 方所估計的方差分量F植株間 3 MSB=0.2961* 44.9 F0.05(3,12)=3.49株內(nèi)葉片間12 MSA=0.0066 巢式隨機抽樣數(shù)據(jù)可以應用方差分析法算出各階段的抽樣誤差,從而估計平均數(shù)的標準誤。二級抽樣的公式如下: (15·13)其中,k=初級抽樣單位數(shù),n=次級抽樣單位數(shù)。 (15·14)其中,、分別為次級和初級抽樣誤差的估計值。二

50、級抽樣的數(shù)據(jù)按單向分組的組次數(shù)相等(也可能不相等)的隨機模型進行方差分析。例題中k=4,n=4,方差分析結果F=0.2961/0.0066=44.9,說明植株間的誤差顯著大于株內(nèi)葉片間的誤差。這二個階段的抽樣誤差是不同的,應該分別估計。但此處若將kn=4×4=16張葉片直接計算其方差則為0.0645。比扣除株間誤差后剩余的株內(nèi)葉片間誤差0.0066大得多。例15.5 表15.3數(shù)據(jù)的分析結果: (單位) (單位)2 (單位) (單位)此處DF=3,因由均方MSB計算。若只從1個初級單位估計置信限,如以株為單位作估計,則: (單位)2 (單位) (單位)由一株四張葉片估計,比四株16張葉片估計,誤差要大得多。若每株只取一張葉片,四株共取4張葉片,則 (單位)所以,同樣測定4張葉片,從1株上取與從4株上取,抽樣誤差是不同的,今后對此材料抽樣測定時,應多取植株,每株上可以少取一些葉片。上述二級抽樣從2個階段誤差估計樣本平均數(shù)抽樣誤差的方法適用于許多化學分析抽樣的情況。例如進行土壤有機磷容量測定,在一塊田中抽取k份土樣,每土樣做n次測定,這里存在土壤取樣的誤差和化學測定的誤差。這是兩種不同性質(zhì)的誤差,但都包含在樣本平均數(shù)的抽樣誤差內(nèi),因而須根據(jù)兩階段誤差的大小按(15

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論