民意調查的抽樣_第1頁
民意調查的抽樣_第2頁
民意調查的抽樣_第3頁
民意調查的抽樣_第4頁
民意調查的抽樣_第5頁
已閱讀5頁,還剩22頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

民意調查的抽樣第1頁,共27頁,2023年,2月20日,星期五課程大綱抽樣原理隨機抽樣等距抽樣分層分段抽樣非隨機抽樣第2頁,共27頁,2023年,2月20日,星期五抽樣原理(1)由於我們不可能訪問母體中所有的個體,所以必須進行抽樣。抽樣一定會有誤差,也就是根據(jù)樣本的調查結果跟真實母體之間有一定的差距,稱為抽樣誤差。抽樣誤差代表一種區(qū)間,也就是樣本估計的結果被包含在一定的上下限。第3頁,共27頁,2023年,2月20日,星期五抽樣原理(2)抽樣誤差的估計為若干個樣本標準誤σ/sqrt(n)。當我們做無數(shù)次抽樣之後,所得到的每一個樣本平均值將形成一個常態(tài)分布。而這些樣本平均值的離散程度就是樣本標準誤。如果樣本抽的次數(shù)夠多,真正的母體平均值μ應該等於所有樣本平均值的平均值加減一定的標準誤。但是我們不可能抽無限次的樣本,只能假定單一抽樣就代表無限次抽樣後的平均值。因此我們對母體平均值的估計就是依照抽樣結果。第4頁,共27頁,2023年,2月20日,星期五常態(tài)分布圖第5頁,共27頁,2023年,2月20日,星期五抽樣原理(3)根據(jù)上圖,我們知道,68%的樣本平均值會落在μ加減一個標準誤的範圍中。如果是μ加減兩個標準誤的範圍,則會包含95%的樣本平均值。如果是μ加減三個標準誤的範圍,則會包含99%的樣本平均值。換句話說,68%的樣本平均值加減一個標準誤會包含μ。以此類推。第6頁,共27頁,2023年,2月20日,星期五抽樣原理(4)而σ又是從樣本的資料估計得來:

σ=sqrt(n/n-1)*s.s為標準差,計算方式為sqrt[∑(xi-x_bar)2/n-1]。其中xi表示每一個觀察值。通常一個簡化的公式為設定σ等於0.5,而抽樣誤差公式可以快速計算為1/sqrt(n).也就是樣本數(shù)的開根號的倒數(shù)。第7頁,共27頁,2023年,2月20日,星期五信心水準與抽樣誤差剛剛提到的68%或95%或99%通常稱為信心水準。意思為抽100次樣本,有多少比率的樣本是我們確定會以一個特定區(qū)間包含母體平均數(shù)μ。信心水準越高,所需要的區(qū)間也就越大,μ的上下限也就差距越大。所以信心水準跟抽樣誤差之間必須取捨。通常我們是用95%信心水準,對應兩個標準誤的抽樣誤差第8頁,共27頁,2023年,2月20日,星期五信心水準與抽樣誤差試算信心水準68%95%99%標準誤正負1正負2正負3抽樣誤差0.5/sqrt(n)1/sqrt(n)1.5/sqrt(n)試算抽樣誤差(假設n=900)正負1.6%正負3.3%正負5%第9頁,共27頁,2023年,2月20日,星期五信心水準與抽樣誤差例子第10頁,共27頁,2023年,2月20日,星期五信心水準與抽樣誤差注意事項上述的公式完全不考慮母體大小,只考慮樣本數(shù)大小

。根據(jù)上述的公式可以逆向推估需要的樣本。當母體非常小的時候,例如低於100,抽樣誤差已經沒有意義,可以考慮全查。第11頁,共27頁,2023年,2月20日,星期五單純隨機抽樣將每一個觀察值加以編號依照亂數(shù)表選中一個號碼每個觀察值應該有同樣的中選機率第12頁,共27頁,2023年,2月20日,星期五第13頁,共27頁,2023年,2月20日,星期五等距抽樣(1)把全體總數(shù)N除以樣本數(shù)n得到K,起始為隨機亂數(shù)抽出R,然後每隔K個抽出一個樣本,

R,

R+K,R+2K,R+3K,一直到R+(n-1)K。如果觀察值本身有分組,則是依照各組人數(shù)從小而大排列,然後各組內再編號以方便抽出。假如我們有4800個觀察值如下表,如何抽出16個樣本?先抽一個亂數(shù)6,然後每隔300就抽一個。第14頁,共27頁,2023年,2月20日,星期五等距抽樣(2)分組人數(shù)累積人數(shù)抽出樣本130030062500800306,60636001400906,1206480022001506,1806,21065120034002406,2706,3006,33066140048003606,3906,4206,4506總數(shù)480016第15頁,共27頁,2023年,2月20日,星期五分層分段抽樣(1)主動將樣本分成若干層,原則為層內同質性越大越好,層外同質性越小越好。

例如:依照都市化程度分鄉(xiāng)鎮(zhèn);依照學院特性分科系;依照學校特色分學校

。人數(shù)越多的層應該分到越多樣本;在各層之下再分段以簡化抽樣。每一人的中選機率仍然會相同。第16頁,共27頁,2023年,2月20日,星期五分層分段抽樣(2)例如調查政大的學生對政大的認同感。

根據(jù)資料,博士班學生約834人,碩士班約4,570人,大學生約9,404人,總共14,808人。若想抽出樣本1,200人,則博士班學生約分配到67人,碩士班約368人,大學生約765人。第17頁,共27頁,2023年,2月20日,星期五分層分段抽樣(3)學院個數(shù)累積教育233233國際事務274507理6161123法6421765中選1153傳播7912556文8353391中選1153外語1,1184509中選1153社科2,2816790中選2306商2,6149404總數(shù)9,404765第18頁,共27頁,2023年,2月20日,星期五分層分段抽樣(4)先決定要抽出五個學院,K為1880

。

然後抽出起始亂數(shù)為1203,落在法學院。接下來為文學院,最後是社科院,有兩個中選。

每個中選單位必須訪問153人,共765人。

以傳播學院為例,中選機率公式為(5*2556/9404)*(153/2556)=765/9404。而博士班以及碩士班中選機率皆同。

第19頁,共27頁,2023年,2月20日,星期五假設某一層涵蓋以下鄉(xiāng)鎮(zhèn)市鄉(xiāng)鎮(zhèn)市永和161139161139*新店175331336470三重244979581449*中和259824841273桃園1619021003175中壢1899821193157*鳳山1976501390807板橋3380371738844新莊1945921923496*第20頁,共27頁,2023年,2月20日,星期五分層分段抽樣應用每個鄉(xiāng)鎮(zhèn)市抽出同樣數(shù)目的樣本例如永和預計抽出60個樣本,便預計抽出3個里,每個里20個樣本,假設永和有25個里,假設每個里人口為M,每一人的被抽取率為[4*161139/1923496]*[3*M/161139]*[20/M]=60/480874第21頁,共27頁,2023年,2月20日,星期五加權分層抽樣後,要對每一層做加權。加權的權值為:Wi=(Ni/N)╳(n/ni)。因為:ni=(nNi)/N,即每一層的樣本數(shù)等於全部樣本數(shù)乘以每一層所佔的比例。而每一層佔總樣本的比例為權值ni/n,乘以每一層的平均數(shù)(Σxi/ni),相乘後將得到Σxi/n,亦即全部樣本的平均數(shù),也就是對母體平均數(shù)的估計。第22頁,共27頁,2023年,2月20日,星期五加權方式通常我們如果有母體的交叉資料,例如每一個縣市的教育程度或性別,我們可以做「事後加權」。如果沒有的話,我們做「反覆加權」,即先對一個類別做加權,通過檢定後再做下一個加權,一直到全部通過為止。第23頁,共27頁,2023年,2月20日,星期五反覆加權反覆加權的意思為先對某一變數(shù)加權,若通過卡方檢驗,儲存資料後,再對另一變數(shù)加權,然後再檢驗,然後再對另一變數(shù)加權通常加權的變數(shù)為性別、教育程度、年齡、地區(qū)等第24頁,共27頁,2023年,2月20日,星期五電話訪問之抽樣(一)

電話號碼簿抽樣—根據(jù)每個縣市之人口比例決定樣本數(shù),再根據(jù)電話號碼簿之頁數(shù)決定平均每幾頁抽出一個樣本,在那一頁以隨機方式決定那一欄第幾個號碼為中選號碼抽出中選號碼後可在尾數(shù)或後兩位尾數(shù)加1或隨機處理,以找到未登記的號碼第25頁,共27頁,2023年,2月20日,星期五電話訪問之抽樣(二)電話號碼由局碼及後面幾位數(shù)字組合而成,若已知所

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論