版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第一節(jié)第一節(jié) 抽樣與抽樣分布抽樣與抽樣分布 第二節(jié)第二節(jié) 參數(shù)估計基本方法參數(shù)估計基本方法第三節(jié)第三節(jié) 總體均值和總體比例的區(qū)間估計總體均值和總體比例的區(qū)間估計1.了解抽樣和抽樣分布的基本概念;了解抽樣和抽樣分布的基本概念;2.理解抽樣分布與總體分布的關系;理解抽樣分布與總體分布的關系;3.掌握總體均值、總體比例和總體方差的區(qū)掌握總體均值、總體比例和總體方差的區(qū)間估計;間估計;1.抽樣的意義與歷程抽樣的意義與歷程2.抽樣方法:隨機抽樣、非隨機抽樣抽樣方法:隨機抽樣、非隨機抽樣3.抽樣分布:抽樣分布:二項抽樣分布;二項抽樣分布;樣本均值的分布;樣本均值的分布;樣本方差的分布(了解);樣本方差的分
2、布(了解);T統(tǒng)計量的分布。統(tǒng)計量的分布。l抽樣的意義:抽樣的意義:社會學研究關心的是總體情況,而非樣本情況社會學研究關心的是總體情況,而非樣本情況;樣 本總 體統(tǒng)計值參數(shù)值l界定總體界定總體(越清楚越好)(越清楚越好)l確定抽樣框確定抽樣框:搜集一份全部個案的名單搜集一份全部個案的名單l決定樣本的大小決定樣本的大小:考慮的因素:抽樣誤差與研究代價考慮的因素:抽樣誤差與研究代價準則:根據(jù)所能付出的研究代價,最大限度的抽取樣本;準則:根據(jù)所能付出的研究代價,最大限度的抽取樣本;l設計抽樣方法設計抽樣方法,從抽樣框中選取所需的個案數(shù)目;,從抽樣框中選取所需的個案數(shù)目;l評估樣本之正誤評估樣本之正誤
3、:根據(jù):在總體和樣本中都容易找到的資料。根據(jù):在總體和樣本中都容易找到的資料。l非隨機抽樣非隨機抽樣立意(判斷)抽樣法(立意(判斷)抽樣法(Purposive Sampling):根據(jù)研究):根據(jù)研究人員的主觀見解和判斷選取典型的個案;人員的主觀見解和判斷選取典型的個案;偶遇抽樣法(偶遇抽樣法(Accidental Sampling):選取一些偶然遇見):選取一些偶然遇見的個案作為樣本;的個案作為樣本;定額(配額)抽樣法(定額(配額)抽樣法(Quota Sampling);根據(jù)某些標);根據(jù)某些標準將總體分組,然后用立意或偶遇抽樣法由每組中選取準將總體分組,然后用立意或偶遇抽樣法由每組中選取樣
4、本個案;樣本個案;雪球(網(wǎng)絡)抽樣雪球(網(wǎng)絡)抽樣(Snownball Sampling):根據(jù)已有研究:根據(jù)已有研究對象的介紹,不斷辨識和找出其他研究對象。對象的介紹,不斷辨識和找出其他研究對象。l非隨機抽樣常用于探討或試驗性研究,其缺點在于非隨機抽樣常用于探討或試驗性研究,其缺點在于不能用統(tǒng)計方法推斷總體情況。不能用統(tǒng)計方法推斷總體情況。l隨機抽樣隨機抽樣隨機原則的特征:隨機原則的特征:l等概論:即排除任何事先設定的模式,使每個對象被選等概論:即排除任何事先設定的模式,使每個對象被選中的概率都相等;中的概率都相等;l獨立性:即對象之間相互獨立,任何一個對象是否入選獨立性:即對象之間相互獨立
5、,任何一個對象是否入選樣本與其他對象無關。樣本與其他對象無關。隨機抽樣指總體中每個元素都有一定的非零概率隨機抽樣指總體中每個元素都有一定的非零概率被抽中,每個元素被抽中的概論可相等,也可不被抽中,每個元素被抽中的概論可相等,也可不等。即根據(jù)已知的幾率(如抽樣比)抽取個案;等。即根據(jù)已知的幾率(如抽樣比)抽取個案;方法:方法:l1.簡單隨機抽樣;簡單隨機抽樣;2.系統(tǒng)隨機抽樣;系統(tǒng)隨機抽樣;3.分層隨機抽樣;分層隨機抽樣;4.集體(整群)抽樣法;集體(整群)抽樣法;5.多段抽樣;多段抽樣;6.多期抽樣;多期抽樣;抽樣分布是根據(jù)機率的原則而成立的理論抽樣分布是根據(jù)機率的原則而成立的理論性分布,顯示
6、由同一總體中反復不斷抽取性分布,顯示由同一總體中反復不斷抽取樣本時,各個可能出現(xiàn)的樣本統(tǒng)計值的分樣本時,各個可能出現(xiàn)的樣本統(tǒng)計值的分布情況。布情況。1.所有樣本指標(如均值、比例、方差等)所所有樣本指標(如均值、比例、方差等)所形成的分布稱為形成的分布稱為抽樣分布抽樣分布2.是一種理論概率分布是一種理論概率分布3.隨機變量是隨機變量是 樣本統(tǒng)計量樣本統(tǒng)計量l樣本均值樣本均值, 樣本比例等樣本比例等4.結果來自結果來自容量相同容量相同的的所有所有可能樣本可能樣本3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個觀察值第二個觀察值
7、第一個第一個觀察值觀察值所有可能的所有可能的n = 2 的樣本(共的樣本(共16個)個)3.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個觀察值第二個觀察值第一個第一個觀察值觀察值16個樣本的均值(個樣本的均值(x)1.如果樣本相當大(如果樣本相當大(n大于大于30),則抽樣),則抽樣分布接近正態(tài)分布;分布接近正態(tài)分布;2.抽樣分布的均值就是總體均值;抽樣分布的均值就是總體均值;3.抽樣分布的標準差稱為標準誤(差),抽樣分布的標準差稱為標準誤(差),是總體方差除以樣本大?。ㄊ强傮w方差除以樣本大?。╪)的平方)的平方根;根;4.
8、任合兩值之間的樣本均值次數(shù)所占的比任合兩值之間的樣本均值次數(shù)所占的比例是可知的。例是可知的。l二項抽樣分布二項抽樣分布二項,即所研究的變量只有兩個值,如二項,即所研究的變量只有兩個值,如“成成”與與“敗敗”。l樣本比例的分布情況樣本比例的分布情況樣本中樣本中“成成”的幾率為的幾率為:p(r) = n! Pr Qn - r / r! (n - r)!公式表示樣本獲得公式表示樣本獲得 r 次成功的機率。其中,次成功的機率。其中,n為樣本為樣本數(shù),數(shù),r為為“成功成功”數(shù),數(shù),P為每次成功的機會,即總體為每次成功的機會,即總體中成功的比例,中成功的比例,Q為每次失敗的機會。為每次失敗的機會。實例實例
9、(成功數(shù)與樣本數(shù)的關系表成功數(shù)與樣本數(shù)的關系表):P132-134l當樣本量較大(當樣本量較大(最好最好n=100)時,可將二項分布近)時,可將二項分布近似為正態(tài)分布似為正態(tài)分布主要適用于樣本量較小時的均值分布,正主要適用于樣本量較小時的均值分布,正態(tài)分布可看作是態(tài)分布可看作是t分布的特殊形態(tài)。分布的特殊形態(tài)。l只要采用隨機抽樣法,就可根據(jù)抽樣分布,以只要采用隨機抽樣法,就可根據(jù)抽樣分布,以樣本統(tǒng)計值來推測總體情況。樣本統(tǒng)計值來推測總體情況。l即根據(jù)一個隨機樣本的統(tǒng)計值來估計總體參數(shù)即根據(jù)一個隨機樣本的統(tǒng)計值來估計總體參數(shù)是多少。是多少。 參數(shù)估計方法:參數(shù)估計方法:1.點估計:以一個最適當?shù)?/p>
10、樣本統(tǒng)計值來代表總體的點估計:以一個最適當?shù)臉颖窘y(tǒng)計值來代表總體的參數(shù)值;參數(shù)值;2.區(qū)間估計:以一個區(qū)間去估計總體參數(shù)值區(qū)間估計:以一個區(qū)間去估計總體參數(shù)值;從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的未知參數(shù)作出一個數(shù)值點的估計,量對總體的未知參數(shù)作出一個數(shù)值點的估計,用于估計總體某一參數(shù)的隨機變量;用于估計總體某一參數(shù)的隨機變量;例如: 用樣本均值作為總體未知均值的估計值就是一 個點估計l點估計沒給出估計值接近總體未知參數(shù)程度點估計沒給出估計值接近總體未知參數(shù)程度的信息;的信息;理論基礎是抽樣分布;理論基礎是抽樣分布;l無偏性:無偏性:估計量的數(shù)
11、學期望等于被估計的總體參數(shù)。估計量的數(shù)學期望等于被估計的總體參數(shù)。l一致性:一致性:隨著樣本容量的增大,估計量越來越接近被估計隨著樣本容量的增大,估計量越來越接近被估計的總體參數(shù)值。的總體參數(shù)值。1.根據(jù)一個樣本的觀察值給出總體參數(shù)的估計范圍根據(jù)一個樣本的觀察值給出總體參數(shù)的估計范圍2.給出總體參數(shù)落在這一區(qū)間的概率給出總體參數(shù)落在這一區(qū)間的概率3.例如例如: 總體均值落在總體均值落在5070之間,置信度為之間,置信度為 95%1.總體未知參數(shù)落在區(qū)間內的概率總體未知參數(shù)落在區(qū)間內的概率2.表示為表示為 (1 - 為顯著性水平,是總體參數(shù)為顯著性水平,是總體參數(shù)未在未在區(qū)間內的概率區(qū)間內的概率
12、 3.常用的可信度有常用的可信度有99%, 95%, 90%;顯著性水平;顯著性水平值有(值有(相應的相應的 為)為)0.010.01,0.050.05,0.100.10。4.影響區(qū)間寬度的因素:影響區(qū)間寬度的因素:數(shù)據(jù)的離散程度,用來測度;樣本容量;置信水平 (1 - ),影響 Z 的大??;第三節(jié)第三節(jié) 總體均值和總體比例的區(qū)間總體均值和總體比例的區(qū)間估計估計1.總體均值的區(qū)間估計總體均值的區(qū)間估計2.總體比例的區(qū)間估計總體比例的區(qū)間估計3.樣本容量的確定樣本容量的確定總體均值的區(qū)間估計總體均值的區(qū)間估計l可信度為95的總體均值的區(qū)間估計為:X1.96SE,X+1.96SE;SE2=S2/n
13、;l可信度為99的總體均值的區(qū)間估計為:X2.58SE,X+2.58SE;SE2=S2/n;總體比例的區(qū)間估計總體比例的區(qū)間估計l可信度為95的總體均值的區(qū)間估計為:X1.96SE,X+1.96SE;lSE2=P(1-P)/n;l可信度為99的總體均值的區(qū)間估計為:X2.58SE,X+2.58SE;lSE2=P(1-P)/n;總體積矩相關系數(shù)的估計總體積矩相關系數(shù)的估計l規(guī)模相等的所有樣本規(guī)模相等的所有樣本r值的抽樣分布不是值的抽樣分布不是正態(tài)分布,需要轉化為正態(tài)分布,需要轉化為Z(服從正態(tài)分(服從正態(tài)分布):布):Z=1.151log(1+r)/(1-r);lZ值抽樣分布(正態(tài))的標準誤為值
14、抽樣分布(正態(tài))的標準誤為SE,SE21/(n-3);l查查Z值與值與r值的對照表,進而確定總體值的對照表,進而確定總體r值的區(qū)間估計。值的區(qū)間估計。決定樣本的大小決定樣本的大小l決定樣本大小的準則是:在能夠付出的決定樣本大小的準則是:在能夠付出的研究代價的限度內,選取最大的樣本。研究代價的限度內,選取最大的樣本。l參考準則參考準則:1)愿意容忍的誤差是多少?)愿意容忍的誤差是多少?2)個案之間的差距有多大)個案之間的差距有多大?l若我們能容忍的誤差越小,而個案之間若我們能容忍的誤差越小,而個案之間的差距越大,則樣本就要越大。的差距越大,則樣本就要越大。l某地區(qū)經(jīng)調查得知成年男人腳長服從正某地
15、區(qū)經(jīng)調查得知成年男人腳長服從正態(tài)分布,其平均長度為態(tài)分布,其平均長度為24.5,標準差為,標準差為2。某鞋廠計劃生產(chǎn)成年男鞋。某鞋廠計劃生產(chǎn)成年男鞋5萬雙,萬雙,大小分大小分8個號,每號相差個號,每號相差1(即(即21-28,特大號除外)。特大號除外)。l要求計算各號應生產(chǎn)多少雙?要求計算各號應生產(chǎn)多少雙?l隨機抽取隨機抽取324名工人的平均年齡為名工人的平均年齡為36.24歲,歲,標準差為標準差為10.32歲,分別求當可信度為歲,分別求當可信度為95%和和99時工人平均年齡的可信間距,時工人平均年齡的可信間距,并對結果加以比較。并對結果加以比較。95%(35.12,37.36)99(34.76,37.72)l甲、乙兩工廠工人婚姻狀況的資料如下:甲、乙兩工廠工人婚姻狀況的資料如下:在甲工廠在甲工廠390名職工中,已婚者為名職工中,已婚者為285名;名;乙工廠乙工廠500名職工中,已婚者為名職工中,已婚者為325名。名。分別求當可信度為分別求當可信度為99時兩廠工人已婚時兩廠工人已婚者的百分比的可信區(qū)間,并對結果進行者的百分比的可信區(qū)間,并對結果進行比較。比較。甲(67.28,78.87)乙(62.65,67.35)l計劃研究某社區(qū)男性青年的結婚年齡,計劃研究某社區(qū)男性青年的結婚年齡,容許樣本平均結婚年齡與總體平均年齡容許樣本平均結婚年齡與總
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 員工安全意識培養(yǎng)與提升
- 垂體瘤經(jīng)鼻蝶手術護理
- 《贛州產(chǎn)業(yè)結構變動》課件
- 《激子極化子異質結》課件
- 第24課 人民解放戰(zhàn)爭 說課說課稿-2024-2025學高一歷史統(tǒng)編版(2019)必修中外歷史綱要上冊
- 2024版員工合同書范例3篇
- 2024版物流配送服務合同標的及屬性詳細描述
- 醫(yī)療廢物管理制度及規(guī)范
- 《汽車路演執(zhí)行手冊》課件
- 2025年北師大新版九年級生物下冊月考試卷
- 巖溶區(qū)水文地質參數(shù)研究-洞察分析
- 2024-2025學年人教版八年級上冊地理期末測試卷(二)(含答案)
- 80、沈陽桃仙機場二平滑工程冬期施工方案
- 《STM32Cube嵌入式系統(tǒng)應用》HAL庫版本習題及答案
- 一年級數(shù)學練習題-20以內加減法口算題(4000道)直接打印版
- 浙江省金華市(2024年-2025年小學五年級語文)人教版質量測試((上下)學期)試卷及答案
- 2024年度無人機飛行培訓合同
- 2025年中國細胞與基因治療行業(yè)深度分析、投資前景、趨勢預測報告(智研咨詢)
- 統(tǒng)編版語文二年級上冊第一單元快樂讀書吧(推進課)公開課一等獎創(chuàng)新教案
- 2024-2030年中國LNG(液化天然氣)行業(yè)發(fā)展分析及投資可行性研究報告
- 17.2.4 一元二次方程求根公式 同步練習
評論
0/150
提交評論