04.抽樣誤差與假設(shè)檢驗(yàn)(PPT49頁)_第1頁
04.抽樣誤差與假設(shè)檢驗(yàn)(PPT49頁)_第2頁
04.抽樣誤差與假設(shè)檢驗(yàn)(PPT49頁)_第3頁
04.抽樣誤差與假設(shè)檢驗(yàn)(PPT49頁)_第4頁
04.抽樣誤差與假設(shè)檢驗(yàn)(PPT49頁)_第5頁
已閱讀5頁,還剩44頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第四章抽樣誤差與假設(shè)檢驗(yàn)Sampling error & Hypothesis test1本章結(jié)構(gòu)均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤t分布總體均數(shù)的估計(jì)假設(shè)檢驗(yàn)的意義和步驟2均數(shù)的抽樣誤差與標(biāo)準(zhǔn)誤Standard error3統(tǒng)計(jì)推斷(statistical inference)總體樣本 sampling 統(tǒng)計(jì)量 參 數(shù) inference參數(shù)估計(jì)假設(shè)檢驗(yàn)4一、均數(shù)的抽樣誤差和標(biāo)準(zhǔn)誤 抽樣研究,一定存在著抽樣誤差。因此,估計(jì)抽樣誤差的大小,就成為統(tǒng)計(jì)推斷必須要解決的問題。 抽樣誤差的概念?抽樣誤差的大?。?抽樣誤差的概念定義:由抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)間、以及樣本統(tǒng)計(jì)量與樣本統(tǒng)計(jì)量之間的差別。原因:

2、個(gè)體變異隨機(jī)抽樣表現(xiàn):樣本統(tǒng)計(jì)量與總體參數(shù)間的差別不同樣本統(tǒng)計(jì)量間的差別6假設(shè)一個(gè)已知總體,從該總體中重復(fù)抽取樣本量相等(為m)的樣本n次,對(duì)每個(gè)樣本計(jì)算樣本統(tǒng)計(jì)量(均數(shù)、方差等),觀察n個(gè)樣本統(tǒng)計(jì)量的分布規(guī)律抽樣分布規(guī)律。考察:不同的分布-正態(tài)分布、偏態(tài)分布不同的樣本含量抽樣試驗(yàn)7 由中心極限定理及大數(shù)定理得出: 若原變量X服從正態(tài)分布,隨機(jī)抽取樣本含量為n的樣本均數(shù) 也服從正態(tài)分布。 即使從偏態(tài)總體中隨機(jī)抽樣,當(dāng)n足夠大(n50),樣本均數(shù)也近似服從正態(tài)分布。 這個(gè)定理不僅具有理論價(jià)值,而且具有很高的實(shí)用價(jià)值。因?yàn)樵趯?shí)際工作當(dāng)中,許多醫(yī)學(xué)測(cè)量結(jié)果并不知道它的確切分布,有了這個(gè)性質(zhì),就可以利

3、用正態(tài)分布的原理對(duì)其特征進(jìn)行統(tǒng)計(jì)推斷。樣本均數(shù)的分布:8 從正態(tài)分布總體N(5.00,0.502)中,每次隨機(jī)抽取樣本含量n5,并計(jì)算其均數(shù)與標(biāo)準(zhǔn)差;重復(fù)抽取1000次,獲得1000份樣本;計(jì)算1000份樣本的均數(shù)與標(biāo)準(zhǔn)差,并對(duì)1000份樣本的均數(shù)作直方圖。 按上述方法再做樣本含量n10、樣本含量n30的抽樣實(shí)驗(yàn);比較計(jì)算結(jié)果。9抽樣試驗(yàn)(n=5)10抽樣試驗(yàn)(n=10)11抽樣試驗(yàn)(n=30)12133個(gè)抽樣實(shí)驗(yàn)結(jié)果圖示14樣本均數(shù)的抽樣分布特點(diǎn)各樣本均數(shù)未必等于總體均數(shù);樣本均數(shù)之間存在差異;樣本均數(shù)的分布很有規(guī)律,圍繞著總體均數(shù),中間多、兩邊少,左右基本對(duì)稱,也服從正態(tài)分布;樣本均數(shù)的變

4、異較原變量的變異大大縮小。隨著樣本含量的增加,樣本均數(shù)的變異范圍逐漸縮小。15標(biāo)準(zhǔn)誤的概念(standard error)樣本均數(shù)的標(biāo)準(zhǔn)差稱為均數(shù)的標(biāo)準(zhǔn)誤。均數(shù)的標(biāo)準(zhǔn)誤表示樣本均數(shù)的變異度。當(dāng)總體標(biāo)準(zhǔn)差未知時(shí),用樣本方差代替,抽樣誤差的大小用標(biāo)準(zhǔn)誤來衡量!16標(biāo)準(zhǔn)誤的概念 抽樣的樣本量越大,標(biāo)準(zhǔn)誤就越小; 原來總體變異度小,標(biāo)準(zhǔn)誤就越小。 標(biāo)準(zhǔn)誤反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)之間的差異。當(dāng)標(biāo)準(zhǔn)誤大時(shí),用樣本均數(shù)對(duì)總體均數(shù)的估計(jì)的可靠程度就小;反之亦然。17 例,2000年某研究者隨機(jī)調(diào)查某地健康成年男子27人,測(cè)其血紅蛋白量均數(shù)為125 g /L,標(biāo)準(zhǔn)差為15 g /L

5、。試估計(jì)該樣本均數(shù)的抽樣誤差。272.8918標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤意義:標(biāo)準(zhǔn)差用于描述個(gè)體值之間的變異,即觀察值間的離散度, 標(biāo)準(zhǔn)差小,表明觀察值圍繞均數(shù)的波動(dòng)?。粯?biāo)準(zhǔn)誤描述統(tǒng)計(jì)量的抽樣誤差,即樣本統(tǒng)計(jì)量與總體參數(shù)的接近程度。標(biāo)準(zhǔn)誤小,表明抽樣誤差小,則統(tǒng)計(jì)量穩(wěn)定,與參數(shù)接近。用途:標(biāo)準(zhǔn)差表示觀察值間波動(dòng)的大小,用于醫(yī)學(xué)參考值范圍;標(biāo)準(zhǔn)誤表示抽樣誤差的大小,用于參數(shù)估計(jì)。關(guān)系:隨著樣本含量增加,都減小。聯(lián)系:都是表示變異度的指標(biāo),當(dāng)樣本量一定時(shí),兩者成正比。19標(biāo)準(zhǔn)誤用途衡量樣本均數(shù)的可靠性:標(biāo)準(zhǔn)誤越小,表明樣本均數(shù)越可靠;參數(shù)估計(jì):估計(jì)總體均數(shù)的置信區(qū)間(區(qū)域);假設(shè)檢驗(yàn):用于總體均數(shù)的假設(shè)檢驗(yàn)(

6、比較)。2021t-分布t-distribution2223t 分布的概念用樣本方差代替總體方差,此時(shí)不再服從正態(tài)分布。而服從 t 分布。記為: 24t分布曲線 t 分布有如下性質(zhì):單峰分布,曲線在t0 處最高,并以t0為中心左右對(duì)稱與正態(tài)分布相比,曲線最高處較矮,兩尾部翹得高(見綠線) 隨自由度增大,曲線逐漸接近正態(tài)分布;分布的極限為標(biāo)準(zhǔn)正態(tài)分布。2526t分布曲線下面積(附表2)雙側(cè)t0.05/2,92.262 單側(cè)t0.025,9單側(cè)t0.05,91.833雙側(cè)t0.01/2,93.250 單側(cè)t0.005,9單側(cè)t0.01,92.821雙側(cè)t0.05/2,1.96 單側(cè)t0.025,單

7、側(cè)t0.05, 1.6427總體均數(shù)的估計(jì)Parameter estimation28總體均數(shù)估計(jì)方法29總體均數(shù)的估計(jì): 點(diǎn)值估計(jì)(point estimation):例,120名成年男子血清鐵含量的均數(shù)是18.57。那么,該總體范圍(這個(gè)地區(qū))的成年男子血清鐵含量的均數(shù)就是18.57。這種方法雖簡單,但未考慮抽樣誤差,一般不用。30區(qū)間估計(jì)(interval estimation)也稱置信區(qū)間。利用樣本信息給出一個(gè)區(qū)間,并同時(shí)給出按預(yù)先給定的概率估計(jì)該區(qū)間包含總體均數(shù)的可能范圍。可信度:給定的概率稱為可信度。用 表示。通常取99%、95%。31t分布方法應(yīng)用條件:總體方差未知,樣本量小32

8、例4.2 某醫(yī)師測(cè)的40名老年性慢性支氣管炎病人尿中17-酮類固醇排出量均數(shù)為15.19umol/d,標(biāo)準(zhǔn)差為5.03umol/d,試估計(jì)該種病人尿17-酮類固醇排出量總體均數(shù)的95%可信區(qū)間。分析條件:總體方差未知,樣本量?。?3.5816.80)33正態(tài)分布近似法應(yīng)用條件:當(dāng)總體標(biāo)準(zhǔn)差已知時(shí);或總體標(biāo)準(zhǔn)差未知,而樣本量較大時(shí)(n50)0-11-1.961.96-2.582.5868.27%95.00%99.00%34例4.3 某市隨機(jī)抽查12歲男孩100人,得身高均數(shù)139.6cm,標(biāo)準(zhǔn)差6.85cm。計(jì)算該地12歲男孩身高均數(shù)的95%的可信區(qū)間。分析條件:總體方差未知,但樣本量大,用正態(tài)

9、分布法3595可信區(qū)間:從總體中作隨機(jī)抽樣,作100次抽樣,每個(gè)樣本可算得一個(gè)可信區(qū)間,得100個(gè)可信區(qū)間,平均有95個(gè)可信區(qū)間包括(估計(jì)正確),只有5個(gè)可信區(qū)間不包括(估計(jì)錯(cuò)誤)。可信區(qū)間的涵義36假設(shè)檢驗(yàn)Hypothesis test37假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的另一個(gè)重要內(nèi)容。假設(shè)檢驗(yàn)是對(duì)所估計(jì)的總體首先提出一個(gè)假設(shè),然后通過樣本數(shù)據(jù)去推斷是否拒絕這一假設(shè),如果拒絕,認(rèn)為該樣本很可能不是來自這個(gè)總體;否則,認(rèn)為該樣本很可能來自這個(gè)總體。38讓我們先看一個(gè)例子.例4.4 根據(jù)大量調(diào)查,已知健康成年男子的脈搏均數(shù)為72次/分。某醫(yī)生在某山區(qū)隨機(jī)調(diào)查30名健康男子,求得脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)

10、差為6.5次/分。能否認(rèn)為該山區(qū)的成年男子的脈搏均數(shù)高于一般成年男子的脈搏均數(shù)?39對(duì)差別的可能原因分析山區(qū)男子脈搏的總體均數(shù)與一般成年男子的脈搏均數(shù)相等,差異是由抽樣誤差引起的提示山區(qū)男子是一般男子總體的一部分(研究總體)。山區(qū)男子脈搏的總體均數(shù)與一般成年男子的脈搏均數(shù)不相等,差異可能是由地域等因素引起的提示山區(qū)男子與一般男子是兩個(gè)不同的總體。40假設(shè)檢驗(yàn)通過對(duì)假設(shè)作出取舍抉擇來達(dá)到解決問題的目的A.山區(qū)男子脈搏的總體均數(shù)與一般成年男子的脈搏均數(shù)相等 無差異假設(shè)、零假設(shè) H0(null hypothesis)B.山區(qū)男子脈搏的總體均數(shù)與一般成年男子的脈搏均數(shù)不相等 對(duì)立假設(shè)、備擇假設(shè)H1(a

11、lternative hypothesis)41證明A還是證明B?在H0成立的條件下,均數(shù)之間的差異是由抽樣誤差引起的,有規(guī)律可循;在H1成立的條件下,均數(shù)間的不同包含種種未知情形,無規(guī)律可循。故從H0成立的角度出發(fā),尋求其成立的概率。42 變量值(脈搏)X服從正態(tài)分布,且為小樣本,假定H0成立,樣本均數(shù)服從t-分布,則在H0成立的前提下,當(dāng)前t值出現(xiàn)的概率有多大?43如何給出這個(gè)量的界限?小概率事件在一次試驗(yàn)中基本上不會(huì)發(fā)生 !從附表2中查出在顯著性水平=0.05(雙側(cè)),自由度為所對(duì)應(yīng)的t界值,即為拒絕域與接受域的界限。如果計(jì)算出的t統(tǒng)計(jì)量大于相應(yīng)的t界值,則落在拒絕域中,該統(tǒng)計(jì)量出現(xiàn)的概率小于5%,為小概率事件。44常取 的選擇要根據(jù)實(shí)際情況而定通常取0.05檢驗(yàn)水準(zhǔn)的概念在假設(shè)檢驗(yàn)中,稱預(yù)先規(guī)定的小概率值為檢驗(yàn)水準(zhǔn),也稱為顯著性水準(zhǔn),用表示。45這里所依據(jù)的邏輯是: 如果H0 是成立的,那么衡量差異大小的某個(gè)統(tǒng)計(jì)量落入?yún)^(qū)域 拒絕域 是個(gè)小概率事件。如果該統(tǒng)計(jì)量的實(shí)測(cè)值落入拒絕域,也就是說, H0 成立下的小概率事件發(fā)生了,那么就認(rèn)為H0不可信而否定它。否則我們就不能否定H0 (只好接受它).461. 建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn); H0:零假設(shè)、無效假設(shè)。是與研究假設(shè)有關(guān)的、被推斷特征某種確定的關(guān)系; H1:備擇假設(shè)、對(duì)立假設(shè)。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論