版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
抽樣誤差與假設檢驗t檢驗第1頁/共72頁幾個概念:計量資料:測定每個觀察單位某項指標量的大小得到的數(shù)據(jù)(資料)??傮w:研究對象(某項變量值)的全體。樣本:總體中隨機抽取的一部分研究對象的某項變量值。統(tǒng)計量:從樣本計算出來的統(tǒng)計指標。參數(shù):總體的統(tǒng)計指標叫總體參數(shù)。第2頁/共72頁統(tǒng)計推斷:用樣本信息推論總體特征的過程。包括:參數(shù)估計:
運用統(tǒng)計學原理,用從樣本計算出來的統(tǒng)計指標量,對總體統(tǒng)計指標量進行估計。假設檢驗:又稱顯著性檢驗,是指由樣本間存在的差別對樣本所代表的總體間是否存在著差別做出判斷。方法:均數(shù)的參數(shù)估計、均數(shù)t檢驗第3頁/共72頁一、抽樣誤差與標準誤(一)概念1、抽樣誤差:是伴隨抽樣所產(chǎn)生的樣本統(tǒng)計量與參數(shù)之間的差別。2、標準誤:符號,表示抽樣誤差大小的指標;也稱為樣本均數(shù)的標準差;反映了用樣本均數(shù)代替總體均數(shù)的可靠性程度的大小,增加樣本容量可以降低抽樣誤差。
抽樣誤差與抽樣分布第4頁/共72頁(二)、表達式與計算
樣本均數(shù)的標準差,也稱為標準誤,反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異。例4.1某市隨機抽查12歲男孩100人,得身高均數(shù)139.6cm,標準差6.85cm,計算標準誤。第5頁/共72頁標準差與標準誤聯(lián)系與區(qū)別標準差標準誤含義測量值的離散程度樣本均數(shù)的離散程度(統(tǒng)計量對參數(shù)的散度)計算大小大小用途描述測量值離散程度、計算cv、計算正常值范圍、計算標準誤參數(shù)可信區(qū)間的估計假設檢驗,表達誤差的內涵聯(lián)系都是離散程度的指標,標準誤是通過標準差來計算第6頁/共72頁二、抽樣分布從正態(tài)總體中抽樣,樣本均數(shù)()的抽樣分布:1.n較大時(n>50),服從正態(tài)分布,經(jīng)過標準化轉換
服從標準正態(tài)分布即u分布2.n較小時(n<50),是非正態(tài)的單峰對稱分布
就有小樣本統(tǒng)計量()的轉換值服從t分布(是一組曲線)。
第7頁/共72頁抽樣分布第8頁/共72頁英國統(tǒng)計學家:哥塞德在1908年以筆名“student”提出了著名的t分布,故也稱為studentt分布。t分布是描述小樣本均值轉換度的分布。1、從正態(tài)總體中抽樣,大樣本均數(shù)的轉換值服從標準正太分布2、小樣本均數(shù)的轉換值服從t分布第9頁/共72頁(1)t→u(n→∞)(2)和N(0,1)一樣都是單峰分布,以0為中心對稱(3)越小,則越大,t值越分散,和N(0,1)相比,集中在這部分的比例越少,尾部翹得越高。2、t分布的特征第10頁/共72頁第11頁/共72頁t
分布(與u分布比較的特點)第12頁/共72頁
橫坐標為自由度,縱坐標為概率p,表中數(shù)字表示自由度為、p為、t的界值,記如單側=0.05,=20可查得=1.725
表示p(t≥1.725)=0.05
由t分布的對稱性p(t≤-1.725)=0.05tα,ν以外尾部面積的百分數(shù)是3、t界值表第13頁/共72頁
的界值第14頁/共72頁與u分布比較U的臨界值小于t曲線相應的臨界值的絕對值當n→∞時,臨界值相近。自由度越小,t的臨界點越偏離u的臨界點。第15頁/共72頁總體均數(shù)的參數(shù)估計參數(shù)估計:是指由樣本指標值(統(tǒng)計量)估計總體指標值(參數(shù)),即用樣本均數(shù)估計總體均數(shù),有兩種估計方法:
(1)、點估計(近似值)
(2)、區(qū)間估計(近似范圍)第16頁/共72頁一、點估計點估計:用樣本均數(shù)直接作為總體均數(shù)的估計值,未考慮抽樣誤差。如用估計相應的μ當時,樣本均值趨近于總體均值.
如果,則更可靠.第17頁/共72頁二、區(qū)間估計1、概念可信區(qū)間:也稱為置信區(qū)間(confidenceinterval,CI),是按預先給定的概率估計未知總體均數(shù)的可能范圍.
事先給定的概率1-α稱為可信度,常取95%或99%總體均數(shù)的95%(或99%)可信區(qū)間:表示該區(qū)間包括總體均數(shù)μ的概率為95%(或99%).第18頁/共72頁根據(jù)總體標準差σ是否已知,以及樣本含量n的大小而異。(1)t分布法(n<50)(2)u分布法(n>50)2、計算方法第19頁/共72頁(1)t分布法(σ未知,n<50)按t分布原理,可用以下公式進行區(qū)間估計:對上式進行變換,得置信度為1-α的總體均數(shù)可信區(qū)間的通式為:習慣將上式寫成:第20頁/共72頁例某醫(yī)師測得40名老年慢性支氣管炎病人中17-酮類固醇排除量均數(shù)為15.9μmol/d,標準差為5.03μmol/d,試估計該種病人尿17-酮類固醇排除量總體均數(shù)的95%可信區(qū)間.本例中:n=40,=5.03,
=n-1=39,α取0.05,查t值表
95%的可信區(qū)間第21頁/共72頁(2)U分布法(σ已知或未知,但n足夠大n>50)總體均數(shù)的可信區(qū)間.σ已知:σ未知但n足夠大:第22頁/共72頁uα可以查表某地12歲男孩身高均數(shù)的95%的可信區(qū)間.本例中:n=100,=139.6,s=6.85,u0.05=1.96該地12歲男孩身高均數(shù)的95%可信區(qū)間為:138.3(cm)~141.0(cm)
第23頁/共72頁注意(1)統(tǒng)計意義:從總體中作大數(shù)次隨機抽樣,有95%求得的可信區(qū)間包含總體均數(shù)。并不是做一次抽樣求得可信區(qū)間包括μ的概率是0.95,對一次抽樣而言只有兩種可能,要么可信區(qū)間包含μ,要么不包含μ。(2)與醫(yī)學正常值范圍不同第24頁/共72頁正常值范圍估計與可信區(qū)間估計正常值范圍概念:絕大多數(shù)正常人的某指標范圍。(95%,99%,指絕大多數(shù)正常人)計算公式:用途:判斷觀察對象的某項指標是否正常.可信區(qū)間概念:總體均數(shù)所在的數(shù)值范圍(95%,99%指可信度)計算公式:用途:估計總體均數(shù)第25頁/共72頁假設檢驗的意義和步驟假設檢驗(hypothesistest)也稱顯著性檢驗(significancetest)。二十世紀二、三十年代Neyman和Pearson建立了統(tǒng)計假設檢驗問題的數(shù)學模型。假設檢驗:建立在統(tǒng)計抽樣分布,小概率事件原理基礎上的對差別性質進行風險推斷的一種邏輯思維方法.第26頁/共72頁假設檢驗:1、原因2、目的3、原理4、過程(步驟)5、結果第27頁/共72頁1、假設檢驗的原因
由于個體差異的存在,即使從同一總體中嚴格的隨機抽樣,X1、X2、X3、X4、、、,不同。
因此,X1、X2不同有兩種(而且只有兩種)可能:(1)分別所代表的總體均數(shù)相同,由于抽樣誤差造成了樣本均數(shù)的差別。差別無顯著性。(2)分別所代表的總體均數(shù)不同。差別有顯著性。第28頁/共72頁
根據(jù)大量調查,已知健康成年男子脈搏的均數(shù)為72次/分,某醫(yī)生在一山區(qū)隨機調查了30名健康成年男子,求得脈搏均數(shù)為74.2次/分,標準差為6.5次/分,能否據(jù)此認為該山區(qū)成年男子的脈搏均數(shù)高于一般人?第29頁/共72頁
我們當然不能強求脈搏均數(shù)恰為72次/分時,才認為山區(qū)成年男子的脈搏均數(shù)和一般人一樣,因為即使一樣由于抽樣誤差的存在,樣本均數(shù)未必等于72,造成山區(qū)健康成年男子的脈搏樣本均數(shù)與一般人不同的原因有:①抽樣誤差②環(huán)境因素的影響要回答這一問題就是假設檢驗問題第30頁/共72頁2、假設檢驗的目的
判斷是由于何種原因造成的不同,以做出決策。(推斷參數(shù)是否相等)無效假設備擇假設第31頁/共72頁3、假設檢驗的原理/思想反證法:當一件事情的發(fā)生只有兩種可能A和B,為了肯定其中的一種情況A,但又不能直接證實A,這時否定另一種可能B,則間接的肯定了A。小概率事件原理:
小概率事件在一次抽樣中不可能發(fā)生.概率論:事件的發(fā)生不是絕對的,只是可能性大小而已。即,帶有風險性的推斷.第32頁/共72頁4、假設檢驗的一般步驟▲建立一對假設(注意單雙側)確定顯著性水準():
無效假設(H0):兩個總體均數(shù)相等;
備擇假設(H1):與H0相反;
預先給定的概率值α(0.05或0.01),區(qū)分大小概率事件的標準.
如上例,H0:μ1=72
H1:μ1≠72
α=0.05▲計算統(tǒng)計量:(選擇不同的統(tǒng)計方法:u檢驗,t檢驗,F檢驗等)▲確定概率值p和做出統(tǒng)計推斷結論:(p值實際得到犯一類錯誤的可能性,p<α,則統(tǒng)計推斷為按α檢驗水準,拒絕H0,接受H1;p>α,則統(tǒng)計推斷為按α檢驗水準,不拒絕H0。)第33頁/共72頁5、假設檢驗的結果不拒絕無效假設拒絕無效假設正確理解結論的概率性(都隱含著犯錯誤的可能性)。第34頁/共72頁六、均數(shù)的假設檢驗t檢驗(ttest)也稱studentt檢驗,是計量資料中最常用的假設檢驗方法,它以t分布為基礎.本章將要介紹單個樣本的t檢驗(樣本均值與總體均值的比較)配對樣本t檢驗兩獨立樣本的t檢驗(兩樣本均值的比較,方差一致)第35頁/共72頁單個樣本t檢驗單個樣本t檢驗:是樣本均數(shù)代表的總體均數(shù)和已知總體均數(shù)
的比較.▲適用條件:(1)已知一個總體均數(shù);(2)可得到一個樣本均數(shù)及該樣本標準誤;(3)樣本量小于50;(4)樣本來自正態(tài)或近似正態(tài)總體。第36頁/共72頁例:根據(jù)大量調查,已知健康成年男子的脈搏均數(shù)為72次/分.某醫(yī)生在某山區(qū)隨機調查30名健康男子,求得脈搏均數(shù)為74.2次/分,標準差為6.5次/分.能否認為該山區(qū)的成年男子的脈搏均數(shù)高于一般成年男子的脈搏均數(shù)?第37頁/共72頁因本例已知=72次/分,=74.2次/分,s=6.5次/分,n=30,由于已知,故選用單樣本t檢驗1、建立檢驗假設,確定概率水準
山區(qū)成年男子平均脈搏數(shù)與一般成年男子相同。山區(qū)成年男子平均脈搏數(shù)與一般成年男子不同。2、計算檢驗統(tǒng)計量在μ=μ0成立的條件下,計算統(tǒng)計量為:第38頁/共72頁3、確定p值,做出推斷結論查表2,可得t0.05/2(29)=2.045
今t<
t0.05/2(29)
故,p>0.05,無統(tǒng)計學意義,按α水準,不拒絕H0,尚不能認為該山區(qū)成年男子平均每分鐘脈搏數(shù)高于一般成年男子。第39頁/共72頁配對樣本均數(shù)t檢驗簡稱配對t檢驗(pairedttest),又稱非獨立兩樣本均數(shù)t檢驗,適用于配對設計計量資料均數(shù)的比較,其比較目的是檢驗兩相關樣本均數(shù)所代表的未知總體均數(shù)是否有差別。配對設計(paireddesign)是將受試對象按某些重要特征相近的原則配成對子,每對中的兩個個體隨機地給予兩種處理。配對樣本t檢驗第40頁/共72頁(1)兩種同質受試對象分別接受兩種處理:
如:把同窩、同性別和體重相近的動物配成一對。(2)同一受試對象或同一樣本的兩個部分,分別接受兩種不同處理:
如:把服用兩種降糖藥的病人配成對(3)同一受試對象處理(實驗或治療)前后的結果比較:如:對高血壓患者治療前后配對設計資料主要有三種類型:應用配對設計可以減少實驗的誤差和控制非處理因素,提高統(tǒng)計處理的效率。第41頁/共72頁配對樣本t檢驗的原理配對樣本t檢驗實際上是配對設計的差值均數(shù)與總體均數(shù)0比較的t檢驗配對樣本t檢驗的基本原理是假設兩種處理的效應相同,即μ1=μ2,則μ1-μ2=0(即,已知總體均數(shù)μd=0),即檢驗差值的樣本均數(shù)所代表的未知總體均數(shù)μd
與0的比較.第42頁/共72頁公式:自由度:對子數(shù)-1適用條件:兩組配對計量資料。樣本來自正態(tài)分布總體,配對t檢驗要求差值服從正態(tài)分布,實際應用時單峰對稱分布也可以;大樣本時,用u檢驗,且正態(tài)性要求可以放寬;第43頁/共72頁患者編號(1)舒張壓(Kpa)治療前后差數(shù)d(4)=(2)-(3)d2(5)=(4)*(4)手術前(2)手術后(2)116.012.04.016.00212.013.3-1.31.69314.610.64.016.00413.312.01.31.69512.012.000612.010.61.41.96714.610.64.016.00814.614.600912.012.7-0.70.491013.313.300合計--=12.7=53.83第44頁/共72頁例某醫(yī)院在研究腎動脈成形術前后血液動力學的改變中,觀察了10例病人手術前后的血壓變化情況見表,試問手術前后舒張壓有無變化?1、建立檢驗假設,確定檢驗水準H0:μd=0,即假設手術前后舒張壓無變化,樣本是從差數(shù)均數(shù)為0的總體中抽得。H1:μd≠
0,即手術前后舒張壓有變化。α=0.05第45頁/共72頁2、計算檢驗統(tǒng)計量先計算差值d及d2,得計算差值均數(shù)計算差值的標準差計算差值的標準誤得第46頁/共72頁計算t值3、確定p值,作出推斷結論自由度ν=n-1=10-1=9,
t0.05/2(9)=2.262本例t<
t0.05/2(9),p>0.05,按α=0.05檢驗水準,不拒絕H0,即還不能認為手術前后的舒張壓不同。第47頁/共72頁兩獨立樣本的t檢驗目的:由兩個樣本均數(shù)的差別推斷兩樣本所代表的總體均數(shù)間有無差別。
計算公式及意義:公式:
第48頁/共72頁應用條件:(1)已知/可計算兩個樣本均數(shù)及它們的標準差;(2)兩個樣本之一的例數(shù)少于50;(3)樣本來自正態(tài)或近似正態(tài)總體;(4)方差齊。自由度:第49頁/共72頁兩獨立樣本t檢驗——實例分析例5.325例糖尿病患者隨機分成兩組,甲組單純用藥物治療,乙組采用藥物治療合并飲食療法,二個月后測空腹血糖(mmol/L)如表5-2所示,問兩種療法治療后患者血糖值是否相同?第50頁/共72頁第51頁/共72頁兩獨立樣本t檢驗——檢驗步驟1、建立檢驗假設,確定檢驗水準H0:1=2,兩種療法治療后患者血糖值的總體均數(shù)相同;H1:12,兩種療法治療后患者血糖值的總體均數(shù)不同;0.05。2、計算檢驗統(tǒng)計量第52頁/共72頁兩獨立樣本t檢驗——檢驗步驟代入公式,得:第53頁/共72頁兩獨立樣本t檢驗——實例分析按公式計算,算得:3、確定P值,作出推斷結論兩獨立樣本t檢驗自由度為
=n1+n2-2
=12+13-2=23;查t界值表,t0.05/2(23)=2.069,t0.01/2(23)=2.807.第54頁/共72頁兩獨立樣本t檢驗——實例分析t
t0.05/2(23),P0.05,按0.05的水準拒絕H0,接受H1,差異有統(tǒng)計學意義。故可認為該地兩種療法治療糖尿病患者二個月后測得的空腹血糖值的均數(shù)不同。第55頁/共72頁配對t檢驗與兩樣本的t檢驗的比較配對兩樣本隨機分配多次對間隨機完全隨機計算方法誤差內涵測量誤差抽樣誤差誤差大小小大效率高低第56頁/共72頁兩樣本含量較大時均數(shù)的比較當樣本含量較大時,可用u檢驗法某醫(yī)院對40~50歲年齡組的男、女不同性別的健康人群測定了脂蛋白有無差別?性別人數(shù)均值標準差男1933.971.04女1283.580.90第57頁/共72頁1、建立假設并確定檢驗水準H0:μ1=μ2,即不同性別健康人群脂蛋白無差別;H1:μ1≠μ2,即不同性別健康人群脂蛋白有差別;α=0.05第58頁/共72頁2、計算u值第59頁/共72頁3、確定P值
不必查表,雙側檢驗以u=1.96時、P=0.05,今u=3.75>1.96,故p<0.05。按α=0.05的水準,拒絕H0,接受H1。認為男性脂蛋白含量高于女性脂蛋白含量。第60頁/共72頁t檢驗中的注意事項1.
要有嚴密的抽樣研究計劃要保證樣本是從同質總體中隨機抽取。除了對比的因素外,其它影響結果的因素應一致。2.選用的假設檢驗方法應符合其應用條件要了解變量的類型是計量的還是計數(shù)的,設計類型是配對設計還是成組設計,是大樣本還是小樣本。第61頁/共72頁假設檢驗的結論是根據(jù)概率推斷的,所以不是絕對正確的:(1)當p<,拒絕H0,接受H1,按接受H1下結論,可能犯錯誤;(2)當p>,不能拒絕H0,不能接受H1,按不能接受H1下結論,也可能犯錯誤;3.正確理解假設檢驗的結論(概率性)第62頁/共72頁4.正確理解差別有無顯著性的統(tǒng)計意義差別有顯著性,或有統(tǒng)計意義,指我們有很大的把握認為原假設不正確,并非是說它們有較大的差別。差別無顯著性,或無統(tǒng)計意義,我們只是認為以很大的把握拒絕原假設的理由還不夠充分,并不意味著我們很相信它。5.統(tǒng)計顯著性與其它專業(yè)上的顯著性的意義不同第63頁/共72頁6、可信區(qū)間與假設檢驗的聯(lián)系與區(qū)別假設檢驗用以推斷總體均數(shù)間是否相同,而可信區(qū)間則用于估計總體均數(shù)所在的范圍,兩者既有聯(lián)系又有區(qū)別。根據(jù)研究的目的和專業(yè)知識來決定單雙側,在沒有特別說明的情況下通常采取雙側。7.單側檢驗與雙側檢
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 年度環(huán)保設備采購及運營維護合同2篇
- 二零二五年度出納崗位培訓聘用合同范本3篇
- 二零二五年度高端定制家具設計與制造合同協(xié)議范本3篇
- 二零二五年度出租車行業(yè)車輛維修承包合同3篇
- 個人與個人之間特許經(jīng)營權轉讓合同(2024版)3篇
- 2025年度人工智能技術應用合作合同2篇
- 二零二五年度苗木育種技術合作開發(fā)合同3篇
- 二零二五年度建筑工程棄土清運及環(huán)保處理服務合同
- 2025年圍墻安裝與智慧城市基礎設施連接合同3篇
- 室內設計公司2025年度合作框架合同3篇
- 習近平法治思想概論教學課件緒論
- 寵物會展策劃設計方案
- 孤殘兒童護理員(四級)試題
- 梁湘潤《子平基礎概要》簡體版
- 醫(yī)院急診醫(yī)學小講課課件:急診呼吸衰竭的處理
- 腸梗阻導管在臨床中的使用及護理課件
- 調料廠工作管理制度
- 小學英語單詞匯總大全打印
- 衛(wèi)生健康系統(tǒng)安全生產(chǎn)隱患全面排查
- GB/T 15114-2023鋁合金壓鑄件
- 貨物驗收單表格模板
評論
0/150
提交評論