




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、衛(wèi)生統(tǒng)計學知識點匯總PAGE PAGE 175第一講 緒論總體:是研究目的所確定的所有同質個體某指標實際值的集合;或說, 總體是根據(jù)研究目確實定的所有同質觀察對象的全體。樣本:根據(jù)隨機化的原那么從總體中抽取有代表性的局部觀察單位,其變量實測值構成樣本。樣本含量:樣本所包含個體或個體值的個數(shù)。抽樣Sampling :從總體中抽取有代表性的一局部樣本的過程,稱為抽樣。抽樣研究:從確定的同質總體中隨機抽取局部樣本進行觀察,用樣本信息來推斷總體特征,該研究方法叫抽樣研究。統(tǒng)計推斷:樣本的現(xiàn)象推斷所研究總體的特征。即分析樣本數(shù)據(jù),獲得關于總體的知識。同質homogeneity:指研究對象在一定范疇的各種
2、可能影響主要觀察指標的其它因素處于相同或非常相似的情況,即把具有相同性質的觀察單位簡稱為同質的homogeneous,否那么稱為異質的heterogeneous 。變異variation:同質根底上的各觀察單位間的差異 參數(shù):根據(jù)總體變量值統(tǒng)計計算出來,描述總體特征的統(tǒng)計指標。統(tǒng)計量:根據(jù)樣本個體值統(tǒng)計計算出來,描述特征的統(tǒng)計指標。變量:變異性表現(xiàn)為取值上的大小就是變量。通常把觀察單位的觀察指標稱為變量。如身高、體重等變量值:觀察單位 的觀察值 叫變量值,如身高 118cm,體重26kg 等。誤差:為觀察值X與實際值之差。抽樣誤差sampling error :由抽樣造成的樣本統(tǒng)計量和總體參數(shù)
3、的差異、以及樣本統(tǒng)計量之間的差異稱為抽樣誤差。隨機事件(Radom event):隨機試驗中可能出現(xiàn)的各種結果,叫隨機事件。即在一定條件下具有多種可能發(fā)生的結果,而究竟發(fā)生那一個結果不能肯定,又稱偶然事件。概率Probability:描述隨機事件發(fā)生的可能性大小的一種度量,常用P 表示。 小概率事件:當隨機事件A的概率P(A),習慣上,當=0.05時,就稱A為小概率事件;其統(tǒng)計學意義是小概率事件在一次隨機試驗中不可能發(fā)生。頻率(Frequency):在n次試驗中,假設事件A發(fā)生的次數(shù)為m,那么:m稱為事件A在n次試驗中的頻數(shù),fn(A)稱為事件A在n次試驗中發(fā)生的頻率。統(tǒng)計描述:用統(tǒng)計指標、統(tǒng)
4、計表、統(tǒng)計圖等方法,對樣本資料的數(shù)量特征及其分布規(guī)律進行描述統(tǒng)計推斷:指用樣本信息推斷總體特征,包括參數(shù)估計和假設檢驗。第二講:數(shù)值變量的統(tǒng)計描述一、頻數(shù)表與頻數(shù)分布圖一根本概念:頻數(shù)( frequency ):指在一個抽樣資料中,某變量值出現(xiàn)的次數(shù)。頻數(shù)分布表frequency distribution table:將各數(shù)值變量的值及其相應的頻數(shù)列表,簡稱頻數(shù)表。頻率是表示頻數(shù)出現(xiàn)機率的指標,可用百分數(shù)或小數(shù)表示,頻率為100%或1。頻數(shù)分布圖frequency distribution figure :根據(jù)頻數(shù)分布表,以變量值為橫坐標,頻數(shù)為縱坐標,繪制的直方圖。二連續(xù)型變量頻數(shù)表的編制方
5、法: 求全距(Range,簡記R ):是一組資料中最大值Xmax與最小值Xmin之差,亦稱極差。2. 定組距:將全距分為假設干段,稱為組段。組與組之間的距離,稱為組距;用小寫i 表示。原那么:1“組段數(shù)一般為10-15個;2“組距一般為R/10取整;3為計算方便根據(jù)組距采取取整數(shù)方法3.寫組段:即將全距分為假設干段的過程。原那么:1第一組段要包括Xmin,最末組段包括 Xmax ; 2每組段均用下限值加 “ 表示,最終組段同時注明上下限。4. 列表劃記:根據(jù)預定的組段和組距,用劃記的方法整理原始資料。三頻數(shù)表的用途:1.揭示頻數(shù)的分布特征:集中趨勢與離散趨勢結合能全面反映頻數(shù)的分布特征2.揭示
6、頻數(shù)的分布類型 對稱分布 : 集中部位在中部,兩端漸少,左右兩側的根本對稱,為對稱正態(tài)分布。 正偏 : 集中部位偏于較小值一側(左側),較大值方向漸減少,為正偏態(tài)分布。負偏 : 集中部位偏于較大值一側(右側),較小值方向漸減少,為負偏態(tài)分布。3.便于發(fā)現(xiàn)某些特大或特小的可疑值。4. 樣本含量足夠大時,以頻率作為概率的估計值。5.作為陳述資料的形式。二、集中趨勢的指標集中趨勢:用于描述一組計量資料的集中位置,說明這種變量值大小的平均水平,常用平均數(shù)average表示。注意:1.同質的事物或現(xiàn)象才能求平均數(shù).應根據(jù)資料分布狀態(tài)選用適當?shù)木鶖?shù)。 算術均數(shù) : 單峰對稱分布包括 幾何均數(shù) : 對數(shù)正態(tài)
7、分布中位數(shù)、百分位數(shù) : 偏態(tài)分布一 算術平均數(shù)arithmetic mean 使用條件:數(shù)據(jù)分布比擬均勻呈正態(tài)分布或近似正態(tài)分布。 樣本均數(shù)用符號:X 表示 總體均數(shù)用符號:表示 計算方法有兩種:直接法小樣本和加權法大樣本1直接法:舉例: 某地10名18歲健康男大學生身高為cm: 168.7, 178.4, 170.0, 170.4, 172.1, 167.6, 172.4, 170.7, 177.3, 169.7求平均身高?10X)(171.7cm7169.4178.168.7 適用范圍:小樣本資料,n30方法:將觀察值X1、X2、X3、Xn直接相加,再除以觀察值的個數(shù)n。公式:2加權法:
8、適用范圍:大樣本含量的分組資料或頻數(shù)表資料。方法:計算各組段的組中值 Xi與其頻數(shù)f i的乘積和f x,然后除以總頻數(shù)f。公式:舉例: 用加權法計算某市8歲男童身高平均數(shù)(表3.1 )計算各組段的組中值xi、fxi和fx第1組段:117.5121191162上限下限x 用加權法計算該組身高值的均值)(050cmnfXX二 幾何均數(shù)geometric mean, G 概念:對一組觀察值,先進行對數(shù)變換,按算術均數(shù)計算方法求其對數(shù)值的均數(shù),該均數(shù)的反對數(shù)值即幾何均數(shù)G。 使用條件:用于原始數(shù)據(jù)分布呈偏態(tài)分布,等比資料倍數(shù)變化或對數(shù)正態(tài)分布資料的平均數(shù)的計算。 表示符號:G
9、 計算方法:直接法和加權法1直接法:適用范圍:小樣本資料方法:將n個觀察值X1,X2,3,Xn直接相乘再開n次方。公式:用對數(shù)形式表示為:舉例:設有5份血清樣品,滴度分別為: 1:1, 1:10, 1:100, 1:1000, 1:10000 求其平均滴度。G或 Glg-1(lg1+lg10+lg100+lg1000+lg10000)/5) lg-1(0+1+2+3+4)/5) lg-12 =100即:平均滴度為1:100;較好地代表了觀察值的平均水平。 2加權法:適用范圍:大樣本含量的分組資料或頻數(shù)表資料。公式:Glg-1 (f lgX/f )舉例:有95名麻疹易感兒童,接種麻疹疫苗一個月后
10、,血凝抑制抗體滴度見下表,試求平均滴度例3.3。 Glg-1 (f lgX/f )lg-1(145.0948/95) 33.68即95名易感兒童接種疫苗一個月后,血凝抑制抗體的 平均滴度為1:33.68。計算幾何均數(shù)G 考前須知:1觀察值不能為0;2觀察值不能同時有正有負;3同一組資料求得的幾何均數(shù)小于算術均數(shù)。練習:1.有8份血清的抗體效價分別為:1:5, 1:10, 1:20, 1:40, 1:80, 1:160, 1:320, 1:640 求平均抗體效價。將各抗體效價的倒數(shù)代入公式:所以血清的抗體平均為1:56.572.有50人的血清抗體效價,分別為:5人1:10, 9人1:20, 20
11、人1:40, 10人1:80, 6人1:160 求平均抗體效價。將各抗體效價的倒數(shù)代入公式:所以該50人的血清抗體效價為1:41.70三中位數(shù)Median,M 概念:把一組變量值從小到大排列,位于中間位置的變量值叫中位數(shù),用M表示。 使用條件:當一組資料類型分布不清或明顯 偏態(tài)分布時的平均數(shù)的計算。 表示符號:M 計算方法:直接法和加權法百分位數(shù)Percentile,P 概念:為一種位置指標,表示位于全部觀察值第X%位置處的數(shù)值。一個PX將總體或樣本的全部觀察值分為兩局部,理論上有X%的觀察值比它小,100-X%的觀察值比它大,P50分位數(shù)即是中位數(shù)。 表示符號:x 計算方法: 頻數(shù)表計算1直
12、接法由原始數(shù)據(jù)計算中位數(shù):當n為奇數(shù)時:2用頻數(shù)表計算中位數(shù)和百分位數(shù)步驟:按所分組段,由小到大計算累計頻數(shù)和累計頻率代入公式計算中位數(shù)及其它百分位數(shù)中位數(shù)計算公式 百分位數(shù)計算公式(mm)2/LfnfiLP注:fm 、 fx為所在組的頻數(shù), i 為該組段的組距, L為其下限 ,fL 為小于L的各組段的累積頻數(shù)。例:求164例沙門菌食物中毒病人潛伏期的中位數(shù)和百分位數(shù)P5、P95潛伏期(h) 頻數(shù)f 累積頻數(shù) 累計頻率(%) 0 21 2115.2412 58 7948.1724 4412375.0036 2314689.0248 1215896.3460 516399.3972 116410
13、0.001. 由表第(4)、 (1)欄可見,M(P50)在24 組段, 所以 L=24、i=12、fx=44、fL=79。2. 把 L=24、i=12、fx=44、fL=79代入公式, 求M。1244M(P50) = 24+ 164/2-79=24.8(h)3. 同樣方法,可求P5、P95 。P5 = 0+ 1645%-0=4.7(h)P95 = 48+ 16495%-146=57.8(h)應用:1.中位數(shù): 常用于描述偏態(tài)分布資料的集中位置,反映位置居中的觀察值的水平,它和均數(shù)、幾何均數(shù)不同,不是由全部觀察值的數(shù)量值綜合計算出來的,只受居中變量值的影響,不受兩端特大值和特小值的影響。因此,當
14、分布的一端或兩端無確定數(shù)值或資料的分布不清可以求中位數(shù)。 2.百分位數(shù): A.用于描述數(shù)據(jù)某一百分位的位置,最常用的是P50,即中位數(shù);也可用多個百分位數(shù)的結合來描述一組資料的分布特征,如用P25和 P75合用時,反映中間50%觀察值的分布情況。B.用于確定參考值范圍: WBC的95%參考值范圍:P2.5 P97.5過高過低均異常 肺活量95%參考值范圍:P5 過低異常 尿鉛95%參考值范圍:P95 過高異常C.用一組PX可較全面地描述總體或樣本的分布特征。 三、離散趨勢的指標離散趨勢:用于描述一組數(shù)值變量觀察值之間參差不齊的程度,即變異程度。 極差Range, R四分位數(shù)間距Quartile
15、, Q包括 方差Variance, 標準差Standard deviation,S2變異系數(shù)Coefficient of variation,CV一 極差Range, 簡稱R計算:R=最大值最小值= Xmax - Xmin 意義:反映樣本變量值的全范圍。條件:對變量值的各種分布類型的資料都適用。優(yōu)點:簡單明了,容易理解,使用方便。缺點:僅考慮了極大值和極小值,未考慮其它變量的個體差異。建議:與其他離散指標共同使用。極差的缺點:1.R只考慮最大值和最小值之差,不能反映組內其它觀察值的變異度。2.樣本例數(shù)越多,抽到極大值和極小值的可能性越大,故樣本例數(shù)懸殊時不易比擬極差。3.即使樣本例數(shù)不變,極差
16、的抽樣誤差亦較大,即不夠穩(wěn)定。二 四分位數(shù)間距uartile, 簡稱計算:=-=P75-P25意義:中間一半觀察值的極差。條件:對變量值的各種分布類型的資料都適用。優(yōu)點:類似值但比其穩(wěn)定。缺點:未考慮全部觀察值的變異度。建議:與其他離散指標共同使用。例:有164例沙門氏菌食物中毒病人的潛伏期小時, 求該潛伏期的四分位數(shù)間距。 P25 L i / f25 ( n25 % fL ) 12 12/5816425%21 16.14小時P75 L i / f 75 ( n75 % f L ) 24 12/4416475%79 36小時Q= P 75 - P 25 =36-16.14=19.86 小時 即
17、該潛伏期的四分位數(shù)間距為19.86小時。三 方差 Variance, 簡稱 計算:總體方差 樣本方差 意義:克服了值的缺乏,考慮了每個變量值的離散情況并消除了的影響。優(yōu)點:全面地考慮每個變量值的離散情況缺點:其單位是原度量單位的平方。)2nXXs1(四標準差Standard deviation,SD或S計算:總體標準差: 樣本標準差: 標準差的計算: 直接法: 加權法:1直接法:用于小樣本資料舉例 現(xiàn)有一影像醫(yī)生,測得10名患者的EA值分別為: 0.47, 0.60, 0.86, 0.96, 1.01, 1.13, 1.27, 1.58, 1.72, 2.88試計算其標準差?首先列表,求出X
18、和X 2表3.6將X、X2代入公式:2加權法:用于大樣本資料或頻數(shù)表資料舉例 計算100名8歲男孩身高的標準差從列表可知:fx =13 055.0、fX2 =1 707 127.00 和n =100代入公式:五 變異系數(shù):簡稱CV概念:是同一組資料的標準差與均數(shù)之比,又叫變異度或離散系數(shù)。計算:實際含義:標準差相對于同組均數(shù)的百分比。優(yōu)點:CV 消除了度量衡單位,用于比擬 1.單位不同的多組資料的變異度。 2.均數(shù)相差懸殊的多組資料的變異度身高體重舉例 :某地7歲男孩身高的均數(shù)為123.10cm,標準差4.71 cm;體重均數(shù)為22.29kg,標準差2.26kg。試比擬其身高、體重的變異程度。
19、說明其體重的變異度大于身高的,即身高比體重穩(wěn)定。小 結為描述數(shù)值變量的分布特征,可將觀察值編制頻數(shù)表,繪制頻數(shù)分布圖。集中趨勢描述的主要指標是平均數(shù)。百分位數(shù),傳染病潛伏期可用于醫(yī)學參考值范圍,適用于任何分布觀察序列在某百分位置的水平,是分布的百分界值3.描述頻數(shù)分布離散程度的指標有:極差與四分位數(shù)間距,后者較穩(wěn)定,但均不能綜合反映個觀察值的變異程度。方差和標準差,最常用,對正態(tài)分布尤重要。 變異系數(shù),可用于多組資料間單位不同或均數(shù)相差較大時,變異度的比擬。注意: 變異指標的大小這與平均指標值的大小無關。平均指標和變異指標相結合,能對各種分布的資料作很好的描述。集中趨勢 離散趨勢 應用場合算術
20、均數(shù) 方差、標準差適用于對稱分布,特別是正態(tài)分布幾何均數(shù)正偏態(tài)分布資料或對數(shù)正態(tài)分布資料中位數(shù) 極差百分位數(shù) 四分位數(shù)間距 變異系數(shù) 適用于任何分布資料,特別是偏態(tài) 分布、分布不明、分布末端無確定 值適用于均數(shù)相差懸殊或度量衡單位不同的資料第三講 概率分布一、二項分布及其應用摸球模型摸摸球模型球模型一個袋子里有5個乒乓球,其中2個黃球、3個白球,我們進行摸球游戲,每次摸1球,放回后再摸。先后摸100次,請問: 摸到0次黃球的概率是多大?解: 每次摸到白球的概率 =0.6 第1次摸到白球的概率=0.6第2次摸到白球的概率=0.6第100次摸到白球的概率=0.6 100次摸到0次黃球的概率=0.6
21、0.60.6=0.6100先后摸100次,摸到3次黃球的概率是多大?解:每次摸到黃球的概率 =0.4黃白黃白黃白白白概率=(0.4)3(0.6)97 100次摸到3次黃球的概率 = (0.4)3(0.6)97+ (0.4)3(0.6)97+ (0.4)3(0.6)97+ =C1003 (0.4)3(0.6)97每次摸到白球的概率 =0.6黃黃黃白白白白白黃白黃黃白白白白概率=(0.4)3(0.6)97概率=(0.4)3(0.6)97 先后摸100次,摸到x次黃球的概率是多大?解:100次摸到x次黃球的概率=C100 x (0.4)x(0.6)100-x 先后摸n次,摸到x次黃球的概率是多大?n
22、次摸到x次黃球的概率=Cnx (0.4)x(0.6)100-x解: 如果摸到黃球的概率不是0.4,而是,先后摸n次,摸到x次黃球的概率是多大?n次摸到x次黃球的概率=Cnx ()x(1- )100-x解:小結:摸球模型二分類:每次摸球都有兩種可能的結果黃球或白球獨立:每次摸球都是彼此獨立的重復:每次摸到黃球的概率都是、 摸到白球的概率都是1- 所以,先后摸n次,摸到x次黃球的概率為:n次摸到x次黃球的概率=Cnx ()x(1- )100-x二項分布的概念假設變量X在n此獨立實驗中,具有:1各觀察單位只能具有相互對立的兩種結果之一。2發(fā)生某一結果陽性的概率為,其對立結果的概率為1-。3n次試驗在
23、相同條件下進行,且各個觀察單位的觀察結果相互獨立。那么稱變量X服從二項分布,記作:BX;n, 一般地,假設隨機變量取值x的概率為:P(x)=Cnx ()x(1- )n-x x 取值0、1、2、nCnx= x!(n-x)!(n)!其中:那么稱此隨機變量附合二項分布那么 :P(x)=Cnx ()x(1- )n-x 稱為二項分布的概率函數(shù)。 小結:一個二分類的情況、獨立重復事件n次,假設每次出現(xiàn)某事物的概率為,那么n次中有x次出現(xiàn)該事物的概率服從二項分布。舉 例:臨床上用針炙治療某型頭痛,有效的概率為60%;現(xiàn)以該法治療患者3例,其中 0 例、1例、2例、3例有效的概率各是多大?解:P(x)=Cnx
24、 ()x(1- )n-x 有效人數(shù)xC3x x1-n-x出現(xiàn)該結果概率P(x)010.600.430.064130.610.420.288230.620.410.432310.630.400.216二項分布的概率分布示意圖 n=30,=0.3n=10,=0.3n=20,=0.5n=5,=0.3二項分布圖形的特征:二項分布圖的形態(tài)取決于和n,頂峰在= n處?;蛘f:和n是二項分布的兩個參數(shù),n決定x的取值范圍,n和P決定了x的概率分布。 當=0.5,圖形是對稱的; 離0.5愈遠,對稱性愈差。 當0.5,隨著n的增大,分布趨于對稱。當n時,只要不太靠近0或1特別是n 和n(1-) 都 大于5時,二項
25、分布接近于正態(tài)分布。二項分布的均數(shù)和標準差對于二分類情況,進行n次隨機試驗,每次試驗出現(xiàn)陽性結果的概率為,出現(xiàn)陽性結果的次數(shù)為x,那么X的總體均數(shù) 、方差2及標準差分別為: 總體均數(shù): =n總體方差: 2= n 1- 總體標準差: = 1- 二項分布的應用: 概率估計:例:如果某地鉤蟲感染率是13%,隨機觀察當?shù)?50人,其中10人感染鉤蟲的概率有多大?解析:二分類感染、不感染獨立假定互不影響重復=150,每人感染鉤蟲機率均為=0.13故:感染鉤蟲的人數(shù)x附合二項分布B(150,0.13)所以: P(x=10)=C15010 0.13100.87140=0.0055單側累積概率的計算:單純計算
26、二項分布x恰好取某值的概率沒有太大意義經(jīng)常需要計算的是二項分布的累積概率1出現(xiàn)陽性次數(shù)至多為k次的概率為:P(xk)= Cnx ()x(1- )n-x kx=02出現(xiàn)陽性次數(shù)至少為k次的概率為:P(xk)= Cnx ()x(1- )n-x nx=k舉例:某地鉤蟲感染率是13%,隨機觀察當?shù)?50人。1其中最多有2人感染的概率有多大?解:P(x2)= C150 x 0.13x(0.97)150-x = C1500 0.130 0.97150 +C1501 0.131 0.97149+C1502 0.132 0.971482其中最少有2人感染的概率有多大?解:P(x2)= C150 x 0.13x
27、(0.97)150-x = 1 -C1500 0.130 0.97150 +C1501 0.131 0.971493其中最少有20人感染的概率有多大?解:P(x20)= C150 x 0.13x(0.97)150-x =1-C150 x 0.13x(0.97)150-x 練習: 5人服藥,該藥腸胃反響概率為10%;求:k個人、不多于2人、有人有反響的概率。二、Possion分布及其應用Poission分布的概念:是描述罕見事件發(fā)生次數(shù)的概率分布。Poisson分布可看作是二項分布的特例:獨立重復的次數(shù)很大很大每次出現(xiàn)某事件的概率很小,或未出現(xiàn)某事件的概率1- 很小。Poission分布的概念:
28、對二項分布,當n,n 時,可以證明:P(x)=Cnx ()x(1- )n-x P(x)=e-xX!所以,假設隨機變量X的概率函數(shù)為:P(x)=e-xX!假設那么稱此變量服從Poission分布,記敘X () 。 =n為Poission分布的總體均數(shù),X 為觀察單位內某稀有事件的發(fā)生次數(shù), 是Poisson分布的總體參數(shù),也是唯一的參數(shù)舉例:某地20年間共出生肢短畸形兒10名,平均每年0.5名,估計該地每年出生此類畸形人數(shù)為0、1、2的概率P(X )。解析: e=2.71828, =0.5=2.71828-0.50.5 0!0 x=0時,P(0)=e-xX!=0.607故:所以不同x取值時,概率
29、值如下表示:x012345P(x)0.6070.3030.0760.0130.0020.000Poission的概率分布示意圖: poisson分布圖形與有關。當20時,其分布近似正態(tài)分布。=nPoission分布圖形的特征:二項分布圖的形態(tài)取決于 , 5時為偏峰, 愈小分布愈偏,隨著的增大,分布趨向于對稱。總體均數(shù)=總體方差= ; 當觀察結果具有可加性,即:假設X1服從總體均數(shù)為1的Poission分布, X2服從總體均數(shù)為2的Poission分布, 那么T= X1+ X2為服從總體均數(shù)為1+2的Poission分布。舉例:從同一水源獨立取水樣5次,進行細胞培養(yǎng)。第1樣水樣的菌落數(shù) X1 (
30、1)第2樣水樣的菌落數(shù) X2 (2)第5樣水樣的菌落數(shù) X5 (5)把5份水樣混合,那么合計菌落數(shù)也符合Poission分布,那么:X1+X2 +X3 +X4+ X5 (1+ 2 +3+ 4+ 5)醫(yī)學研究中常利用其可加性,將小的觀察單位合并,來增大發(fā)生次數(shù)X,以便用后面講到的正態(tài)近似法作出統(tǒng)計推斷。Poission分布的應用: 概率估計:舉例1:假設某地新生兒先生性心臟病的發(fā)病概率是8 ,那么該地120名新生兒中有4人患先天性心臟病的概率是多少?解析:發(fā)病、不發(fā)病 二項分布發(fā)病概率8,概率很小 Poission分布n=120,相對較大 =n=1208=0.960.964 4!=2.71828
31、-0.96P(4)=e-xX!=0.014單側累積概率的計算:1稀有事件發(fā)生次數(shù)至多為k次的概率為:P(xk)= kx=0e-xX!2稀有事件發(fā)生次數(shù)至少為k次的概率為:P(xk)= nx=ke-xX! k -1= 1- x=0e-xX!三、正態(tài)分布及其應用一正態(tài)分布normal distribution的概念:又稱高斯分布,Gauss distribution):是描述連續(xù)型隨機變量最重要的分布。正態(tài)分布的密度函數(shù)f(x) ,即正態(tài)曲線的函數(shù)表達式: 當給定不同的x 值后,就可以根據(jù)此方程求得相應的縱坐標高度頻數(shù),并可繪制出正態(tài)曲線的圖形,記作XN(,2) : 正態(tài)分布曲線:頂峰位于中間,兩
32、側逐漸下降并完全對稱,曲線兩端永遠不與橫軸相交的“鐘型曲線。決定正態(tài)曲線圖形的兩個參數(shù): 和 當固定不變時,越大,曲線沿橫軸越向右移動;反之, 越小,那么曲線沿橫軸越向左移動,所以叫正態(tài)曲線N, 2的位置參數(shù), 。當固定不變時,越大,曲線越平闊;越小,曲線越尖峭, 叫正態(tài)曲線 N, 2的形狀參數(shù)。 為了應用方便,常將上述函數(shù)中的 x 作如下變量代換,令: 相對于正態(tài)變量 x,u 沒有度量單位。根據(jù) u 的不同取值,代入上式可繪出標準正態(tài)分布的圖形。正態(tài)分布曲線 標準正態(tài)分布曲線 XN(,2) XN(0,1)這樣就把原來個別的正態(tài)分布轉換為一般的標準正態(tài)分布 N0,1,亦稱為分布有書中用 Z表示
33、 。二正態(tài)分布特征及曲線下面積分布規(guī)律: 正態(tài)分布有五個方面的特征:1. 集中性: 正態(tài)曲線在橫軸上方,且均數(shù)位于曲線的最高處,即當x=時, f (x)取最大值。2. 對稱性:正態(tài)分布以均數(shù)為中心,左右對稱,即曲線 f (x)關于x=對稱。3. 正態(tài)分布有兩個參數(shù),通常用 N (, 2) 表示均數(shù)為,標準差為的正態(tài)分布;用 N(0,1表示均數(shù)為 0 和標準差為 1 的標準正態(tài)分布。 反映曲線的位置,反映曲線的形狀。4. 正態(tài)曲線在,標準正態(tài)曲線在1處各有一個拐點5. 正態(tài)曲線下的面積分布有一定的規(guī)律性。 由于正態(tài)曲線下累計頻數(shù)的總和等于 100% 或 1,故橫軸上曲線下的面積概率就等于 100
34、% 或 1。均數(shù)兩側的面積或頻數(shù)概率各占 50%。正態(tài)分布和標準正態(tài)分布曲線下的面積分布規(guī)律正態(tài)分布 標準正態(tài)分布 面積分布規(guī)律 68.27% 95.00% 99.00%當總體均數(shù)和總體標準差未知時,就用樣本均數(shù)和樣本標準差來代替, u 值可用下式計算:此時可用 來代替, 代替 , , 代替 。對于正態(tài)分布或近似正態(tài)分布資料,只要求出均數(shù)和標準差,便可就其頻數(shù)分布作出概略性的估計舉例: 120 名 12 歲男孩身高均數(shù)為 143 cm,標準差為 5.8 cm,試估計該地 12 歲男孩身高在 135 cm 以下者有多少人?答:1. 首先按題意計算 u 值:2. 查 u 值表 當 u = -1.3
35、8 時,左側尾部面積 0.0838,即身高在 135cm 以下者占總人數(shù)的 8.38%。 3.據(jù)概率計算人數(shù):身高在 135 cm 以下者有:1208.38% =10人練 習:某地正常成年女子的血清總蛋白數(shù)服從正態(tài)分布,調查了該地110名正常成年女子,得樣本血清總蛋白均數(shù)為72.8g/L,標準差為3.8g/L,試估計該地正常成年女子血清總蛋白介于66.075.0 g/L之間的比例,以及110名正常成年女子中血清總蛋白介于66.075.0 g/L之間的人數(shù)。 . 解析:由于本例是大樣本,可用樣本均數(shù)X和樣本標準差 S 作為總體、 的估計值,即將該地正常成年女子的血清總蛋白數(shù)近似看作服從N72.8
36、, 3.82的正態(tài)分布。 1. 將變量作如下標準化變換:2. 查 u 值表得3. 求所定區(qū)間概率: z2- (z1)=0.719-0.0367=68.23%即估計血清總蛋白介于66.075.0g/L的比例為68.23%4. 求所定區(qū)間的可能人數(shù): 所以110名正常成年女子中血清總蛋白介于之間的人數(shù)約為 110 68.23% =75人。 三、正態(tài)分布在醫(yī)學中的應用一 制定醫(yī)學參考值范圍 參考值范圍reference range):指所謂“正常人的解剖、生理、生化等指標的波動范圍。制定方法:制定參考值范圍時,首先要確定一批樣本含量足夠大的“正常人。所謂“正常人不是指“健康人,而是 指排除了影響所研
37、究指標的疾病和有關因素的同質人群,必須是隨機選擇的大樣本。而后根據(jù)指標的實際用途確定單側或雙側界值?根據(jù)研究目的和使用要求選定適當?shù)陌俜纸缰?,常?5%。 .雙側臨界值:標準正態(tài)分布雙側尾部面積之和等于時所對應的正側變量值,記作Z/2或U/2。單側臨界值:標準正態(tài)分布單側尾部面積等于時所對應的正側變量值,記作Z或U。以不同的方法計算參考值范圍:1正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布資料常用參考值范圍的制定舉例1:調查某地120名健康女性血紅蛋白,直方圖顯示其分布近似正態(tài),試估計該地健康女性血紅蛋白的95%參考值范圍。解析:1. 分布近似正態(tài) 正態(tài)分布法求參考值范圍2. 過高過低均為異常 設定雙
38、側界值3. 求上、下界值下界:上界 所以,該地健康女性血紅蛋白的95%參考值范圍是97.41,137.39g/l。舉例2: 某地調查120名健康成年男性的第一秒肺通氣量得均數(shù) X =4.2(L), 標準差S =0.7(L),試據(jù)此估計其第一秒肺通氣量的95%參考值范圍。 1. 分布近似正態(tài) 正態(tài)分布法求參考值范圍 2. 僅過低為異常 單側下限3. 求下界值所以,該地健康成年男子第一秒肺通氣量的95%參考值范圍為不低于3.05L。 2百分位法:特別適用于偏態(tài)分布資料以及資料中一端或兩端無確切數(shù)值的資料。如95%參考值范圍:雙側界值單側下限單側上限P 2.5和P 97.5P 5 P 95二估計頻數(shù)
39、分布舉例:定出生體重低于2500g的嬰兒為低體重兒,假設由某項研究得某地嬰兒出生體重均數(shù)為3200g ,標準差為350g,估計當年出生低體重兒所占的比例。1. 分布近似正態(tài), X= 3200g ,S=350g。2. 轉化為標準正態(tài)分布,求u 值 說明標準正態(tài)曲線下 (-,-2的面積為2.28%,故此題正態(tài)曲線(-,2500g的比例為2.28% ,即X2500g的為2.28%,故估計當年出生低體重兒的比例為2.28%。 三進行質量控制根本原理:許多臨床檢驗指標,當影響某一指標的隨機因素很多,而每個因素所起的作用均不太大時,這個指標的隨機波動屬于隨機誤差,那么往往服從正態(tài)分布??刂品椒ǎ撼R?作為
40、上下警戒值,以 作為上下控制值。這里的2s和3s可視為1.96s和2.58s的約數(shù)。第四講:抽樣分布及參數(shù)估計一、抽樣研究和抽樣誤差一正態(tài)分布樣本均數(shù)的抽樣分布【實驗一】假定某年某地16歲所有女學生的身高服從總體均數(shù)=155.4cm,總體標準差s2=5.3cm的正態(tài)分布N ( , s2),在這樣的一個總體中進行隨機抽樣: 1.每次均抽取30例組成一個樣本 2.共抽100次 3.計算每個樣本的平均身高得出了一組數(shù)據(jù):153.6,153.1,154.9,157.7 n=100從正態(tài)總體 N (155.4, 5.32) 抽樣得到的100個樣本均數(shù)的分布頻數(shù)表n=30組段cm頻數(shù)頻率%152.6 1
41、1.0153.2 4 4.0153.8 4 4.0154.4 22 22.0155.0 25 25.0155.6 21 21.0156.2 17 17.0156.8 3 3.0157.4 2 2.0158.0 158.6 1 1.0合 計100100.0正態(tài)分布樣本均數(shù)的分布規(guī)律:1.各樣本均數(shù)未必等于總體均數(shù)。2.樣本均數(shù)之間存在差異。3.樣本均數(shù)的分布總是圍繞著總體均數(shù),近似于正態(tài)分布。4.樣本均數(shù)的變異程度較之原變量的變異程度大大的縮小了。所以假設隨機變量X服從XN ( , s2) 的正態(tài)分布,那么以之隨機抽樣計算的樣本均數(shù)所構成的分布也呈正態(tài)分布。1. 樣本均數(shù)的總體均數(shù)仍等于原來的總
42、體均數(shù)。 2. 樣本均數(shù)的標準差 叫做標準誤 (standard error of mean, SEM),記作 ,是描述均數(shù)的抽樣誤 差大小的指標。樣本均數(shù)的標準誤的意義:1衡量樣本均數(shù)的可靠性:均數(shù)標準誤越小,說明均數(shù)的抽樣誤差越小,樣本均數(shù)代表總體均數(shù)就越可靠。2估計總體均數(shù)的可信區(qū)間。3用于均數(shù)的假設檢驗。標準誤的計算:1. 理論標準誤:2. 實際工作中,常用 S 代,計算樣本標準誤。樣本量 n越大 ,樣本均數(shù)的標準誤就越小。所以增加樣本量 n ,可以降低抽樣誤差。標準差 標準誤區(qū)別公式與n 關系n 增大,標準差趨于穩(wěn)定。n 越大,標準誤越小概念描述的是樣本個體觀察值的變異程度大小。描述
43、的是樣本均數(shù)的變異程度和抽樣誤差大小。意義小說明變量值圍繞均數(shù)的波動小,均數(shù)對一組變量值的代表性好。小表示樣本均數(shù)圍繞總體均數(shù)的波動小,用樣本推斷總體的可靠性越強。用途與均數(shù)結合,描述觀察值的分布范圍,常用于估計醫(yī)學參考值范圍、計算變異系數(shù)、標準誤等。均數(shù)結合,用于估計總體均數(shù)可能出現(xiàn)的范圍,即可信區(qū)間,并用于假設檢驗。聯(lián)系1.都是描述變異程度的指標2.標準誤與標準差成正比, n一定時,標準差越大,標準誤也越大。二非正態(tài)分布樣本均數(shù)的抽樣分布【實驗二】:圖6-2是一個正偏態(tài)分布,用電腦從中隨機抽取樣本含量分別為5、10、30、50的樣本各1000次,計算樣本均數(shù),繪制直方圖,并觀察其樣本均數(shù)的
44、分布。n = n = 5 5n = 10n = 30n = 50當樣本容量足夠大時(n 30) ,樣本均數(shù)的抽樣分布逐漸趨于正態(tài)分布假設隨機變量X呈偏態(tài)分布,當每次抽取的樣本量 n 足夠大時例如,當n= 50,樣本均數(shù)的分布也近似于正態(tài)分布。1. 樣本均數(shù)的總體均數(shù)仍等于原來的總體均數(shù)。 2. 樣本均數(shù)的標準差 仍叫做標準誤,記作 。二、樣本統(tǒng)計量的分布 規(guī)律-t 分布一t 分布的概念: 1n=SXXXSn【實驗三】:從前述13歲女學生身高這個正態(tài)總體中分別作樣本量為3或50的隨機抽樣,各取1000份樣本,分別得到1000個樣本的均數(shù)及其標準誤,對它們分別作t 轉換,將t 值繪成直方圖: 。n
45、 =3時的t分布 n =50時的t分布二t 分布的圖形特征圖6-2 不同自由度的t分布的曲線t 分布的圖形特征 : 1. 分布是一簇曲線,它有一個參數(shù)即自由度 。2. 單峰分布,以0為中心,左右對稱; 3. t 分布曲線較標準正態(tài)曲線要扁平,越小,t 值的越分散,曲線的峰越矮,尾越高。4. 增大, t 分布逐漸逼近標準正態(tài)分布;假設,那么t 分布完全成為標準正態(tài)分布。三t 界值表:以自由度為橫標目,概率P為縱標目,表中數(shù)字表示當和 P確定時,對應的是正側或雙側的t 臨界值表,記作t(,)或t(/2,) 。單側概率的t 臨界值,記作t(,)雙側概率的t 臨界值,記作t(/2,)1. 相同 時,t
46、 值越大,對應的尾部概率就越小2. 相同t 值,雙側尾部概率是單側尾部概率的2倍。單側和雙側2的t界值同,即單側t,雙側t2, 三、總體均數(shù)可信區(qū)間的估計一)根本概念參數(shù)估計:用樣本統(tǒng)計量來估計總體參數(shù)。點值估計( Point estimation ):不考慮抽樣誤差,直接用樣本統(tǒng)計量來估計總體參數(shù) 區(qū)間估計(Interval estimation):考慮抽樣誤差,按一定的概率估計總體參數(shù)的所在范圍。總體參數(shù)的可信區(qū)間(confidence interval, CI ) 1-可信區(qū)間,一般取值0.05或0.01, 所以1-為0.95或0.99可信區(qū)間:總體均數(shù)的1-可信區(qū)間指一個范圍,指包含在
47、內的可能性為1-,不包含在內的可能性為。常用的可信區(qū)間為95%和99%,又稱置信區(qū)間??尚畔蓿褐缚尚艆^(qū)間的下限和上限,即兩個端點值。可信區(qū)間是指以上、下可信限為界的一個范圍,但不包含上下限兩個值,故用 表示,其為開區(qū)間。二總體均數(shù)的區(qū)間估計的計算t =資料不同計算方法也不同:t 分布法 1.未知 n 較小時n 30服從自由度n-1的t分布u =正態(tài)分布法 2. t =3.未知 n 較大時n30 t分布 接近于標準正態(tài)u分布1. t 分布法:樣本均數(shù)呈正態(tài)分布,將變量進行t 轉換:1n=SXXXSn舉例:確定1- = 0.95,雙側SXX-t0.05/2, t0.05/2, X-t0.05/2,
48、SX X+tSX 注釋:可信程度95%。舉例:抽樣得到一個n=9的樣本,樣本均數(shù)為70.54,標準差為5.79,求該次抽樣的95% 及99%的可信區(qū)間。查t 值表答:即:此次抽樣95%的可信區(qū)間為(69.40,74.68);99%的可信區(qū)間為63.59,76.49。t 分布法適用條件和計算公式適用條件:未知n 較小時n 30區(qū)間范圍:舉例:測得某地110名18歲男大學生身高=172.73cm,S=4.19cm,估計該地18歲男大學生身高均數(shù)的95%和99%的可信區(qū)間。 答:1.明確條件 n=110, =172.73cm,S=4.19cm,雙側u0.05=1.96 2.用正態(tài)分布法求可信區(qū)間).
49、49173,97.171()0194.11.9617317241.,11019.96.73172( 即:該地18歲男大學生身高均數(shù)的95%可信區(qū)間為171.97cm173.49cm 第五講:定量資料的假設檢驗一、假設檢驗的概念與原理一假設檢驗的根本概念:假設檢驗(hypothesis test):亦稱顯著性檢驗(significance test),是依據(jù)樣本提供的有限信息,對樣本所代表的總體 是否與某特定的總體相等做出統(tǒng)計學結論的決策過程。 目的:分辨某樣本是否來自于某特定總體,并以一定的概率對總體的假設作出推斷。 二假設檢驗的步驟:1.提出無效假設和備擇假設2.規(guī)定顯著性水平3.計算檢驗統(tǒng)
50、計量4.確定P值,作出統(tǒng)計推斷結論1. 選擇檢驗方法,建立檢驗假設確定水準:1選擇檢驗方法:根據(jù)研究目的、設計類型和資料特點等因素選擇適宜的檢驗方法,并計算出對應統(tǒng)計量。變量分類變量數(shù)值變量單樣本資料兩、多組獨立樣本資料配對設計資料2提出無效假設和備擇假設 什么是無效假設 (Null Hypothesis) ? 一般是作沒有差異的假設,又稱“原假設或“零假設 ,表示為 H0,即 H0: = 某一數(shù)值,如 = 0該假設將差異的原因歸結為抽樣誤差什么是備擇假設 (Alternative Hypothesis) ?與無效假設相對立有差異的假設,由不等號 , 或 組成,常表示為 H1;即H1: 某一數(shù)
51、值;或 某一數(shù)值, 某一數(shù)值。該假設將差異的原因歸結為非抽樣誤差.3規(guī)定檢驗水準 (size of test): 抽樣分布H0值臨界值臨界值/2 /2 樣本統(tǒng)計量拒絕域拒絕域接受域1 - 置信水平什么檢驗水準? 規(guī)定了規(guī)定了小概率事件的最大概率,概率不超過 的事件就是小概率事件; 旨在假設H0成立的前提下,而根據(jù)樣本的信息拒絕H0可能性大小的度量。注意:由研究者事先確定。 表示為 ,常用的 值有0.01、0.05; 是一個概率值,假設原假設為真時,拒絕原假設的概率,又被稱為抽樣分布的拒絕域。什么雙側檢驗和單側檢驗? 雙側檢驗:用于推斷兩總體有無差異時,對兩總體間可能存在的兩種位置關系均要考慮在
52、內。單側檢驗:用于推斷兩總體有無差異時,僅考慮兩總體間可能存在的兩種位置關系的一種。一般情況下,如結果不明確時,采用雙側假設 H1: 某一數(shù)值,如 0雙側,包括 0和 0 兩方面如果從專業(yè)上能肯定其中一側是不可能的,那么采用單側對立假設 H1: 某一數(shù)值;如 0 右單側 2. 計算檢驗統(tǒng)計量:根據(jù)樣本數(shù)據(jù)算出相應的統(tǒng)計量,此步驟的目的是把樣本信息以檢驗統(tǒng)計量的方式反映出來。3. 確定 p 值p 值意義是:在H0成立的前提下,統(tǒng)計量獲得現(xiàn)有數(shù)值以及更不利于H0的可能性概率有多大? 即假設成立= 0)的 概率有多大?4. 作出統(tǒng)計結論假設檢驗的推斷結論是指對 “ 假設的H0 是否真實 作出判斷的過
53、程。 即:比擬 p 值和檢驗水準,得出拒絕或不拒絕無效假設的結論。在兩個對立的檢驗假設間二取一的規(guī)那么是: 假設 p ,意味著在H0成立的前提下,不大可能發(fā)生當前或是更不利的狀況 拒絕 假設 p , 意味著在H0成立的前提下,發(fā)生當前狀況或是更不利的狀況的可能性還是比擬大的 不拒絕【舉例7-1】北方農村兒童前囪門閉合月齡為14.1月;某研究人員從東北某縣抽取36名兒童,得前囪門閉合月齡為14.3月,標準差為5.08月。 問該縣兒童前囪門閉合月齡的均數(shù)是否大于一般兒童?答:假設檢驗:HO : = 14.1月, 即該縣兒童前囪門閉合月齡的均數(shù)與一般兒童相同;H : 14.1月, 該縣兒童前囪門閉合
54、月齡的均數(shù)大于一般兒童檢驗水準:右單側檢驗,設=0.05。總體0=14.1;樣本 n=36、 X=14.3、 S=5.08 35,t 檢驗 = 0.236=SXX14.3 -14.15.0836t = 樣本統(tǒng)計量 t = 0.236,所以 P0.05 。二、不同設計類型資料 的假設檢驗一單樣本的假設檢驗二兩組獨立樣本資料的假設檢驗三配對設計資料的假設檢驗一單樣本的假設檢驗:確定方法主要考慮樣本例數(shù)及分布狀況:樣本例數(shù)n 較大如n50時,t 檢驗樣本例數(shù)n 較小如n50時,但樣本來自正態(tài)分布,t檢驗樣本例數(shù)n50且樣本來自偏態(tài)分布,變量變換或秩和檢驗【例 1】根據(jù)大量調查,健康成年男子的脈搏均數(shù)
55、是72.2次/min;某醫(yī)生在山區(qū)隨機抽查25名健康成年男子,求得其脈搏均數(shù)為74.5次/min,標準差為6.0次/min。 . 否據(jù)此認為山區(qū)成年男子的脈搏均數(shù)與一般健康男性脈搏均數(shù)相同? 資料特點: 1. 條件:總體:總體均數(shù)記為0,一般為理論值、標準值或經(jīng)過大量觀察所得的穩(wěn)定值。. 抽樣樣本:認為來自一個未知總體,均數(shù)為。2. 檢驗目的:假推斷樣本所代表的未知總體,與總體均數(shù)為0有無差異。資料類型:數(shù)值變量資料設計類型:單樣本單樣本的假設檢驗中無效假設和備那么假設假設研究的問題雙側檢驗單側檢驗H0m = m0m = m0H1m m0m m0【案例解析】1. 由于樣本例數(shù)n 50且總體標準
56、差未知,所以首先考慮t 檢驗,2. t 檢驗要求樣本來自正態(tài)分布的總體,所以首先對進行正態(tài)性檢驗,結果說明該樣本所屬總體來自正態(tài)分布3. 計算公式:t 檢驗統(tǒng)計量為:檢驗過程:4 步驟1. 建立假設:確定顯著性水平:2. 計算檢驗統(tǒng)計量:3. 確定 p 值,得出結論:查t 界值表,得t (0.05,24) =2.064,按0.05 檢驗水準,不拒絕H0。 故本研究尚不能認為山區(qū)成年男子的脈搏均數(shù)與一般健康男性脈搏均數(shù)不同。二兩組獨立樣本資料的假設檢驗:當樣本量n50時,要求兩樣本均來自正態(tài)總體且總體方差齊,t 檢驗當n50時數(shù)據(jù)的正態(tài)性可以忽略,t 檢驗兩樣本來自正態(tài)總體但總體方差不齊,t檢驗
57、當數(shù)據(jù)來自偏態(tài)分布總體時,首先考慮采用變量變換,再考慮選用秩和檢驗。1.總體方差齊時雙樣本的假設檢驗【例 2】為研究某新藥治療貧血患者的療效,將20名貧血患者隨機分成兩組,一組用新藥治療,另一組用常規(guī)藥治療,測得血紅蛋白增加量 (g/L) 見下表。問新藥與常規(guī)藥治療貧血患者后的血紅蛋白增加量有無差異?. 附表 兩種藥物治療貧血患者結果資料特點: 1. 條件:從一個人群中隨機抽取一定數(shù)量的觀察單位,隨機分配到兩個不同的處理組,測量某項指標后進行組間比擬。 處理組1:認為其所在總體均數(shù)為1。. 處理組2:認為其所在總體均數(shù)為2。. 2. 檢驗目的:其實質就是比擬兩個處理組的觀察指標有無差異,即 是
58、否成立。資料類型:數(shù)值變量資料 設計類型:兩獨立樣本雙樣本的假設檢驗中無效假設和備那么假設假設研究的問題雙側檢驗單側檢驗H0m1 = m2m1 = m2H1m 1 m0m1 m2【案例解析】1.由于兩處理組樣本量均小于50,故考慮用t 檢驗。2. 計算公式:兩樣本均數(shù)比擬 t 檢驗的統(tǒng)計量:式中X1、X2分別為兩樣本均數(shù),S12、S22分別為兩樣本的方差,n1+n2 -2為自由度。檢驗過程:1. 建立假設:新藥和常規(guī)藥治療后血紅蛋白增加量同,即 H0: 1 = 2新藥和常規(guī)藥治療后血紅蛋白增加量同,即 H1 :1 2確定顯著性水平:a =0.052. 計算檢驗統(tǒng)計量:3. 確定 p 值,得出結
59、論:t =4.137,查 t界值表, p 0.05; 按a = 0.05水準拒絕H0,接受H1 。故可認為新藥和常規(guī)藥治療后血紅蛋白增加量不同,根據(jù)樣本均數(shù)的信,認為,即服用新藥后血紅蛋白含量平均增加量高于常規(guī)藥?!窘Y果報告】在a=0.10檢驗水準下,新藥組和常規(guī)藥物組血紅蛋白的增加量均服從正態(tài)分布W檢驗:P1=0.466, P2=0.482且兩總體方差齊F =1.345, P=0.261;采用兩獨立樣本的 t 檢驗:t =4.137, =18,P=0.001。結果說明:在a=0.05雙側檢驗水準下,可認為兩藥療效不同,新藥治療患者的血紅蛋白平均增加量高于常規(guī)藥治療患者。1 -2 的95%可信
60、區(qū)間3.829,11.731也說明新藥治療的患者血紅蛋白質平均增加量高。組別nHb含量g/L新藥組1027.994.56常規(guī)藥組1020.213.82表7.2 不同組別血紅蛋白增加量()兩樣本均數(shù)t 檢驗的前提條件是數(shù)據(jù)的正態(tài)性和方差齊性。1.假設兩樣本所屬總體均為正態(tài),方差齊, t 檢驗2.假設兩樣本所屬總體均為正態(tài),但方差不齊, t 檢驗,同時校正自由度3.假設兩樣本所屬總體偏態(tài),變量變換后再t 檢驗或非參數(shù)檢驗2. 總體方差不齊時雙樣本的假設檢驗【例 3】為探討硫酸氧釩對糖尿病性白內障大鼠血糖的影響,研究人員將已誘導糖尿病模型的100只大鼠隨機分為兩組,實驗組給予硫酸氧釩治療,對照組為空
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- DB31/T 808-2019地下空間安全使用檢查規(guī)范
- DB31/T 1385-2022科技成果分類評價和價值潛力評價規(guī)范
- DB31/T 1380-2022社會消防技術服務機構質量管理要求
- DB31/T 1292-2021歷史風貌區(qū)保護性征收基地保護管理指南
- DB31/ 834-2014中空玻璃單位產(chǎn)品能源消耗限額
- DB31/ 267-2015燃料含硫量和灰分限值
- 2025裝修項目經(jīng)理合同示范文本
- 2024年健康運動信息測量產(chǎn)品資金申請報告代可行性研究報告
- 水土保持項目環(huán)境保護與可持續(xù)發(fā)展合同
- 繼承房產(chǎn)質量問題處理與質量保障協(xié)議
- 消防安全主題班會課件(共17張ppt)
- 《全球通史》課件
- 北師版六年級解方程練習200題
- 外貿鎖檢測報告樣式EN12209
- 無損檢測人員登記表
- DB33-T 2048-2017(2021)民宿基本要求與評價
- 1員工培訓記錄表表格類
- 某大學論文答辯模板課件
- 50以內加減法練習題打印版(100題)
- 基礎體溫表格基礎體溫表
- 煤炭項目建議書【范文參考】
評論
0/150
提交評論