版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
/衛(wèi)生統(tǒng)計(jì)學(xué)第一章統(tǒng)計(jì)學(xué)的基本內(nèi)容第一節(jié)醫(yī)學(xué)統(tǒng)計(jì)學(xué)的含義1、醫(yī)學(xué)統(tǒng)計(jì)學(xué)定義醫(yī)學(xué)統(tǒng)計(jì)學(xué)(statistics)作為一門學(xué)科的定義是:關(guān)于醫(yī)學(xué)數(shù)據(jù)收集、表達(dá)和分析的普遍原理和方法。2、醫(yī)學(xué)統(tǒng)計(jì)學(xué)研究方法:通過大量重復(fù)觀察,發(fā)現(xiàn)不確定的醫(yī)學(xué)現(xiàn)象背后隱藏的統(tǒng)計(jì)學(xué)規(guī)律。3、醫(yī)學(xué)統(tǒng)計(jì)推論的基礎(chǔ):在一定條件下,不確定的醫(yī)學(xué)現(xiàn)象發(fā)生可能性,即概率。第二節(jié)、統(tǒng)計(jì)學(xué)的幾個(gè)重要概念一.資料的類型1、計(jì)量資料(數(shù)值變量):對(duì)每一觀察對(duì)象用定量的方法,測定某項(xiàng)指標(biāo)所得的資料。一般有度量衡單位,每個(gè)對(duì)象之間有量的區(qū)別。2、計(jì)數(shù)資料(分類變量):對(duì)觀察對(duì)象按屬性或類型分組計(jì)數(shù)所得的資料。每個(gè)對(duì)象之間沒有量的差異,只有質(zhì)的不同。3、等級(jí)資料(有序分類變量):對(duì)觀察對(duì)象按屬性或類型分組計(jì)數(shù),但各屬性或類型之間又有程度的差別。注意:不同類型的資料采用的統(tǒng)計(jì)分析方法不同;三類資料類型可以相互轉(zhuǎn)化。二、總體根據(jù)研究目的所確定的同質(zhì)的所有觀察對(duì)象某項(xiàng)變量值的集合1、有限總體:只包括在確定時(shí)間、空間范圍內(nèi)的有限個(gè)觀察對(duì)象。2、無限總體:沒有時(shí)間、空間范圍的限制,觀察對(duì)象的數(shù)量是不確定的,無限的三、樣本從總體中隨機(jī)抽取部分觀察對(duì)象,其某項(xiàng)變量值的集合。從總體中隨機(jī)抽取樣本的目的是:用樣本信息來推斷總體特征。四、隨機(jī)事件可以發(fā)生也可以不發(fā)生,可以這樣發(fā)生也可以那樣發(fā)生的事件。亦稱偶然事件。五、概率描述隨機(jī)事件發(fā)生可能性大小的數(shù)值,記作P,其取值范圍0≤P≤1,一般用小數(shù)表示。P=0,事件不可能發(fā)生必然事件(隨機(jī)事件的特例);P=1,事件必然發(fā)生;P→0,事件發(fā)生的可能性愈小;P→1,事件發(fā)生的可能性愈大六、小概率事件習(xí)慣上將P≤0.05或P≤0.01的隨機(jī)事件稱小概率事件。表示某事件發(fā)生的可能性很小。七、參數(shù)和統(tǒng)計(jì)量參數(shù):總體指標(biāo),如總體均數(shù)、總體率,一般用希臘字母表示統(tǒng)計(jì)量:樣本指標(biāo),如樣本均數(shù)、樣本率,一般用拉丁字母表示
八、學(xué)習(xí)醫(yī)學(xué)統(tǒng)計(jì)學(xué)的方法1、重點(diǎn)掌握“四基”:基本知識(shí)、基本概念、基本原理和基本方法;2、重視統(tǒng)計(jì)方法在實(shí)際中應(yīng)用,重視實(shí)習(xí)和綜合訓(xùn)練;注意學(xué)習(xí)每種統(tǒng)計(jì)方法的應(yīng)用范圍、應(yīng)用條件,大多數(shù)公式只要求了解其意義和使用方法,不用記憶和探究數(shù)理推導(dǎo)。第三節(jié)統(tǒng)計(jì)工作的基本步驟統(tǒng)計(jì)設(shè)計(jì)收集資料整理資料分析資料一、統(tǒng)計(jì)設(shè)計(jì)1、調(diào)查設(shè)計(jì)2、實(shí)驗(yàn)設(shè)計(jì)(詳見第十三章)二、收集資料資料來源(1)統(tǒng)計(jì)報(bào)表(2)日常醫(yī)療工作原始記錄和報(bào)告卡(3)專題調(diào)查三、整理資料1.目的將收集的原始資料系統(tǒng)化、條理化,便于進(jìn)一步計(jì)算和分析2.整理分組方式(1)性質(zhì)分組(2)數(shù)量分組四、分析資料1、統(tǒng)計(jì)描述2、統(tǒng)計(jì)推斷第四節(jié)統(tǒng)計(jì)圖表一、統(tǒng)計(jì)表1、統(tǒng)計(jì)表的作用代替冗長的文字?jǐn)⑹?,便于?jì)算、分析和對(duì)比。2、統(tǒng)計(jì)表的結(jié)構(gòu)1)標(biāo)題2)標(biāo)目橫標(biāo)目(主語):說明表各橫行數(shù)字的涵義,通常列在表的左側(cè)縱標(biāo)目(謂語):說明表各縱欄數(shù)字的涵義主語和謂語連貫起來能讀成一句完整而通順的話3、統(tǒng)計(jì)表的種類:1)簡單表:只按單一變量分組2)組合表:按兩個(gè)或兩個(gè)以上變量分組某地1980年男、女HBsAg陽性率━━━━━━━━━━━━━━━━性別調(diào)查數(shù)陽性數(shù)陽性率(%)────────────────男42343037.16女45301814.00──────────────合計(jì)87644845.52━━━━━━━━━━━━━━━━4、列表原則:重點(diǎn)突出,簡單明了;主謂分明,層次分明5、統(tǒng)計(jì)表的基本要求:1)標(biāo)題:概括地說明表的內(nèi)容,必要時(shí)注明資料的時(shí)間和地點(diǎn),寫在表上方。常見的缺點(diǎn):過于簡略,甚至不寫標(biāo)題;或過于繁瑣;或標(biāo)題不確切。2)標(biāo)目:文字簡明扼要,有單位的標(biāo)目要注明單位。常見的缺點(diǎn):標(biāo)目過多,層次不清3)線條:不宜過多,除上面的頂線,下面的底線,縱標(biāo)目及合計(jì)之間的橫線外,其余線條一般均省去。表的左上角不宜有斜線。4)數(shù)字:
A、數(shù)字一律用阿拉伯?dāng)?shù)字表示B、同一指標(biāo)的小數(shù)位數(shù)應(yīng)一致,位次對(duì)齊C、表內(nèi)不宜留空格,暫缺或未記錄,用“…”表示,無數(shù)字,用“—”表示,數(shù)字為0,填寫0D、絕對(duì)數(shù)太小而無法計(jì)算指標(biāo),則用“…”代替。5)備注:一般不列入表內(nèi),必要時(shí)可用“*”號(hào)標(biāo)出,寫在表的下面。二、統(tǒng)計(jì)圖1、統(tǒng)計(jì)圖作用:通過點(diǎn)、線、面等形式表達(dá)統(tǒng)計(jì)資料,直觀地反映事物之間的數(shù)量關(guān)系。但需注意,由于統(tǒng)計(jì)圖對(duì)數(shù)量的表達(dá)較粗糙,不便于作深入細(xì)致的分析,一般需附相應(yīng)的統(tǒng)計(jì)表。2、常見統(tǒng)計(jì)圖種類:條圖、百分條圖,圓圖,線圖,半對(duì)數(shù)線圖,直方圖,散點(diǎn)圖3、制圖的基本要求:1)按資料的性質(zhì)和分析目的,選用適合的圖形2)要有標(biāo)題,扼要說明資料的內(nèi)容,必要時(shí)注明時(shí)間、地點(diǎn),一般寫在圖的下面。3)橫軸尺度從左到右,縱軸尺度從下而上,數(shù)量一律由小到大。橫軸及縱軸坐標(biāo)長度比例一般為5:74)比較不同事物,用不同線條或顏色表示,并附上圖例說明。4、常見統(tǒng)計(jì)圖適用范圍及其繪制要點(diǎn)1)條圖:(1)
適用范圍:相互獨(dú)立的資料,常用形式:單式和復(fù)式(2)繪制要點(diǎn):A.用等寬的直條的長短反映各指標(biāo)的數(shù)量大小。B.縱軸的尺度必須從0開始。C.各直條之間的間隙應(yīng)相等,一般將比較的指標(biāo)按大小順序排列。2)百分條圖:(1)適用范圍:構(gòu)成比資料(2)繪制要點(diǎn):A.將長條全長為100%,B.將各百分構(gòu)成比在長條上分割若干段,C.各段按大小順序排列。3)圓圖(1)適用范圍:構(gòu)成比資料(2)繪制要點(diǎn):
A.將圓面積為100%,B.將各百分構(gòu)成比乘以3.6度,變?yōu)閳A心角度數(shù),C.在圓上繪出各扇型面積D.各扇型面積按大小順序排列。4)普通線圖(1)適用范圍:連續(xù)性資料(2)繪制要點(diǎn):
A.縱橫軸均用算術(shù)尺度,B.縱橫軸尺度比一般為5:7C.相鄰兩點(diǎn)用直線連接。(3)意義:反映事物的變化趨勢。5)半對(duì)數(shù)線圖(1)適用范圍:連續(xù)性資料(2)繪制要點(diǎn):A.橫軸用算術(shù)尺度,縱軸用對(duì)數(shù)尺度,B.縱橫軸尺度比一般為5:7C.相鄰兩點(diǎn)用直線連接。(3)意義:反映事物的變化速度。6)直方圖(1)適用范圍:計(jì)量的頻數(shù)表資料(2)繪制要點(diǎn):A.橫軸表示被觀察事物,縱軸表示頻數(shù)或頻率,B.用等寬的矩形面積表示各組段的頻數(shù)或頻率7)散點(diǎn)圖:(1)適用范圍:雙變量資料(2)分析目的:用點(diǎn)的密度程度和趨勢表示兩變量間的相關(guān)關(guān)系(3)繪制要點(diǎn)(見第五章)第二章數(shù)值變量(計(jì)量)資料的統(tǒng)計(jì)分析第一節(jié)計(jì)量資料的統(tǒng)計(jì)描述一、計(jì)量資料的頻數(shù)分布(一)頻數(shù)表的編制1、求極差(全距)R=最大值-最小值=132.5-108.2=24.32、求組距(i)i=極差/組數(shù)=24.3/10=2.4≌23、分組段原則:第一組段包括最小值,最后組段包括最大值。每一組段都有上限和下限上限:組段的終點(diǎn)(最大值)下限:組段的起點(diǎn)(最小值)4、列表劃記(二)頻數(shù)分布的特征1、集中趨勢:數(shù)據(jù)向某一數(shù)值集中的傾向2、離散趨勢:數(shù)據(jù)的數(shù)值大小不等的傾向(三)頻數(shù)分布的類型1、對(duì)稱分布:集中位置在中間,左右兩側(cè)頻數(shù)大體對(duì)稱2、偏態(tài)分布:(1)正偏態(tài):集中位置偏向數(shù)值小的一側(cè);(2)負(fù)偏態(tài):集中位置偏向數(shù)值大的一側(cè)(四)頻數(shù)表的用途:1、揭示資料的分布特征和分布類型2、便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)分析3、便于發(fā)現(xiàn)特大或特小的可疑值二、集中趨勢的描述(一)常用平均數(shù)的種類:1、算術(shù)均數(shù)(簡稱均數(shù))2、幾何均數(shù)3、中位數(shù)(二)算術(shù)均數(shù)(均數(shù))樣本均數(shù)用X表示,總體均數(shù)用μ表示1、適用范圍:對(duì)稱分布,尤其是正態(tài)分布的資料2、計(jì)算方法:(1)直接法X=∑X/n(2)加權(quán)法適用于頻數(shù)表資料X=∑fX/∑f其中X=組中值=(上限+下限)/2f=頻數(shù)(三)幾何均數(shù)(簡記為G)1、適用范圍:(1)等比級(jí)數(shù)資料,如血清滴度資料(2)對(duì)數(shù)正態(tài)分布資料2、計(jì)算方法:(1)直接法G=log-1(∑logX/n)(2)加權(quán)法G=log-1(∑flogX/∑f)(四)中位數(shù)(簡記M)1、中位數(shù)的定義:中位數(shù):將一組觀察值從小到大按順序排列,位次居中的觀察值就是中位數(shù)。在全部觀察值中,大于和小于中位數(shù)的觀察值的個(gè)數(shù)相等。2、中位數(shù)的適用范圍:(1)偏態(tài)分布資料(2)分布不明資料(3)分布末端無確定值資料(開口資料)理論上,中位數(shù)可用于任何分布的計(jì)量資料,但實(shí)際應(yīng)用中常用于偏態(tài)分布,特別是開口資料。在對(duì)稱分布資料中,M=X3、計(jì)算方法:(1)直接法:適用于觀察數(shù)少資料n為奇數(shù)時(shí),M=X(n+1)/2n為偶數(shù)時(shí),M=(Xn/2+X(n/2+1))/2(2)頻數(shù)表法:適用于頻數(shù)表資料步驟:①從小到大計(jì)算累計(jì)頻數(shù)和累計(jì)頻數(shù);②確定中位數(shù)所在組段;③計(jì)算中位數(shù)MM=LM+iM/fM(n/2-∑fL)LM=M所在組段的下限iM=M所在組段的組距fM=M所在組段的頻數(shù)∑fL=小于L各組段的累計(jì)頻數(shù)M在8~組段L=8i=4fX=48∑fL=26n=108M=L+i/fX(n/2-∑fL)=10.33(五)小結(jié):常用平均數(shù)的意義及其應(yīng)用場合平均數(shù)意義應(yīng)用場合─────────────────────────均數(shù)平均數(shù)量水平最適用于對(duì)稱分布,特別是正態(tài)分布幾何均數(shù)平均增(減)倍數(shù)等比資料或?qū)?shù)正態(tài)分布中位數(shù)位次居中的觀察值(1)偏態(tài)分布,(2)分布不明,(3)分布末端無確定水平三離散趨勢的描述甲組26,28,30,32,34.X甲=30乙組24,27,30,33,36.X乙=30丙組26,29,30,31,34.X丙=30(一)反映離散程度的常用指標(biāo):1、極差2、四分位數(shù)間距3、方差4、標(biāo)準(zhǔn)差5、變異系數(shù)(二)極差(全距)R1、計(jì)算公式:R=最大值-最小值2、意義:R愈大,離散度愈大,R愈小,離散度愈小。3、優(yōu)點(diǎn):計(jì)算簡單,意義明了4、缺點(diǎn):(1)不能反映每一個(gè)觀察值的變異;(2)樣本例數(shù)越大,R可能越大;(3)R抽樣誤差大,不穩(wěn)定。(三)四分位數(shù)間距(簡記Q)1.百分位數(shù)(記作PX)(1)定義:將一組觀察值從小到大按順序排列,一個(gè)百分位數(shù)將全部觀察值分為兩部分,理論上有x%的觀察值比它小,有(100-x)%的觀察值比它大。P50分位數(shù)也就是中位數(shù)。(2)計(jì)算步驟及公式①從小到大計(jì)算累計(jì)頻數(shù)和累計(jì)頻數(shù);②確定百分位數(shù)所在組段;③計(jì)算百分位數(shù)PxPx=L+i/fx(n.x%-∑fL)L=Px所在組段的下限i=Px所在組段的組距fx=Px所在組段的頻數(shù)∑fL=小于L各組段的累計(jì)頻數(shù)如計(jì)算P25P25在8~組段L25=8,i25=4,f25=48,∑fL=108,n=108P25=L25+i25/f25(n.25%-∑fL)=8.083計(jì)算P75P75在12~組段L75=12,i25=25,f75=4,∑fL=74,n=108P75=L75+i75/f75(n.75%-∑fL)=13.1202.四分位數(shù)間距(1)計(jì)算公式:P25:下四分位數(shù)簡記QLP75:上四分位數(shù)簡記QU四分位數(shù)間距Q=QU-QL=13.120-8.083=5.037(2)意義:中間一半觀察值的極差,及R意義相似。(3)特點(diǎn):A.比R穩(wěn)定,但仍未考慮每一個(gè)觀察值的變異;B.常用于描述偏態(tài)資料的離散度。(四)方差(總體方差簡記σ2,樣本方差簡記S2)一組觀察值的離均差平方和,取其均數(shù),即方差。1、計(jì)算公式:2、意義:方差越大,離散度越大;方差越小,離散度越小。(五)標(biāo)準(zhǔn)差(總體標(biāo)準(zhǔn)差簡記σ,樣本標(biāo)準(zhǔn)差簡記S)1、定義:方差的開方,即標(biāo)準(zhǔn)差。2、意義:及方差的意義相同3、樣本標(biāo)準(zhǔn)差計(jì)算方法:(1)直接法:(2)加權(quán)法:4.應(yīng)用:(1)用于表示正態(tài)或近似正態(tài)分布資料的離散度;(2)結(jié)合均數(shù)描述正態(tài)分布的特征;(3)計(jì)算標(biāo)準(zhǔn)誤。(4)計(jì)算變異系數(shù)(六)變異系數(shù)(簡記CV)1、計(jì)算公式:CV=S/X×100%2、用途:(1)比較度量衡單位不同的多組資料的變異度(2)比較均數(shù)相差懸殊的多組資料的變異度例1身高:X=166.06cm,S=4.95cm體重:X=53.72kg,S=4.96kg身高CV=4.95cm/166.06cm×100%=2.98%體重CV=4.96kg/53.72kg×100%=9.23%例2表2.6某地不同年齡男子身高(cm)的變異程度━━━━━━━━━━━━━━━━━━━━━━━年齡組人數(shù)均數(shù)標(biāo)準(zhǔn)差變異系數(shù)(%)───────────────────────3-3.5歲30096.13.13.230-35歲400170.25.00.3━━━━━━━━━━━━━━━━━━━━━━━3、CV特點(diǎn):沒有單位,是相對(duì)數(shù),便于資料間的比較。第二節(jié)正態(tài)分布和參考值范圍的估計(jì)一、正態(tài)分布(一)正態(tài)分布圖形兩頭低,中間高,左右對(duì)稱,呈鐘型的單峰曲線。作u變換后:u=(X-μ)/σ正態(tài)分布變成μ=0,σ=1的標(biāo)準(zhǔn)正態(tài)分布。(二)正態(tài)分布特征1、曲線在橫軸上方均數(shù)處最高;2、以均數(shù)為中心,左右對(duì)稱;3、正態(tài)分布有兩個(gè)參數(shù):(1)μ:位置參數(shù),確定曲線位置當(dāng)σ一定時(shí),μ越大,曲線越向右移動(dòng);μ越小,曲線越向左移動(dòng)。(2)σ:離散度參數(shù),決定曲線的形態(tài):當(dāng)μ一定時(shí),σ越大,表示數(shù)據(jù)越分散,曲線越“胖”;σ越小,表示數(shù)據(jù)越集中,曲線越“瘦”。4、正態(tài)分布曲線下的面積有一定的分布規(guī)律。二、正態(tài)分布曲線下的面積分布規(guī)律。以曲線下總面積為100%,則有:1、μ±1σ的區(qū)間占總面積的68.27%,即μ±1σ的區(qū)間內(nèi)包含的觀察值個(gè)數(shù)占觀察值總個(gè)數(shù)的68.27%。1、μ±1.96σ的區(qū)間占總面積的95%,即μ±1.96σ的區(qū)間內(nèi)包含的觀察值個(gè)數(shù)占觀察值總個(gè)數(shù)的95%。3、μ±2.58σ的區(qū)間占總面積的99%,即μ±2.58σ的區(qū)間內(nèi)包含的觀察值個(gè)數(shù)占觀察值總個(gè)數(shù)的99%。正態(tài)分布的應(yīng)用1.估計(jì)頻數(shù)分布情況2.估計(jì)參考值范圍三、參考值范圍的估計(jì)1.參考值范圍意義:參考值范圍(亦稱為正常值范圍)是指正常人的解剖、生理、生化等各種指標(biāo)的波動(dòng)范圍。它主要用于劃分正常及異常的界限。2.正常值范圍制定的一般原則(1)抽取足夠數(shù)量的正常人作為調(diào)查對(duì)象A.“正常人”-不是指任何一點(diǎn)小病都沒有的人,而是指排除影響被研究指標(biāo)的疾病和因素的人。如制定SGPT(谷丙轉(zhuǎn)氨酶)正常值范圍,正常人的條件是:a.無肝、腎、心、腦、肌肉等疾患;b.近期無服用損肝的藥物(如氯丙嗪,異煙肼)c.測定前未作劇烈運(yùn)動(dòng)。B.正常值范圍制定所需的樣本例數(shù),一般要求n>100(2)確定是否分組制定參考值范圍(3)確定取單側(cè)還是雙側(cè)正常值范圍。A.白細(xì)胞數(shù)過高和過低均屬于異常,則需同時(shí)制定正常值范圍的下限(最小值)和上限(最大值),稱雙側(cè)正常值范圍。B.肺活量只過低為異常,只需制定正常值范圍的下限;尿鉛只過高為異常,只需制定正常值范圍的上限;均稱單側(cè)正常值范圍。(4)選定適當(dāng)?shù)陌俜纸缦蕖UV捣秶囊馑迹航^大多數(shù)正常人的某項(xiàng)觀察值均在該范圍之內(nèi)。這個(gè)絕大多,習(xí)慣上指正常人的80%、90%、95%、99%(最常用是95%)。那么,在正常值范圍之外的正常人有:單側(cè):20%、10%、5%、1%雙側(cè)每側(cè):10%、5%、2.5%0.5%根據(jù)所選定的百分界限,會(huì)造成假陽性或/和假陰性。如SGPT,正常值單側(cè)95%上限為146單位(King法)按該范圍,5%的正常人(>146)被錯(cuò)判為異常,稱假陽性;而肝功能異常者中,也可能有<146者,按該范圍錯(cuò)判為正常,稱假陰性。顯然,上限值提高,假陽性減少,假陰性增多;上限值降低,假陽性增多,假陰性減少;(5)選擇適當(dāng)制定方法。3、正常值范圍常用制定方法(1)正態(tài)分布法.A.適用范圍:(近似)正態(tài)分布或?qū)?shù)正態(tài)分布資料B.計(jì)算公式:雙側(cè)95%X±1.96S99%X±2.58S單側(cè)上限95%X+1.645S99%X+2.326S下限95%X-1.645S99%X-2.326S例114歲女孩身高95%參考值范圍是:X±1.96S=143.08±1.96×6.58=(130.18~155.98)(2)百分位數(shù)法A.適用范圍:1、偏態(tài)分布資料2、開口資料B.計(jì)算公式:雙側(cè)95%P2.5~P97.599%P0.5~P99.5單側(cè)上限95%P9599%P99下限95%P599%P1第三節(jié)計(jì)量資料的統(tǒng)計(jì)推斷一、均數(shù)的抽樣誤差及標(biāo)準(zhǔn)誤一、均數(shù)的抽樣誤差概念由于總體中存在個(gè)體變異,所以由抽樣得到的樣本均數(shù)及總體均數(shù)之間存在差異,這種差異稱均數(shù)的抽樣誤差。在抽樣研究中,抽樣誤差是不可避免的,但可以估計(jì)其大小。二、中心極限定理1、在正態(tài)總體中,隨機(jī)抽取例數(shù)為n的樣本,樣本均數(shù)X服從正態(tài)分布;2、在偏態(tài)總體中隨機(jī)抽樣,當(dāng)n足夠大時(shí)(n>50),X也近似正態(tài)分布;3、從均數(shù)為μ,標(biāo)準(zhǔn)差為σ的正態(tài)或偏態(tài)總體中,抽取例數(shù)為n的樣本,樣本均數(shù)X的總體均數(shù)仍為μ,標(biāo)準(zhǔn)差為σx三、標(biāo)準(zhǔn)誤意義及其計(jì)算方法1、意義:說明均數(shù)抽樣誤差大小的指標(biāo),用σx表示。σx越大,均數(shù)抽樣誤差越大;反之,σx越小,均數(shù)抽樣誤差越小。2、計(jì)算公式:(理論值)(估計(jì)值)及成正比,及成反比,可以通過增加n減小。3.均數(shù)的標(biāo)準(zhǔn)誤的用途:(1)說明均數(shù)抽樣誤差大小,反映均數(shù)的可靠性。σx越大,用樣本均數(shù)推論總體均數(shù)越可靠,反之亦然(2)估計(jì)總體均數(shù)的可信區(qū)間(3)用于進(jìn)行假設(shè)檢驗(yàn)二、t分布(一)t分布含義:由于呈正態(tài)分布N(、),則可以將一般正態(tài)變量變換成標(biāo)準(zhǔn)正態(tài)變量:將一般的正態(tài)分布變換為標(biāo)準(zhǔn)正態(tài)分布N(0、1)。在實(shí)際應(yīng)用中,往往未知,用代替,則只能對(duì)做t變換而不是變換:=每個(gè)可以算出一個(gè)t值,t值的分布稱t分布。(二)t分布特征:1、以0為中心,左右對(duì)稱的單峰分布;2、t分布的形態(tài)及自由度ν有關(guān):ν越小,t分布曲線峰部越低平而尾部翹得越高;(t分布及u分布相差較大,即相同的曲線下面積,t值>u值)ν逐漸增大,t分布逼近標(biāo)準(zhǔn)正態(tài)分布;ν=∞,t分布=標(biāo)準(zhǔn)正態(tài)分布。(同樣的曲線下面積,t值=u值)自由度不同,t分布曲線形態(tài)就不相同,因此t分布是一簇曲線,則就是說,自由度不同,相同的t值所對(duì)應(yīng)的面積不同,或說,出現(xiàn)該t值的概率不同。(三)t值表對(duì)應(yīng)于每一自由度取值,就有一條t分布曲線,每條曲線都有自身曲線下t值的分布規(guī)律,相同曲線下面積所對(duì)應(yīng)的t值不同,計(jì)算t值較為繁雜。為此,統(tǒng)計(jì)學(xué)家已制成t值表,通過查表即獲得相應(yīng)的t值。查表須注意:1、橫標(biāo)目(左邊第一列)為自由度(),縱標(biāo)目為概率(P或),也就是t界值以外單側(cè)或雙側(cè)尾部的面積占總面積的百分比,表中的數(shù)字就是對(duì)應(yīng)于和的t界值,用tα,ν表示;2、t值有正負(fù)值,由于t分布是以0為中心的對(duì)稱分布,故表中只列正值,查表時(shí),不管t值正負(fù)只用絕對(duì)值;3、當(dāng)ν一定時(shí),t值越大,P越??;4、當(dāng)P一定時(shí),ν越大,t值越?。沪停健迺r(shí),t=u;5、當(dāng)ν和t值一定時(shí),雙側(cè)P=2倍單側(cè)P。即雙側(cè)tα,ν=單側(cè)tα/2,ν。例ν=10時(shí):單側(cè)=1.812即P(t≤-1.812)=0.05或P(t≥1.812)=0.05雙側(cè)=2.228即P(t≤-2.228)+P(t≥2.228)=0.05三、總體均數(shù)的估計(jì)(一)估計(jì)方法:1、點(diǎn)值估計(jì):用樣本均數(shù)直接作為總體均數(shù)的估計(jì)值2、區(qū)間估計(jì)(二)總體均數(shù)的區(qū)間估計(jì)1、定義:按一定的概率(1-α)確定包含未知總體均數(shù)的可能范圍。所確定的范圍稱為總體均數(shù)的可信區(qū)間(或置信區(qū)間,CI);1-α稱可信度,最常用雙側(cè)95%。2、估計(jì)方法:(1)當(dāng)σ未知,而且樣本例數(shù)n較?。╪<50)時(shí),按t分布原理估計(jì):±tα,ν.(2)當(dāng)σ已知,或σ未知但樣本例數(shù)足夠大(n>50)時(shí),按標(biāo)準(zhǔn)正態(tài)分布原理估計(jì):A.σ已知:(-uα.,+uα.)uα為u界值,uα.B.σ未知但n足夠大(n>50):(-uα.,+uα.)uα.按標(biāo)準(zhǔn)正態(tài)分布原理估計(jì)總體均數(shù)可信區(qū)間時(shí),熟記下列常用區(qū)間:95%總體均數(shù)可信區(qū)間:1.96或1.9699%總體均數(shù)可信區(qū)間:2.58或2.58例9.10n=20,=118.4mmHg,s=10.8mmHg,估計(jì)其95%可信區(qū)間。(-tα,ν.,+tα,ν.)t0.05,19=2.093==2.41(118.4-2.093×2.41,118.7+2.093×2.41)(113.3,123.5)mmHg例n=200,=3.64mmol/L,s=1.20mmol/L,估計(jì)其95%可信區(qū)間。uα.(3.64-1.96×,3.64+1.96×)(3.47,3.81)mmol/L3、可信區(qū)間內(nèi)涵義以95%總體均數(shù)可信區(qū)間為例:有95%的可能所計(jì)算出的區(qū)間包含了總體均數(shù),即估計(jì)正確的概率為95%,錯(cuò)誤5%。4、可信區(qū)間兩個(gè)要素:(1)準(zhǔn)確度:反映在可信度(1-α)的大小。1-α越接近1,越準(zhǔn)確。如可信度99%比95%準(zhǔn)確。(2)精確度:反映在區(qū)間范圍寬窄。范圍越摘越好。95%可信區(qū)間精度優(yōu)于99%。在n確定的情況下,準(zhǔn)確度↑,精確度↓。在兼顧準(zhǔn)確度和精確度時(shí),一般取95%可信區(qū)間。在可信度確定的情況下,增加樣本例數(shù),可提高精確度。5、可信區(qū)間及正常值范圍區(qū)別:(1)意義不同:正常值范圍是指絕大多數(shù)觀察值在某個(gè)范圍;可信區(qū)間是指按一定的可信度估計(jì)總體參數(shù)(均數(shù))可能所在的范圍;(2)計(jì)算公式不同可信區(qū)間±uα.(大樣本)正常值范圍±uα.S前者用標(biāo)準(zhǔn)誤,后者用標(biāo)準(zhǔn)差。(3)用途不同:可信區(qū)間用于估計(jì)總體均數(shù),參考值范圍用于判斷觀察對(duì)象某項(xiàng)指標(biāo)正常及否。四、假設(shè)檢驗(yàn)的基本思想和步驟(一)提出問題:例:根據(jù)大量調(diào)查的資料,已知健康成年男子的脈搏均數(shù)為72次/分。某醫(yī)生在山區(qū)隨機(jī)抽取了25名健康成年男子,得其脈搏均數(shù)為74.2次/分,標(biāo)準(zhǔn)差為6.5次/分。問能否認(rèn)為該山區(qū)成年男子的脈搏數(shù)高于一般人?本研究目的是判斷是否>(72次/分)。由于存在抽樣誤差,來自某一總體的隨機(jī)樣本其樣本均數(shù)()及總體均數(shù)()往往不等;從同一總體中抽取的兩個(gè)隨機(jī)樣本的樣本均數(shù)也往往不同。因此,在比較一個(gè)樣本均數(shù)及一個(gè)總體均數(shù)的差別,或比較兩個(gè)樣本均數(shù)的差別時(shí),需要判斷這種差別的性質(zhì)和意義,造成這種差別有兩種可能:(1)總體均數(shù)不等(來自不同總體),有本質(zhì)差別;(2)總體均數(shù)相等(來自相同的總體),其差別由抽樣誤差所致,無本質(zhì)差別。要判斷屬于那種可能,需要通過假設(shè)檢驗(yàn)來回答。(二)假設(shè)檢驗(yàn)原理(基本思想)要檢驗(yàn)兩指標(biāo)的差別是由抽樣誤差引起的,還是由于總體均數(shù)不同所致,運(yùn)用反證法。首先建立檢驗(yàn)假設(shè),假設(shè)樣本來自同一總體,在此假設(shè)的基礎(chǔ)上計(jì)算有關(guān)的統(tǒng)計(jì)量,根據(jù)統(tǒng)計(jì)量的大小來判斷假設(shè)成立的概率的大小。一般把概率P≤0.05的事件稱為小概率事件,小概率事件在一次觀察中可以認(rèn)為是不會(huì)發(fā)生的,如及這原則不符,則認(rèn)為原先的假設(shè)是不正確的,就是說“假設(shè)”不能成立,則拒絕這個(gè)“假設(shè)”。否則不拒絕原來的“假設(shè)”。這就是假設(shè)檢驗(yàn)的基本思想。(三)假設(shè)檢驗(yàn)的一般步驟A.建立假設(shè)兩種假設(shè)(1)檢驗(yàn)假設(shè)(無效假設(shè))用H0表示:即假設(shè)兩總體均數(shù)相等,差別僅僅由于抽樣誤差所致;(2)備擇假設(shè)用H1表示:是及H0對(duì)立的假設(shè),當(dāng)H0被拒絕,則接受H1。2、確定單雙側(cè)檢驗(yàn)(常用雙側(cè)檢驗(yàn))根據(jù)研究目的和專業(yè)知識(shí)還要確定是雙側(cè)檢驗(yàn)還是單側(cè)檢驗(yàn)。若目的是推斷兩總體是否不等(如是否μ≠μ0),不管是μ>μ0還是μ<μ0,都是我們所關(guān)心的,則用雙側(cè)檢驗(yàn),此時(shí)H0:μ=μ0,H1:μ≠μ0;若從專業(yè)知識(shí)已知不會(huì)μ<μ0(或不會(huì)μ>μ0),目的是推斷是否μ>μ0(或μ<μ0),則用單側(cè)檢驗(yàn),此時(shí)H0:μ=μ0,H1:μ>μ0(或μ<μ0)。注意:單側(cè)檢驗(yàn)更容易得到有統(tǒng)計(jì)學(xué)意義的結(jié)果,因此,做單側(cè)檢驗(yàn)要通過專業(yè)知識(shí)來確定,否則,一律做雙側(cè)檢驗(yàn),雙側(cè)檢驗(yàn)更穩(wěn)妥。3.確定檢驗(yàn)水準(zhǔn)檢驗(yàn)水準(zhǔn)用表示,是拒絕或不拒絕H0的概率標(biāo)準(zhǔn),也就是小概率事件標(biāo)準(zhǔn),是人為選定的概率值,一般取α=0.05(根據(jù)需要也可取0.2、0.15、0.1、0.01等)。B、選定檢驗(yàn)方法和計(jì)算統(tǒng)計(jì)量根據(jù)研究設(shè)計(jì)方案、資料類型、樣本含量大小及分析目的選用適當(dāng)?shù)臋z驗(yàn)方法,并根據(jù)樣本資料計(jì)算相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量。不同的檢驗(yàn)方法要用不同的公式計(jì)算現(xiàn)有樣本的檢驗(yàn)統(tǒng)計(jì)量(t,u,F(xiàn)值)。檢驗(yàn)統(tǒng)計(jì)量是在H0成立的前提下計(jì)算出來。C、確定P值P值是指在H0所規(guī)定的總體中作隨機(jī)抽樣,獲得等于及大于(或等于及小于)現(xiàn)有樣本統(tǒng)計(jì)量的概率。P也可以通俗地說,P是指H0成立的概率大小。用計(jì)算所得的檢驗(yàn)統(tǒng)計(jì)量(t、u值)及相應(yīng)的界值比較,確定P值。D、作出推斷結(jié)論假設(shè)檢驗(yàn)的結(jié)論:(1)統(tǒng)計(jì)學(xué)結(jié)論(拒絕或接受H0,即有無統(tǒng)計(jì)學(xué)意義);(2)專業(yè)結(jié)論。2、推斷結(jié)論方法(1)當(dāng)P≤α?xí)r,結(jié)論是:拒絕H0,接受H1(差別有顯著意義或有統(tǒng)計(jì)學(xué)意義);(2)當(dāng)P>α?xí)r,結(jié)論是:不拒絕H0。(差別無顯著意義,或無統(tǒng)計(jì)學(xué)意義);作出上述推斷的理由(1)如果P≤α,則按α水準(zhǔn)拒絕H0,接受H1。因?yàn)槌槿∫粋€(gè)樣本,僅代表一次試驗(yàn),現(xiàn)P≤α,為小概率事件,小概率事件在一次試驗(yàn)中竟然發(fā)生,及概率理論的一個(gè)基本原則:小概率事件在一次試驗(yàn)中不會(huì)發(fā)生產(chǎn)生矛盾,因此拒絕H0。(2)如果P>α,則按α水準(zhǔn)不拒絕H0,因?yàn)楦怕瘦^大,沒有理由拒絕H0,認(rèn)為其成立。所以,研究者只是在概率上從H0及H1兩者中選擇一個(gè)較為合理的判斷。由此可見,假設(shè)檢驗(yàn)所作出的結(jié)論是具有概率性質(zhì)的,不是絕對(duì)的肯定或否定。不論拒絕或不拒絕H0都可能發(fā)生錯(cuò)誤。拒絕實(shí)際上是成立的H0,這類“棄真”的錯(cuò)誤稱Ⅰ型錯(cuò)誤或第一類錯(cuò)誤。不拒絕(接受)實(shí)際上是不成立的H0,這類“存?zhèn)巍钡腻e(cuò)誤稱Ⅱ型錯(cuò)誤或第二類錯(cuò)誤。即拒絕H0,犯Ⅰ型錯(cuò)誤;接受H1,犯Ⅱ型錯(cuò)誤。兩類錯(cuò)誤的關(guān)系第一類錯(cuò)誤的概率為α,第二類錯(cuò)誤的概率為βα越大,β越小,α越小,β越大。第四節(jié)t檢驗(yàn)和u檢驗(yàn)一、t檢驗(yàn)和u檢驗(yàn)用途1、樣本均數(shù)及總體均數(shù)的比較;2、配對(duì)計(jì)量資料的比較;3、兩樣本均數(shù)的比較;二、t檢驗(yàn)和u檢驗(yàn)應(yīng)用條件1、t檢驗(yàn)應(yīng)用條件:(1)樣本來自正態(tài)總體;(2)兩小樣本均數(shù)比較,還要求樣本的總體方差相等。2、u檢驗(yàn)應(yīng)用條件:樣本例數(shù)n較大(n>100),或n雖小而總體標(biāo)準(zhǔn)差已知(少見)。三、單樣本t檢驗(yàn)(樣本均數(shù)及總體均數(shù)比較t檢驗(yàn))1、目的:檢驗(yàn)樣本均數(shù)所代表的未知總體均數(shù)是否等于以已知的總體均數(shù)。已知的總體均數(shù)指:(1)理論值;(2)標(biāo)準(zhǔn)值;(3)經(jīng)大量調(diào)查得到的穩(wěn)定值。2、檢驗(yàn)公式t=v=n-1四、配對(duì)t檢驗(yàn)1、配對(duì)設(shè)計(jì)含義:將受試對(duì)象按一定條件配成對(duì)子,再隨機(jī)分配每對(duì)的兩個(gè)受試對(duì)象到不同的處理組。2、配對(duì)設(shè)計(jì)形式①同對(duì)的兩個(gè)受試對(duì)象分別給予兩種處理;②同一受試對(duì)象分別給予兩種處理(如同一個(gè)樣品用兩種方法檢測,或同一受試對(duì)象不同部位某指標(biāo)的值)③同一受試對(duì)象處理前后比較3、檢驗(yàn)公式:t=v=n-1五、兩樣本均數(shù)比較(一)兩大樣本均數(shù)的u檢驗(yàn)1、適用條件兩個(gè)樣本含量均足夠大(n1>50和n2>50)2、檢驗(yàn)公式:(二)兩小樣本均數(shù)的比較—t檢驗(yàn)1、應(yīng)用條件(1)樣本來自正態(tài)總體;(2)兩樣本所來自的總體方差相等。2、檢驗(yàn)公式或六、假設(shè)檢驗(yàn)應(yīng)注意的問題(一)要有嚴(yán)密的抽樣研究設(shè)計(jì),考慮到被比較的樣本的可比性,這是假設(shè)檢驗(yàn)的前提。(二)選用的假設(shè)檢驗(yàn)方法應(yīng)符合其應(yīng)用條件。(三)當(dāng)所比較的差異無實(shí)際意義時(shí),不必進(jìn)行假設(shè)檢驗(yàn)。(四)正確理解差別有無顯著性的統(tǒng)計(jì)意義。(五)結(jié)論不能絕對(duì)化。是否拒絕H0,取決于:1、被研究的事物有無本質(zhì)的差異2、抽樣誤差大?。海?)個(gè)體差異大小(2)樣本例數(shù)多少3、檢驗(yàn)水準(zhǔn)α的高低(六)報(bào)告結(jié)論時(shí)最好寫出較確切的P值,并且單側(cè)檢驗(yàn)需作注明(習(xí)慣上采用雙側(cè)檢驗(yàn)不需作注明)第五節(jié)方差分析(F檢驗(yàn))(analysisofvarianceANOVA)一、方差分析的用途及應(yīng)用條件(一)用途1、檢驗(yàn)兩個(gè)或多個(gè)樣本均數(shù)間的差異有無統(tǒng)計(jì)學(xué)意義;2、回歸方程的線性假設(shè)檢驗(yàn);3、檢驗(yàn)兩個(gè)或多個(gè)因素間有無交互作用。(二)應(yīng)用條件1、各個(gè)樣本是相互獨(dú)立的隨機(jī)樣本;2、各個(gè)樣本來自正態(tài)總體;3、各個(gè)處理組(樣本)的總體方差方差相等,即方差齊。二、方差分析的基本思想(一)方差分析中變異的分解此資料的變異,可以分出三種:1、總變異:表現(xiàn)為所有數(shù)據(jù)大小不等,用總的離均差平方和表示,記為SS總。(i代表第i個(gè)組,j代表第j個(gè)觀察值)的大小還及總例數(shù)N有關(guān),確切講是及總的自由度有關(guān),=N-1。2、組間變異:組間變異表現(xiàn)為各組均數(shù)大小不等,描述其大小指標(biāo)(1)用各組均數(shù)及總均數(shù)X的離均差平方和表示,記為SS組間SS組間的大小及處理因素的作用、隨機(jī)誤差(測量誤差和個(gè)體差異)和組間自由度有關(guān)。,(2)用SS組間除于組間自由度表示,稱組間均方組間均方反映處理因素和隨機(jī)誤差的作用。3、組內(nèi)變異:組內(nèi)變異表現(xiàn)為各組內(nèi)部各個(gè)觀察值大小不等。描述其大小指標(biāo):(1)用各組內(nèi)部每個(gè)觀察值及組均數(shù)X的離均差平方和表示,記為SS組內(nèi)。SS組內(nèi)的大小及隨機(jī)誤差(測量誤差和個(gè)體差異)和組內(nèi)自由度有關(guān)。,(2)用SS組內(nèi)除于組內(nèi)自由度表示,稱組內(nèi)均方組內(nèi)均方只反映觀察值的隨機(jī)誤差(個(gè)體差異及隨機(jī)測量誤差)。三種變異的關(guān)系:SS總=SS組內(nèi)+SS組間,。(二)方差分析思想1、如果兩個(gè)或多個(gè)樣本來自同一個(gè)總體,或者處理因素的效應(yīng)一樣(沒有差異),則組間和組內(nèi)的變異相等,即:MS組間=MS組內(nèi)或兩者相差不大,它們的比值用F表示:則F=1,或F及1相差不大。2、若兩個(gè)樣本或多個(gè)樣本來自不同總體,或者處理因素的效應(yīng)不一樣,則組間變異大于組內(nèi)變異,即:MS組間>MS組內(nèi)則F值明顯大于1。要大到多大程度才有統(tǒng)計(jì)學(xué)意義?按和查F界值表,由F值確定P值,按P值大小作出推斷。方差分析基本思想:在方差分析時(shí),根據(jù)資料的設(shè)計(jì)類型不同,將總的離均差平方和及自由度分解為兩個(gè)或多個(gè)部分,除隨機(jī)誤差外,其余部分的變異反映處理因素的作用,通過比較不同來源的均方,借助F分布原理作出統(tǒng)計(jì)推斷,從而了解處理因素對(duì)觀測指標(biāo)有無影響。三、單因素方差分析(一)計(jì)算方法單因素方差分析的計(jì)算公式
變異來源SSυMSF
組間k-1組內(nèi)(誤差)SS總-SS組間N-k總N-1────────────────────────────
*
四、分析步驟1、建立假設(shè)和確定檢驗(yàn)水準(zhǔn);H0:H1:或不全相等2、計(jì)算檢驗(yàn)統(tǒng)計(jì)量F值表9-15例9-16方差分析結(jié)果變異來源SSυMSFP組間2.027630.675910.24<0.01組內(nèi)0.791812總2.8194153、確定P值和推斷結(jié)論以組間自由度為,以組內(nèi)自由度為,查附表3,F(xiàn)界值表:=3.49,由于,故P<0.05;按,拒絕H0,接受H1,可以認(rèn)為四組均數(shù)不等或不全相等。注意:以上僅是總的結(jié)論,尚需對(duì)四個(gè)樣本均數(shù)進(jìn)行兩兩比較(見后)。五、多個(gè)樣本均數(shù)的兩兩比較-q檢驗(yàn)多個(gè)樣本均數(shù)比較經(jīng)F檢驗(yàn)后,若得出有統(tǒng)計(jì)學(xué)意義的結(jié)論后,要進(jìn)一步推斷哪些組之間有差別,哪些組之間沒有差別,還是所有各組之間都有差別,要解決這些問題,就要進(jìn)一步做均數(shù)間的兩兩比較了。多個(gè)樣本均數(shù)間的兩兩比較又稱多重比較,由于涉及的對(duì)比組數(shù)大于2,就不能應(yīng)用前面介紹的t檢驗(yàn),只能使用下面介紹的方法。若仍用前述前述的t檢驗(yàn)方法,對(duì)每兩個(gè)對(duì)比組作比較,會(huì)使犯第一類錯(cuò)誤(拒絕了實(shí)際上成立的H0所犯的錯(cuò)誤)的概率α增大,即可能把本來無差別的兩個(gè)總體均數(shù)判為有差別。(一)檢驗(yàn)統(tǒng)計(jì)量q的計(jì)算公式為:式中為兩個(gè)對(duì)比組的樣本均數(shù)。為方差分析中算得的組內(nèi)均方),和分別為兩對(duì)比組的樣本例數(shù)。(二)q檢驗(yàn)的方法步驟對(duì)例9-16資料作兩兩比較。1、建立假設(shè)H0:任兩對(duì)比組的總體均數(shù)相等,即H1:任兩對(duì)比組的總體均數(shù)不等,2、選擇檢驗(yàn)方法,計(jì)算統(tǒng)計(jì)量q將四個(gè)樣本均數(shù)從大到小順序排列,并編上組次:組次1234均數(shù)3.32003.09752.68502.4025組別DCBA列出兩兩比較計(jì)算表,見表9-17表9-17四個(gè)樣本均數(shù)兩兩比較的q檢驗(yàn)對(duì)比組兩均數(shù)之差標(biāo)準(zhǔn)誤q值組數(shù)q界值PA及BSa0.050.01(1)(2)(3)(4)=(2)/(3)(5)(6)(7)(8)1及40.91750.12857.14044.205.50<0.011及30.63500.12854.94233.775.05<0.051及20.22250.12851.73223.084.32>0.052及40.69500.12855.40933.775.05<0.012及30.41250.12853.21023.084.32<0.053及40.28250.12852.19823.084.32>0.053、確定P值,判斷結(jié)果第一節(jié)分類資料的描述一、相對(duì)數(shù)的意義和定義對(duì)于分類資料常采用相對(duì)數(shù)進(jìn)行描述。收集到的分類資料,表現(xiàn)為絕對(duì)數(shù),絕對(duì)數(shù)說明事物發(fā)生的實(shí)際水平,是進(jìn)行統(tǒng)計(jì)分析的基礎(chǔ),但不便于事物進(jìn)行深入地分析比較。相對(duì)數(shù):是兩個(gè)有聯(lián)系指標(biāo)之比,說明事物發(fā)生的相對(duì)水平,便于對(duì)分類資料進(jìn)行分析和比較。二、常用的相對(duì)數(shù)比(Ratio)亦稱相對(duì)比,是A、B兩個(gè)有關(guān)指標(biāo)之比,說明A是B的多少倍或百分之幾。比(Ratio)=A/B(或×100%)A及B的性質(zhì)可以相同,也可以不同,可以是絕對(duì)數(shù)也可以是相對(duì)數(shù)或平均數(shù)。2、構(gòu)成比(Proportion)又稱構(gòu)成指標(biāo),說明一事物內(nèi)部各個(gè)組成部分所占的比重或分布,常以百分?jǐn)?shù)表示,又稱百分比。構(gòu)成比兩個(gè)特點(diǎn):(1)一組構(gòu)成比之和等于100%或1;(2)某部分構(gòu)成增加或減少,則其它部分構(gòu)成就相應(yīng)減少或增加。3、率(Rate)又稱頻率指標(biāo),是指在一定時(shí)間內(nèi)發(fā)生某現(xiàn)象的觀察單位數(shù)及可能發(fā)生該現(xiàn)象的總觀察單位數(shù)之比,常以百分率(%)、千分率(‰)、萬分率(1/萬)、十萬分率(1/10萬)等表示,它說明某現(xiàn)象發(fā)生的頻率或強(qiáng)度。K為比例基數(shù),可以是百分率(%)、千分率(‰)、萬分率(1/萬)或十萬分率(1/10萬),可根據(jù)習(xí)慣或使計(jì)算出的率保持一、二位整數(shù)。人口出生率、死亡率、自然增長率、嬰兒死亡率等采用千分率,某病死亡率采用十萬分率。三、應(yīng)用相對(duì)數(shù)時(shí)注意的問題1、計(jì)算相對(duì)數(shù)的分母不宜過小分母過小則計(jì)算所得的相對(duì)數(shù)不穩(wěn)定,不可靠。如少于30例時(shí),以絕對(duì)數(shù)表示較好。2、分析時(shí)不能以比代率3、對(duì)觀察單位數(shù)不等的幾個(gè)率,不能直接相加求平均率;4、資料的對(duì)比應(yīng)注意可比性;5、率或構(gòu)成比的比較要遵循隨機(jī)抽樣的原則,要做假設(shè)檢驗(yàn)。四、率的標(biāo)準(zhǔn)化法(一)概念率的標(biāo)準(zhǔn)化:是指在比較兩個(gè)或多個(gè)總率時(shí),采用一個(gè)共同的內(nèi)部構(gòu)成標(biāo)準(zhǔn),將兩個(gè)或多個(gè)樣本不同的內(nèi)部部構(gòu)成調(diào)整為相同的內(nèi)部構(gòu)成,以消除因內(nèi)部構(gòu)成不同對(duì)總率產(chǎn)生的影響,使算得的標(biāo)準(zhǔn)化率具有可比性。采用標(biāo)準(zhǔn)化方法計(jì)算得到的率簡稱標(biāo)化率,又調(diào)整率?;舅枷耄翰捎媒y(tǒng)一的標(biāo)準(zhǔn)內(nèi)部構(gòu)成(年齡、性別),在相同的內(nèi)部構(gòu)成條件下,計(jì)算預(yù)期的發(fā)生率(死亡率);目的:消除因內(nèi)部構(gòu)成不同對(duì)總率產(chǎn)生的影響,使標(biāo)化率具有可比性。(二)標(biāo)準(zhǔn)化率計(jì)算步驟1、選擇計(jì)算方法:直接法和間接法。(1)若已知被標(biāo)化組各小組的率,即pi,采用直接法;(2)若已知被標(biāo)化組各小組的人數(shù),即ni,以及總率,采用間接法。2、選定標(biāo)準(zhǔn)標(biāo)準(zhǔn)選擇原則:選擇有代表性的、較穩(wěn)定的、數(shù)量較大的人群,如全世界的、全國的、全省的、本地區(qū)的人群數(shù);選擇相互比較的人群合并做標(biāo)準(zhǔn);(3)選擇相互比較的人群某一組做標(biāo)準(zhǔn)。3、計(jì)算預(yù)期數(shù)及預(yù)期率,即標(biāo)化率。(1)直接法:按公式10.4或10.5計(jì)算;(2)間接法:按公式10.6。(三)應(yīng)用標(biāo)準(zhǔn)化率注意事項(xiàng)1、應(yīng)用直接法計(jì)算標(biāo)準(zhǔn)化率時(shí),由于所選定的標(biāo)準(zhǔn)人口不同,算得的標(biāo)準(zhǔn)化率也不同,因此,比較幾個(gè)標(biāo)準(zhǔn)化率時(shí),應(yīng)采用同一標(biāo)準(zhǔn)人口;2、當(dāng)各年齡組的率出現(xiàn)明顯交叉時(shí),宜直接比較各年齡組的發(fā)生率,而不宜用標(biāo)準(zhǔn)化法;3、兩樣本標(biāo)準(zhǔn)化率的比較應(yīng)作假設(shè)檢驗(yàn);第二節(jié)分類資料統(tǒng)計(jì)推斷一、率的抽樣誤差及標(biāo)準(zhǔn)誤1、率的抽樣誤差含義在抽煙研究中,樣本率及總體率之間存在的差異稱為率的抽樣誤差。2、描述率的抽樣誤差大小的指標(biāo)-率的標(biāo)準(zhǔn)誤計(jì)算公式(理論值)(估計(jì)值)二、總體率的估計(jì)1、估計(jì)方法(1)點(diǎn)估計(jì)(2)區(qū)間估計(jì)2、區(qū)間估計(jì)方法(1)正態(tài)近似法A.適用條件:np>5且n(1-p)>5B.常用兩個(gè)區(qū)間的估計(jì)公式總體率的95%的可信區(qū)間:p±1.96Sp總體率的99%的可信區(qū)間:p±2.58Sp(2)查表法A.適用條件:n≤50,特別p接近于0或1B.查表方法:以樣本含量n和陽性數(shù)x查統(tǒng)計(jì)學(xué)專著的附表三、總體率的u檢驗(yàn)(一)樣本率及總體率的比較1、適用條件:np>5且n(1-p)>52、檢驗(yàn)公式3、檢驗(yàn)步驟(1)建立假設(shè)H0:π=π0H1:π≠π0α=0.05(2)計(jì)算u值π=0.11,n=598,p=0.14=2.34(3)確定P值因u=2.34>1.96,故P<0.05(4)推斷∵P<0.05,∴按α=0.05的水準(zhǔn),拒絕H0,接受H1。故可認(rèn)為油田職工家屬高血壓患病率高于一般人。(二)兩個(gè)樣本率的比較1、適用條件(1)n1p1>5且n1(1-p1)>5(2)n2p2>5且n2(1-p2)>52、檢驗(yàn)公式第三節(jié)X2檢驗(yàn)一、X2檢驗(yàn)用途1、兩個(gè)及以上率(或構(gòu)成比)之間差異比較;2、推斷兩變量間有無相關(guān)關(guān)系;3、檢驗(yàn)頻數(shù)分布的擬合優(yōu)度。二、X2檢驗(yàn)類型1、四格表X2檢驗(yàn);2、行×列表X2檢驗(yàn);3、配對(duì)四格表X2檢驗(yàn)。三、X2檢驗(yàn)基本思想及檢驗(yàn)步驟假設(shè)兩總體率相等H0:兩總體陽性率相等,即π1=π2=53.59%;H1:兩總體陽性率不等,即π1≠π2;α=0.05。如果H0成立,則表10.7的第一行第一列理論上的生存數(shù)為:86×97/181=86×53.59%=46.09此結(jié)果稱為理論數(shù),用T表示。上述計(jì)算可由下式計(jì)算Trc=nr=同行合計(jì)數(shù),nC=同列合計(jì)數(shù),n=總例數(shù)按此公式,可以計(jì)算四個(gè)理論數(shù)T11=86×97/181=46.09T12=86×84/181=39.91T21=95×97/181=50.91T22=95×84/181=44.09表10.7內(nèi),52344550只有這四個(gè)格子的數(shù)據(jù)是基本的,其它的數(shù)據(jù)都是由這四個(gè)數(shù)據(jù)推算出來的,這種資料又稱為四格表資料。且表格內(nèi)的數(shù)字為實(shí)際資料的數(shù)字,故稱為實(shí)際數(shù),用A表示。從表10.7可見,基本格子的實(shí)際數(shù)都不等于理論數(shù)顯而易見:兩樣本率相差愈大,則實(shí)際數(shù)及理論數(shù)的差值就愈大。實(shí)際數(shù)及理論數(shù)的差值服從X2分布:X2=∑X2值的大小,除了決定于A-T的差值外,還取決于格子數(shù),嚴(yán)格地說是及自由度v有關(guān)。因?yàn)楦鞲竦模ˋ-T)2/T都是正值,故格子數(shù)愈多,X2值也就會(huì)愈大。自由度的計(jì)算公式為v=(行數(shù)-1)(列數(shù)-1)四格表的v=(2-1)(2-1)=1。如果檢驗(yàn)假設(shè)成立,則實(shí)際數(shù)和理論數(shù)的差別不會(huì)很大,X2值也不會(huì)很大;否則X2值會(huì)很大。要大到多大程度才有統(tǒng)計(jì)學(xué)意義?按v查X2界值表,由X2值確定P值,按P值大小作出推斷。表10.8x值、P值和統(tǒng)計(jì)結(jié)論x值P值統(tǒng)計(jì)結(jié)論<x>0.05不拒絕H,差異無統(tǒng)計(jì)學(xué)意義≥x≤0.05拒絕H,接受H,差異有統(tǒng)計(jì)學(xué)意義≥x≤0.01拒絕H,接受H,差異有高度統(tǒng)計(jì)學(xué)意義X2界值表特點(diǎn):(1)X2>0;(2)P一定時(shí),自由度ν越大,X2值越大;(3)自由度ν一定時(shí),X2值越大,P越??;以v=1查X2界值表得:X21,0.05=3.84,X21,0.01=6.63四、四格表資料的X2檢驗(yàn)(一)用途:兩個(gè)樣本率(或構(gòu)成比)差異的比較(二)檢驗(yàn)步驟1、建立假設(shè)H0:兩總體陽性率相等,即π1=π2=53.59%;H1:兩總體陽性率不等,即π1≠π2;α=0.05。2、計(jì)算X2值X2=3.113、查X2界值表,確定P值四格表的v=(2-1)(2-1)=1因X2=3.11<X21,0.05=3.84,故P>0.054、推斷∵P<0.05,∴按α=0.05的水準(zhǔn),不能拒絕H0,查X2界值表得,0.1>P>0.05,按α=0.05水準(zhǔn)不拒絕,故尚不能認(rèn)為兩種療法的3年生存率有差別。(三)四格表專用公式首先將四格表的基本格子的實(shí)際數(shù)命名為:abcd此時(shí),行合計(jì)為(a+b)和(c+d),列合計(jì)為(a+c)和(b+d),以a、b、c、d代入公式X2=∑,得簡化后的四格表專用公式為四格表資料的兩種公式的檢驗(yàn)結(jié)果相同,但顯然,專用公式計(jì)算更為簡便。(四)四格表X2值的校正1、校正原由X2分布原來是正態(tài)變量的一種分布,X2界值表就是根據(jù)這種連續(xù)性分布而計(jì)算出來的。但是分類資料是間斷性的,由此計(jì)算的X2值不連續(xù),尤其是自由度為1的四格表,其P值可能偏小,此時(shí)要對(duì)X2值作連續(xù)性校正。2、校正條件1≤T<5且n≥403.校正公式:X2=∑(五)四格表X2檢驗(yàn)的應(yīng)用條件1、當(dāng)n≧40且所有T≧5時(shí),用四格表X2檢驗(yàn);2、當(dāng)n≧40但有1≦T<5時(shí),用校正四格表X2檢驗(yàn);3、當(dāng)n<40或有T<1時(shí),不能用X2檢驗(yàn),改用確切概率法。注意:四格表X2檢驗(yàn)及前節(jié)兩樣本率比較的u檢驗(yàn)是等價(jià)的。若對(duì)同一資料同時(shí)作兩種檢驗(yàn),兩個(gè)統(tǒng)計(jì)量X2=u2,檢驗(yàn)的條件是一致的。五、配對(duì)四格表資料的X2檢驗(yàn)(一)配對(duì)四格表資料的特點(diǎn)(二)計(jì)算公式:當(dāng)b+c<40時(shí),(三)計(jì)算舉例a.建立假設(shè)H0:兩總體b=cH1:兩總體b≠cα=0.05b.計(jì)算X2值b=5c=10b+c<40=1.07c.查X2表確定P值首先確定自由度自由度=(行數(shù)-1)(列數(shù)-1)=(2-1)(2-1)=1然后查X2界值表X20.05,1=3.84X2=1.07<X20.05,1=3.84P>0.05d.推斷在α=0.05水準(zhǔn)上,不能拒絕H0,故尚不能認(rèn)為兩法檢查的效果不同。六、行×列表的X2檢驗(yàn)(一)用途:1、多個(gè)樣本率差異的比較2、多個(gè)樣本構(gòu)成比差異的比較3、雙向有序分類資料的關(guān)聯(lián)性檢驗(yàn)(二)計(jì)算公式:或(三)舉例1)多個(gè)樣本率差異的比較2)多個(gè)樣本構(gòu)成比差異的比較(四)行×列表的X2檢驗(yàn)的應(yīng)用注意事項(xiàng)1、不宜有理論數(shù)小于1,或1≤T<5格子數(shù)不超過總格子數(shù)的1/5★理論數(shù)太小的處理方法:(1)增加樣本的含量-常規(guī)方法(2)刪除理論數(shù)太小的行和列(3)合理合并理論數(shù)太小的行或列第(2)和第(3)種處理方法損失信息和損害隨機(jī)性,故不宜作為常規(guī)處理方法。2、當(dāng)三個(gè)及以上率(或構(gòu)成比)比較,結(jié)論拒絕H0時(shí),只能總的說有差別,但不能說明它們彼此間都有差別,或某兩者間有差別?!罱鉀Q此問題方法:X2分割法。第四章秩和檢驗(yàn)概述一、參數(shù)統(tǒng)計(jì)概念:在樣本來自的總體分布型已知的情況下,對(duì)總體參數(shù)進(jìn)行估計(jì)和檢驗(yàn)。二、非參數(shù)檢驗(yàn):1、含義:不依賴于總體分布型,不考慮資料屬于何種分布以及分布是否已知,比較的是分布而不是參數(shù)。這種檢驗(yàn)方法稱非參數(shù)檢驗(yàn)。2、優(yōu)點(diǎn):(1)適用范圍廣;(2)某些非參數(shù)方法計(jì)算簡便;(3)易于理解和掌握;(4)尤其適用于等級(jí)資料和開口資料;3、缺點(diǎn):適宜用參數(shù)方法的資料,用非參數(shù)方法處理,會(huì)損失信息,降低檢驗(yàn)效率。因?yàn)榉菂?shù)檢驗(yàn)犯Ⅱ型錯(cuò)誤概率β比參數(shù)檢驗(yàn)大。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年跨境電商知識(shí)產(chǎn)權(quán)保護(hù)合同規(guī)范2篇
- 2025版協(xié)議離婚辦理指南與離婚證獲取時(shí)效標(biāo)準(zhǔn)解讀3篇
- 2025版影視基地租賃合同匯編4篇
- 2025版司機(jī)雇傭服務(wù)質(zhì)量評(píng)價(jià)與獎(jiǎng)懲合同3篇
- 二零二五年度門面租賃合同環(huán)保要求與責(zé)任4篇
- 二零二五年度2025版國有企業(yè)設(shè)備租賃合同范本4篇
- 終止2025年度勞動(dòng)合同并規(guī)定經(jīng)濟(jì)補(bǔ)償辦法3篇
- 2025年度離婚后財(cái)產(chǎn)分配與債務(wù)承擔(dān)協(xié)議3篇
- 2025年消防防排煙系統(tǒng)施工與消防安全風(fēng)險(xiǎn)管理合同3篇
- 2024離婚后雙方權(quán)益保障與責(zé)任劃分合同
- 中國末端執(zhí)行器(靈巧手)行業(yè)市場發(fā)展態(tài)勢及前景戰(zhàn)略研判報(bào)告
- 北京離婚協(xié)議書(2篇)(2篇)
- Samsung三星SMARTCAMERANX2000(20-50mm)中文說明書200
- 2024年藥品質(zhì)量信息管理制度(2篇)
- 2024年安徽省高考地理試卷真題(含答案逐題解析)
- 廣東省廣州市2024年中考數(shù)學(xué)真題試卷(含答案)
- 無人機(jī)應(yīng)用平臺(tái)實(shí)施方案
- 2019年醫(yī)養(yǎng)結(jié)合項(xiàng)目商業(yè)計(jì)劃書
- 安全生產(chǎn)管理問題與對(duì)策探討
- 2024屆浙江寧波鎮(zhèn)海區(qū)中考生物全真模擬試題含解析
- 人教版八年級(jí)物理下冊 (功)教育教學(xué)課件
評(píng)論
0/150
提交評(píng)論