醫(yī)學(xué)統(tǒng)計(jì)學(xué)-總結(jié)-經(jīng)典_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)-總結(jié)-經(jīng)典_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)-總結(jié)-經(jīng)典_第3頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)-總結(jié)-經(jīng)典_第4頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)-總結(jié)-經(jīng)典_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

醫(yī)學(xué)統(tǒng)計(jì)學(xué)重點(diǎn)(2005級(jí)六年制)copyright@vivian.catPAGEPAGE6Chapter基本概念顯著性檢驗(yàn)(testofsignificance):計(jì)算P值醫(yī)學(xué)統(tǒng)計(jì)工作的內(nèi)容:1、實(shí)驗(yàn)設(shè)計(jì):最關(guān)鍵最重要2、收集資料:最基礎(chǔ)原始資料:實(shí)驗(yàn)數(shù)據(jù)現(xiàn)場調(diào)查資料醫(yī)療衛(wèi)生工作記錄報(bào)表報(bào)告卡質(zhì)量控制——精度和偏倚3、整理資料資料的邏輯檢查(壞數(shù))一致性檢查原始數(shù)據(jù)加工:頻數(shù)分布表4、分析資料:統(tǒng)計(jì)描述(表、圖、離散趨勢、集中趨勢)和統(tǒng)計(jì)推斷統(tǒng)計(jì)描述類型的選擇:集中趨勢離散趨勢對(duì)稱、正態(tài)μ,對(duì)數(shù)正態(tài)GSlgX偏態(tài)及其他MQ,R單位不同或均數(shù)差別大CV醫(yī)學(xué)統(tǒng)計(jì)的資料類型:計(jì)量資料、計(jì)數(shù)資料、等級(jí)分組資料醫(yī)學(xué)統(tǒng)計(jì)學(xué)的對(duì)象:有變異的事物總體和樣本:總體(population)的特性:同質(zhì)性、大量性、差異性。抽樣總體樣本抽樣總體樣本參數(shù)統(tǒng)計(jì)量推斷樣本的三性:代表性、隨機(jī)性、可靠性。可靠性(reliability):實(shí)驗(yàn)的結(jié)果要具有可重復(fù)性。即由科研課題的樣本得出的結(jié)論所推測總體的結(jié)論有較大的可信度。兩樣本間具有:可比性。誤差的類別:1、系統(tǒng)誤差(systemerror):在資料的收集過程中,由于儀器初始狀態(tài)沒有調(diào)零、標(biāo)準(zhǔn)試劑未經(jīng)矯正、標(biāo)準(zhǔn)指定偏高或偏低等原因,造成的觀察結(jié)果的傾向性的偏大或偏小。必須克服。2、隨機(jī)測量誤差(randommeasurementerror):在避免系統(tǒng)誤差的情況下,由于各種偶然因素的影響造成對(duì)同一對(duì)象多次測量值的不一致。3、抽樣誤差(samplingerror):由于抽樣造成的的樣本統(tǒng)計(jì)量與總體參數(shù)之間的差別。不可避免。樣本含量越大,抽樣誤差越小。如均數(shù)的抽樣誤差:。概率(probability):P(A)小概率事件:P≤0.05(有統(tǒng)計(jì)學(xué)意義)或P≥0.01(有高度統(tǒng)計(jì)學(xué)意義)。Chapter集中趨勢的統(tǒng)計(jì)描述手工整理資料頻數(shù)表(frequencytable)的步驟:1、求極差(全距)2、確定組數(shù)、組距參考組距=全距/組數(shù)3、確定組段4、手工編制劃記表直方圖(histogram):高度:各組的頻數(shù)縱軸寬度:組距橫軸表示組限均數(shù)(average):適用:對(duì)稱分布或偏度不大的資料,尤其適合正態(tài)分布。1、算術(shù)均數(shù)(mean):2、加權(quán)均數(shù):3、幾何均數(shù):,中位數(shù)(median):觀察值按照從小到大排列時(shí),居中心位置的數(shù)值。適用于1、分布明顯成偏態(tài)時(shí),2、頻數(shù)分布的一端或兩端無確切數(shù)值時(shí)。不便于統(tǒng)計(jì)計(jì)算。M:中位數(shù);LM:M所在組的上限;fL:M所在組之前積累的頻數(shù);fM:M所在組的頻數(shù);i:組距。百分位數(shù)(percentile):Px。在一組中找到這樣一個(gè)數(shù)值P,全部觀察值的x%小于P。P75、P25描述資料離散程度。眾數(shù):一組觀察值中,出現(xiàn)頻率最高的那個(gè)觀察值。若為分組資料,則為頻率最高組的組中值。適用于大樣本,但粗糙。Chapter離散程度的統(tǒng)計(jì)描述離散的表述指標(biāo):1、按間距計(jì)算:極差、四分位數(shù)間距2、按平均差距:離均差平方和、方差、標(biāo)準(zhǔn)差、變異系數(shù)極差(range,R):即全距。粗略。適用于任何分布。四分位數(shù)間距(quartile,Q):一組觀察值按大小排序后,分成四個(gè)數(shù)目相等的段落,每個(gè)段落觀察值的數(shù)目占總例數(shù)的25%。去掉兩端含有極端數(shù)值的25%,取中間的50%的觀察值的數(shù)據(jù)范圍即為~。越大則數(shù)據(jù)變異越大。適用于偏態(tài)分布。Q=P75-P25離均差平方和(sumofsquareofdeviation):方差(variance):樣本方差總體方差標(biāo)準(zhǔn)差(standarddeviations):適用于近似正態(tài)分布。p.s.1、可用于合并資料的直接計(jì)算2、與均數(shù)結(jié)合可以完整概括一個(gè)正態(tài)分布。變異系數(shù)(CV):用于均屬相差交大或單位不同的幾組數(shù)據(jù)觀察值的比較。CV=正態(tài)分布(normaldistribution):1、正偏態(tài)分布:高峰向左,長尾向右負(fù)偏態(tài)分布:高峰向右,長尾向左。2、μ和σ是正態(tài)分布總體的兩個(gè)參數(shù),對(duì)應(yīng)樣本統(tǒng)計(jì)量中的S和X。實(shí)際應(yīng)用中μ和σ通常未知,可以將S和X作為總體參數(shù)的估計(jì)量使用。注意對(duì)比:2、μ是位置參數(shù),σ是變異參數(shù)。描述方法:N(μ,σ2)3、曲線下面積的意義:X1~X2出現(xiàn)的概率。μ±σ68.3%μ±1.96σ(單側(cè)μ±1.645σ)95%μ±2.58σ(單側(cè)μ±2.33σ)99%標(biāo)準(zhǔn)正態(tài)分布(standard~):是μ=0,σ=1的正態(tài)分布。對(duì)于任何參數(shù)為μ、σ的正態(tài)分布,都可以通過變量變換轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)分布:。醫(yī)學(xué)參考值范圍(referencevaluerange)的制定方法:1、選擇足夠數(shù)量的正常人作為參照樣本2、對(duì)選定的參照樣本進(jìn)行準(zhǔn)確的測定3、決定取單側(cè)范圍還是雙側(cè)范圍值4、選擇適當(dāng)?shù)陌俜址秶?、估計(jì)參考值范圍的界限Chapter抽樣誤差與可信區(qū)間中心極限定理:在樣本含量很大的情況下(n≥50),無論樣本測量量(X)服從什么分布,樣本均數(shù)的抽樣分布都近似服從以μ為均數(shù)的正態(tài)分布N(μ,σ2/n)標(biāo)準(zhǔn)誤(standarderror):樣本均數(shù)之間變異的標(biāo)準(zhǔn)差。實(shí)際工作中總體標(biāo)準(zhǔn)差σ未知,,用樣本的標(biāo)準(zhǔn)差S代替:標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別:標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤含義描述觀察值的變異程度的大小的指標(biāo)描述樣本均數(shù)的抽樣誤差大小的指標(biāo)公式()意義標(biāo)準(zhǔn)差較小,表示觀察值圍繞均數(shù)波動(dòng)較小,說明樣本均數(shù)代表性好小,表明樣本均數(shù)圍繞總體均數(shù)的波動(dòng)較小,說明樣本均數(shù)可靠性好應(yīng)用1、表示觀察值變異程度2、結(jié)合樣本均數(shù)描述正態(tài)分布資料特征,確定醫(yī)學(xué)參考值范圍3、計(jì)算標(biāo)準(zhǔn)誤4、計(jì)算CV1、估計(jì)樣本均數(shù)抽樣可靠程度2、估計(jì)總體均數(shù)的可信區(qū)間3、進(jìn)行假設(shè)檢驗(yàn)n↑趨于穩(wěn)定(σ)逐漸減小標(biāo)準(zhǔn)誤(公式)的意義:1、與標(biāo)準(zhǔn)差的聯(lián)系:在樣本含量一定的情況下,標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比。當(dāng)觀察值的變異(標(biāo)準(zhǔn)差)較小時(shí),樣本均數(shù)之間的抽樣誤差較小,抽到的樣本均數(shù)與總體均屬可能相差較小,用估計(jì)μ的可靠性較好當(dāng)觀察值的變異較大時(shí),樣本均數(shù)之間的抽樣誤差較大,抽到的樣本均數(shù)與總體均屬可能相差較大,用估計(jì)μ的可靠性較差。2、與樣本含量的關(guān)系:與其平方根成反比,說明在同一總體中隨機(jī)抽樣,樣本含量越大,標(biāo)準(zhǔn)誤越小。3、標(biāo)準(zhǔn)誤反映了樣本均數(shù)間的離散程度,也反映了樣本均數(shù)與總體均數(shù)的差異。參數(shù)估計(jì)(parameterestimation):指偶那個(gè)過樣本參數(shù)估計(jì)總體參數(shù),是統(tǒng)計(jì)推斷的重要內(nèi)容之一。常用方法有點(diǎn)估計(jì)、區(qū)間估計(jì)。點(diǎn)估計(jì)(point~):使用單一數(shù)值直接作為總體參數(shù)的估計(jì)值。適用于各種資料。區(qū)間估計(jì)(interval~):按照預(yù)先給定的概率計(jì)算出一個(gè)區(qū)間,使它能夠包含總體參數(shù)。給定的概率(1-α)稱為可信度。計(jì)算得到的區(qū)間稱為可信區(qū)間(confidenceinterval,CI)可信區(qū)間通常包括兩個(gè)數(shù)值界定的可信限(confidencelimit),分別為上限、下限。總體均數(shù)估計(jì)的95%可信區(qū)間表示:該區(qū)間有95%的概率包含總體均數(shù)μ。注意不可以說“總體均數(shù)有95%的概率落在這個(gè)區(qū)間里”??尚艆^(qū)間估計(jì)效果的比較:1、(1-α)越接近1越好,概率↑2、區(qū)間寬度越窄越好,精確度↑但兩者是矛盾的。一般選擇(1-α)=95%。t分布(tdistribution):是以0為中心的對(duì)稱分布;當(dāng)時(shí),t分布的極限分布就是標(biāo)準(zhǔn)正態(tài)分布。在正態(tài)分布的總體中進(jìn)行抽樣,服從自由度的t分布。t的大小與α、自由度有關(guān)??尚艆^(qū)間的計(jì)算:,若n≥50,則t分布接近標(biāo)準(zhǔn)正態(tài)分布,則簡化,若σ已知,則可簡化為,,Chapter假設(shè)檢驗(yàn)假設(shè)檢驗(yàn)(hypothesistest):目的:比較總體參數(shù)有無差別基本思想:首先對(duì)所需比較的總體提出一個(gè)無差別的假設(shè),然后通過樣本數(shù)據(jù)推斷是否拒絕這一假設(shè)。基本方法:反證法和小概率事件?;静襟E:1、建立假設(shè)和確定檢驗(yàn)水準(zhǔn)無效假設(shè)(nullhypothesis):H0:μ=μ0(或μd=0),總體均數(shù)無差別。備擇假設(shè)(alternative~):H0:μ≠μ0(或μd≠0),總體均數(shù)有差別假設(shè)有單側(cè)和雙側(cè)兩種。應(yīng)用單側(cè)檢驗(yàn)一定要有過硬的專業(yè)知識(shí)。一般選用雙側(cè)檢驗(yàn),因?yàn)殡p側(cè)檢驗(yàn)得出有顯著差別的結(jié)論,單側(cè)檢驗(yàn)結(jié)論也一定是顯著差別;然而反之不亦然。檢驗(yàn)水準(zhǔn)亦稱顯著性水準(zhǔn)(significancelevel),用α表示,是預(yù)先設(shè)定的拒絕域的概率值。一般取0.05。2、選擇檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量t來自正態(tài)分布(或近似)的小樣本(n<50)u1、無論何種分布的大樣本(n≥50時(shí))2、σ已知的正態(tài)分布小樣本F方差分析1、獨(dú)立的,水平k≥32、均來自于正態(tài)分布的總體3、方差齊推斷2個(gè)或2個(gè)以上總體率、構(gòu)成比之間的差別非參1、總體分布偏態(tài)或未知2、個(gè)別數(shù)據(jù)偏大或某段不確定3、等級(jí)資料3、確定P值、做出統(tǒng)計(jì)推斷結(jié)論P(yáng)值的意義:假設(shè)檢驗(yàn)下結(jié)論的主要依據(jù),指在原假設(shè)成立的條件下,觀察到的樣本差別是由機(jī)遇所致的概率。結(jié)論:1、p<α,樣本數(shù)據(jù)差異顯著,有統(tǒng)計(jì)學(xué)意義,拒絕H0,接受H12、P>α,樣本數(shù)據(jù)差異不顯著,無統(tǒng)計(jì)學(xué)意義,根據(jù)現(xiàn)有樣本不足以拒絕H0(不等于接受H0)。單樣本的t檢驗(yàn):條件:μ,,S,n1、H0:μ=μ0,α=0.05,雙側(cè)檢驗(yàn)2、t=,3、配對(duì)樣本t檢驗(yàn):條件:n,指標(biāo)1、指標(biāo)2(d,∑d,∑d2)1、H0:μd=0,α=0.052、t=3、成組設(shè)計(jì)實(shí)驗(yàn)的兩樣本均數(shù)比較條件:n1,n2,1,2,S1,S21、H0:μ1=μ2,2、u=3、,F(xiàn)檢驗(yàn):條件:表格略1、H0:各組總體均數(shù)相同,H1:各組總體均數(shù)不全相同2、,vTR=k-1,vE=n-k3、F符合自由度為(k-1,n-k)的F分布。F值接近1,則可認(rèn)為均值只來源于隨機(jī)波動(dòng)。若F>1,且F>Fα,(k-1,n-k),則P<α,……。假設(shè)檢驗(yàn)中的兩類錯(cuò)誤:1、第一類錯(cuò)誤:當(dāng)H0為真時(shí),拒絕H0接受H1。又稱假陽性錯(cuò)誤(陽性指兩者總體參數(shù)有差異)。檢驗(yàn)水準(zhǔn)α是預(yù)先規(guī)定的犯第一類錯(cuò)誤的概率的最大值。2、第二類錯(cuò)誤:當(dāng)H0為假時(shí),不拒絕H0。又稱假陰性錯(cuò)誤。概率大小用β表示,只取單側(cè),一般未知??勺C,α越大β越小,α越小β越越大。若要同時(shí)減少第一類錯(cuò)誤和第二類錯(cuò)誤,唯一方法是增大樣本含量。

簡單四格表的檢驗(yàn):有效無效合計(jì)藥物1aba+b=n1藥物2cdc+d=n0合計(jì)a+c=m1b+d=m0N1、H0:,α=0.052、當(dāng)n≥40,且所有T≥5時(shí),四格表專用公式當(dāng)n≥40,但有1<T≤5時(shí),使用四格表校正公式當(dāng)n≤40,或有T≤1時(shí),使用Fisher確切概率公式3、=3.84,=6.63配對(duì)四格表檢驗(yàn):對(duì)照組病例組合計(jì)有暴露史無暴露史有暴露史aba+b=n1無暴露史cdc+d=n0合計(jì)a+c=m1b+d=m0N1、H0:,α=0.052、,當(dāng)b+c≥40時(shí),當(dāng)b+c<40時(shí),3、=3.84,=6.63行*列資料的檢驗(yàn):有效無效合計(jì)藥物1abn1藥物2cdn2藥物3efn3合計(jì)m1m2N1、

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論