版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
-.z.醫(yī)學統(tǒng)計學總結一.緒論1,醫(yī)學統(tǒng)計學:運用概率論和數(shù)理統(tǒng)計學的原理和方法,研究醫(yī)學領域中隨機現(xiàn)象有關數(shù)據(jù)的搜集、整理、分析和推斷,進而說明其客觀規(guī)律性的一門應用科學。2,醫(yī)學統(tǒng)計學的主要內(nèi)容:1〕統(tǒng)計研究設計調查研究設計和實驗研究設計2〕醫(yī)學統(tǒng)計學的根本原理和方法研究設計和數(shù)據(jù)處理中的根本統(tǒng)計理論和方法。A:資料的搜集與整理B:常用統(tǒng)計描述,集中趨勢和離散趨勢,相對數(shù),相關系數(shù),回歸系數(shù),統(tǒng)計表,統(tǒng)計圖C:統(tǒng)計推斷,如參數(shù)估計和假設檢驗。3〕醫(yī)學多元統(tǒng)計方法多元線性回歸和逐步回歸分析、判別分析、聚類分析、主成分分析、因子分析、logistic回歸與Co*回歸分析。3,統(tǒng)計工作步驟:1〕設計明確研究目的和研究假說,確定觀察對象與觀察單位,樣本含量和抽樣方法,擬定研究方案,預期分析指標,誤差控制措施,進度與費用。2〕搜集材料A,搜集材料的原則及時、準確、完整B,統(tǒng)計資料的來源醫(yī)學領域的統(tǒng)計資料的來源主要有三個方面。一是統(tǒng)計報表,二是經(jīng)常性工作記錄,三是專題調查或專題實驗。C,資料貯存3〕整理資料a檢查核對b設計分組c擬定整理表d歸表4〕分析資料統(tǒng)計分析包括統(tǒng)計描述和統(tǒng)計推斷4,同質〔homogeneity〕:指被研究指標的影響因素一樣。變異(variation):同質根底上的各觀察單位間的差異。變量(variable):收集資料過程中,根據(jù)研究目確實定同質觀察單位,再對每個觀察單位的*項特征進展測量或觀察,這種特征稱為變量變量值:變量的觀察結果或測量值。變量類型變量值表現(xiàn)實例資料類型數(shù)值變量離散型定量測量值,有計量單位產(chǎn)前檢查次數(shù)計量資料連續(xù)型身高分類變量無序二分類對立的兩類屬性性別〔男女〕計數(shù)資料多分類不相容的多類屬性血型〔A,B,O,AB〕有序多分類類間有程度差異的屬性受教育程度〔小學,中學,高中,大學…〕等級資料5,總體〔population〕根據(jù)研究目的所確定的同質研究對象中所有觀察單位*變量值的集合??傮w具有的根本特征是:同質性樣本〔sample〕從總體中隨機抽取局部觀察單位,其變量值的集合構成樣本。樣本必須具有代表性。代表性是指樣本來自同質總體,足夠的樣本含量和隨機抽樣的前提。統(tǒng)計量〔statistics〕描述樣本變量值特征的指標〔樣本率,樣本均數(shù),樣本標準差〕。參數(shù)〔parameter〕描述總體變量值特征的指標〔總體率,標準差,總體均數(shù)〕。抽樣誤差〔samplingerror〕:由于個體差異的存在,即使在同一整體中隨機抽取假設干樣本,各樣本的統(tǒng)計量往往不等,統(tǒng)計量與參數(shù)也會有所不同。這種因抽樣研究引起的差異稱抽樣誤差。隨機事件〔randomevent〕對隨機試驗的各種可能結果的集合。概率〔probability〕描述隨機事件發(fā)生的可能性大些哦的一個度量。小概率事件假設隨機事件A的概率P〔A〕≤α,習慣上,α=0.05時,就稱A為小概率事件。其統(tǒng)計學意義是小概率事件在一次隨機試驗中認為不會發(fā)生。抽樣誤差1,抽樣誤差〔samplingerror〕由抽樣而造成的樣本統(tǒng)計量與總體參數(shù)之間的差異或各樣本統(tǒng)計量之間的差異。在醫(yī)學統(tǒng)計學中,常把由抽樣造成的樣本均數(shù)與總體均數(shù)間的差異稱為均數(shù)的抽樣誤差;由抽樣造成的樣本率與總體率之間的差異稱為率的抽樣誤差。2,樣本均數(shù)的標準差〔簡稱標準誤,standarderror〕反映均數(shù)的抽樣誤差大小的指標。大,抽樣誤差大;反之,小,抽樣誤差小?!?.1〕實際工作中往往未知的,可用樣本標準差s作的估計值,計算標準誤的估計值?!?.2〕3,標準誤的用途:a,衡量樣本均數(shù)的可靠性;b,估計總體均數(shù)的置信區(qū)間;3,用于均數(shù)的假設檢驗。4,標準誤的估計值的用途:a,描述抽樣誤差的大??;b,總體參數(shù)的估計;c,用來進展假設檢驗。5,率的抽樣誤差:由抽樣造成的樣本率與總體率的差異稱為率的抽樣誤差。衡量率的抽樣誤差大小的指標是率的標準誤。越小,率的抽樣誤差越?。辉酱?,率的抽樣誤差越大。〔3.3〕其中為總體率。實際工作中,由于往往是未知的,可用樣本率p作的估計值,計算率的標準誤的估計值?!?.4〕。標準差〔s〕標準誤計算公式s=〔1〕表示觀察值的變異程度〔1〕估計均數(shù)的抽樣誤差的大小〔2〕計算變異系數(shù)CV=100%〔2〕估計總體均數(shù)的可信區(qū)間〔,〕〔3〕確定醫(yī)學參考值范圍〔3〕進展假設檢驗〔4〕計算標準誤簡述標準差、標準誤的區(qū)別與聯(lián)系?區(qū)別:〔1〕含義不同:標準差S表示觀察值的變異程度,描述個體變量值〔*〕之間的變異度大小,S越大,變量值〔*〕越分散;反之變量值越集中,均數(shù)的代表性越強。標準誤估計均數(shù)的抽樣誤差的大小,是描述樣本均數(shù)之間的變異度大小,標準誤越大,樣本均數(shù)與總體均數(shù)間差異越大,抽樣誤差越大;反之,樣本均數(shù)越接近總體均數(shù),抽樣誤差越小?!?〕與n的關系不同:n增大時,S趨于σ〔恒定〕,標準誤減少并趨于0〔不存在抽樣誤差〕?!?〕用途不同:標準差表示*的變異度大小、計算變異系數(shù)、確定醫(yī)學參考值范圍、計算標準誤等,標準誤用于估計總體均數(shù)可信區(qū)間和假設檢驗。聯(lián)系:二者均為變異度指標,樣本均數(shù)的標準差即為標準誤,標準差與標準誤成正比。標準差:標準誤:二.分布正態(tài)分布1,正態(tài)分布的函數(shù)其中為總體均數(shù),為總體標準差,為圓周率,為自然對數(shù)的底,且僅為變量。以為橫軸,以為縱軸,當均數(shù)和標準差時即可繪出正態(tài)分布曲線。為應用方便,將式中進展變量變換,使原來的正態(tài)分布變?yōu)榈臉藴收龖B(tài)分布,亦稱分布。被稱為標準正態(tài)變量或標準正態(tài)離差,將代入上述公式即得標準正態(tài)分布的密度函數(shù)?!?.17〕〔2.18〕2,正態(tài)分布的特征〔1〕正態(tài)曲線〔normalcurve〕在橫軸上方均數(shù)處最高?!?〕正態(tài)分布以均數(shù)為中心,左右對稱?!?〕正態(tài)分布有2個參數(shù)〔parameter〕,即均數(shù)〔位置〕和標準差〔形狀〕。當固定不變時,越大,曲線沿橫軸越向右移動;反之,越小,則曲線沿橫軸越向左移動。當固定不變時,越大,曲線越平闊;越小,曲線越尖峭。通常用N〔,〕表示均數(shù)為、方差為的正態(tài)分布。用〔0,1〕表示標準正態(tài)分布?!?〕正態(tài)分布在1處各有一個拐點?!?〕正態(tài)曲線下面積的分布有一定規(guī)律。3,常用的兩個區(qū)間:1.96及2.58的區(qū)間面積分別占總面積的95%及99%。4,正態(tài)分布的應用1〕,制定醫(yī)學參考值范圍a,正態(tài)分布法適用于正態(tài)或近似正態(tài)分布的資料雙側界值:;單側上界:,或單側下界:。b,對數(shù)正態(tài)分布法適用于對數(shù)正態(tài)分布資料雙側界值:;單側上界:,或單側下界c,百分位數(shù)法常用于偏態(tài)分布資料及資料中一端或兩端無確切數(shù)值的資料。雙側界值:和;單側上界:,或單側下界:。2〕正態(tài)分布是多種統(tǒng)計方法的理論根底如t分布,F(xiàn)分布,分布都是在正態(tài)分布的根底上推導出來的,分布也是以正態(tài)分布為根底的。另外t分布,二項分布,poisson分布的極限為正態(tài)分布,一定條件下可按正態(tài)分布原理處理。t分布1,t分布:〔3.5〕t分布的特征為:1.以0為中心,左右對稱的單峰分布。2.t分布曲線形態(tài)變化與自由度的大小有關。自由度越小,則t值越分散,曲線越低平;自由度逐漸增大時,則t分布逐漸逼近正態(tài)分布〔標準正態(tài)分布〕。當=時,t分布為u分布。t界值表附圖中非陰影局部面積的概率為:2,總體均數(shù)的估計:用樣本指標估計總體參數(shù)稱為參數(shù)估計,是統(tǒng)計推斷的一個重要方面??傮w均數(shù)的估計有2種方法。一是直接用統(tǒng)計量估計總體參數(shù),稱為點值估計。由于抽樣誤差的存在,此法很難估計準確。二是區(qū)間估計〔intervalestimation〕法。區(qū)間估計是按一定的概率100〔1-〕%估計總體均數(shù)所在的范圍,亦稱可信區(qū)間〔confidenceinterval,CI〕。常取的可信度為95%和99%,即95%可信區(qū)間和99%可信區(qū)間。計算方法有3種:〔1〕未知且n小按t分布原理用式〔3.6〕計算可信區(qū)間。由于將代入,得則總體均數(shù)的100〔1-〕%可信區(qū)間的通式為:〔3.6〕或寫成〔,〕?!?〕未知,但n足夠大時〔n>100〕t分布逼近u分布,按正態(tài)分布原理,用式〔3.7〕估計可信區(qū)間?!病场?.7〕〔3〕按正態(tài)分布原理,用式〔3.8〕估計可信區(qū)間?!病场?.8〕標準正態(tài)分布〔u分布〕與t分布有何異同?答:一樣點:t分布和標準正態(tài)分布〔u分布〕都是以0為中心的正態(tài)分布。標準正態(tài)分布是t分布的特例〔自由度是無限大時〕。不同點:t分布為抽樣分布,u分布為理論分布;t分布比標準正態(tài)分布的峰值低,且尾部翹得更高;t分布受自由度大小的影響,隨著自由度的增大,逐漸趨近于標準正態(tài)分布;t分布有無數(shù)條曲線,而u分布只有唯一一條曲線。二項分布1,二項分布〔binomialdistribution〕是對只具有2種互斥結果的離散型隨機事件的規(guī)律性進展描述的一種概率分布。二項分布概率公式:〔3.9〕式中n為獨立的貝努力試驗次數(shù),為成功的概率,〔1-〕為失敗的概率,*為在n次貝努力試驗中出現(xiàn)"成功〞的次數(shù),表示在n次試驗中出現(xiàn)*的各種組合數(shù),在此稱為二項系數(shù)〔binomialcoefficient〕。2,二項分布的應用條件:〔1〕各觀察單位只能具有相互對立的一種結果,如陽性或陰性,生存或死亡?!?〕發(fā)生*一結果〔陽性〕的概率為,其對立結果的概率為1-,實際工作中要求是從大量觀察中獲得比擬穩(wěn)定的數(shù)值?!?〕n次試驗在一樣條件下進展,且各個觀察單位的觀察結果相互獨立。3,二項分布的性質:A,二項分布的均數(shù)和標準差在二項分布的資料中,當和n時,它的均數(shù)及其標準差如下:=n〔3.11〕〔3.12〕假設均數(shù)和標準差不用絕對數(shù)表示,而是用率表示時,即對式〔3.11〕〔3.12〕分別除以n,得:〔3.13〕〔3.14〕是樣本率的標準誤的理論值,當未知時,常用樣本率p作為的估計值,則:〔3.15〕B,二項分布的累計概率二項分布的累計概率〔cumulativeprobability〕常用的有左側累計和右側累計2種方法。從陽性率為的總體中隨機抽取n個個體,則〔1〕最多有k例陽性的概率〔3.16〕〔2〕最少有k例陽性的概率〔3.17〕D,二項分布的形狀取決于和n的大?。骸?〕當=0.5時,分布對稱;當<0.5時,分布呈正偏態(tài),且固定n時,越小,分布越偏;當>0.5時,分布呈負偏態(tài),且固定n時,越大,分布越偏。〔2〕對固定的,分布隨n的增大趨于對稱。4,總體率的估計總體率的估計也有點估計和區(qū)間估計,點估計是簡單地用樣本率來估計總體率;區(qū)間估計是求出總體率的可能范圍。樣本率的理論分布和樣本含量n、陽性率p的大小有關,所以需要根據(jù)n和p的大小不同,分別選用以下2種方法。〔一〕查表法當樣本含量n較小,如n≤50,特別是p很接近于0或1時,按二項分布的原理估計總體率的可信區(qū)間?!捕痴龖B(tài)近似法當樣本含量n足夠大,且樣本率p或1-p均不太小,如np與n〔1-p〕均大于5時,樣本率的p的抽樣分布近似正態(tài)分布,總體率的可信區(qū)間可按以下式〔3.17〕進展估計?!?.17〕Poisson分布1,Poisson分布泊松分布是在很小,樣本含量n趨向于無窮大時,二項分布的極限形式。更多地用于研究單位時間、單位人群、單位空間內(nèi),*罕見事件發(fā)生的次數(shù)的分布。*=0,1,2〔3.19〕式中=n為Poisson分布的總體均數(shù),*為單位時間或單位空間內(nèi)*事件的發(fā)生數(shù),e為自然對數(shù)的底,約等于2.71828。在實際運算中,P〔*〕亦可按式〔3.20〕作遞推計算。(3.20)2,Poisson分布應用條件:A,要求事件的發(fā)生是相互獨立B,發(fā)生的概率相等C,結果是二分類3,Poisson分布的性質:A,該分布是一種單參數(shù)的離散型分布,其參數(shù)為,它表示單位時間或空間內(nèi)*件事平均發(fā)生的次數(shù),又稱強度參數(shù)。B,Poisson分布的方差和均數(shù)相等,即=C,Poisson分布的累計概率〔1〕最多為k次的概率〔2〕最少為k次的概率4,Poisson分布的圖形,就可按公式計算得出*=0,1,2,時的P〔*〕值,以*為橫坐標,以P(*)為縱坐標作圖,即可會出Poisson分布的圖形。值越小,分布越偏,隨著的增大,分布越趨于對稱,當=20時,分布接近正態(tài)分布,當=50時,可以認為Poisson分布呈正態(tài)分布N(,)按正態(tài)分布處理。5,Poisson分布具有可加性6,總體參數(shù)的估計由樣本均數(shù)〔樣本計數(shù)〕*估計總體均數(shù)也有點〔值〕估計和區(qū)間估計,區(qū)間估計的方法,需視樣本計數(shù)〔樣本均數(shù)〕*的大小而定,*小時用查表法,*大時用正態(tài)近似法?!惨弧巢楸矸ó敇颖居嫈?shù)*時,用*值查附表poisson分布的可信區(qū)間,可得總體均數(shù)的95%或99%可信區(qū)間?!捕痴龖B(tài)近似法當樣本計數(shù)*>50時,可用正態(tài)近似原理下面公式求總體均數(shù)的95%或99%可信區(qū)間正態(tài)分布、二項式和泊松分布的關系:二項分布〔binomialdistribution〕:對只具有兩種互斥結果的離散型隨機事件的規(guī)律性進展描述的一種概率分布。Poisson分布是在π很小,樣本含量n趨于無窮大時,二項分布的極限形式。當v=∞時,t分布即為u分布,趨向正態(tài)分布??尚艆^(qū)間與參考值范圍的區(qū)別:意義、計算公式和用途均不同。〔1〕參考值范圍是指同質總體內(nèi)包括百分之幾十個體值的估計范圍。而可信區(qū)間是指在百分之幾十的可信度估計的總體參數(shù)的所在范圍?!?〕同樣的百分之幾十,參考值范圍是樣本范圍,可信區(qū)間是指可信度范圍,二者有著本質的不同。〔3〕從意義來看,95%參考值范圍是指同質總體內(nèi)包括95%個體值的估計范圍,而總體均數(shù)95%可信區(qū)間是指按95%可信度估計的總體均數(shù)的所在范圍?!?〕從計算公式看,假設指標服從正態(tài)分布,95%參考值范圍的公式是:±1.96s。總體均數(shù)95%可信區(qū)間的公式是:。前者用標準差,后者用標準誤。前者用1.96,后者用α為0.05,自由度為v的t界值。〔5〕從用途上看,可信區(qū)間用來估計總體均數(shù),參考值范圍用來判斷觀察對象的*項指標是否正常。簡述檢驗假設與可信區(qū)間的聯(lián)系與區(qū)別。答:〔1〕可信區(qū)間用于推斷總體參數(shù)所在的范圍,假設檢驗用于推斷總體參數(shù)是否不同。前者估計總體參數(shù)的大小,后者推斷總體參數(shù)有無質的不同。〔2〕可信區(qū)間也可答復假設檢驗的問題。但可信區(qū)間不能提供確切的P值范圍,只能給出在α水準上有無統(tǒng)計意義?!?〕可信區(qū)間還可提示差異有無實際意義。統(tǒng)計圖表1,繪制統(tǒng)計圖的根本要求:A,根據(jù)資料性質和分析目的據(jù)頂適當圖形。B,標題應說明資料的內(nèi)容、時間和地點,一般位于圖的下方。C,圖的縱、橫軸應注明標目及對應單位,尺度應等距或具有規(guī)律性,一般自左而右、自下而上、由小到大。D,為使圖形美觀并便于比擬,統(tǒng)計圖的長寬比例一般為7:5,有時為了說明問題也可以變動。E,比擬、說明不同的事物時,可用不同顏色或線條表示,并常附圖例說明,但不宜過多。2,常用統(tǒng)計圖的適用條件與繪制1.條圖〔bargraph〕用等寬長條的高度表示按性質分類資料各類別的數(shù)值大小,用于表示它們之間的比照關系。2.圓圖〔piegraph〕圓形圖適用于百分構成比資料,表示事物各組成局部所占的比重或構成。3.百分條圖〔percentbar〕意義及適用資料同圓圖,也稱構成條圖。4.線圖〔linegraph〕線圖適用于連續(xù)性資料,以不同的線段升降來表示資料的變化,并可說明一事物隨另一食物〔時間〕而變動的情況。5.直方圖〔histogram〕直方圖用于表達連續(xù)性資料的頻數(shù)分布。6.散點圖〔scatterdiagram〕散點圖以直角坐標系中各點的密集程度和趨勢來表示兩現(xiàn)象間的關系。常用在對資料進展相關分析之前適用。單變量資料一,數(shù)值變量統(tǒng)計描述1,頻數(shù)表的編制求全距定組段和組距列頻數(shù)表畫頻數(shù)圖2,頻數(shù)分布的兩個重要特征:集中趨勢和離散趨勢3,頻數(shù)分布可以分為正態(tài)分布和偏態(tài)分布4,頻數(shù)表的用途:提醒資料分布類型和分布特征,以便選取適當?shù)慕y(tǒng)計方法;便于進一步計算指標和統(tǒng)計處理;便于發(fā)現(xiàn)*些特大或者特小的可疑值。5,集中趨勢的描述:均數(shù)幾何均數(shù)中位數(shù)百分位數(shù)6,均數(shù)(mean):算術均數(shù)的簡稱。常用==表示。7,中位數(shù)(median):一組由小到大按順序排列的觀察值中位次居中的數(shù)值,用M表示。可用于描述任何分布,特別是偏態(tài)分布資料以及頻數(shù)分布的一端或兩端無確切數(shù)據(jù)資料的中心位置。8,百分位數(shù)(percentile)是一種位置指標,用表示。一個百分位數(shù)P將一組觀察值分為兩局部,理論上有*%的觀察值比它小,有〔100-*〕%的觀察值比它大。可用于確定非正態(tài)分布資料的醫(yī)學參考值范圍。9,離散趨勢的描述:全距〔range〕四分位數(shù)間距〔quartile〕方差標準差10,全距〔range〕亦稱極差,為一組同質觀察值中最大值和最小值之差。反映個體差異的范圍,優(yōu)點是計算簡單,缺點是:1〕只考慮最大最小值之間的差異,不能反映組內(nèi)其他觀察值的變異度;2〕樣本含量相差懸殊時不宜用全距比擬。11,四分位數(shù)間距〔quartile〕上四分位數(shù)與下四分位數(shù)之差。常用于描述偏態(tài)頻數(shù)分布以及分布的一端或兩端無確切數(shù)值資料的離散程度。12,方差〔variance〕離均差的平方和表示。13,標準差〔standardvariance〕的作用:a,估計變量值的離散程度b,計算變異系數(shù)c,與均數(shù)結合,估計變異值的頻數(shù)分布范圍d,計算標準誤(總體)s=〔樣本〕14,變異系數(shù)〔coefficientofvariation〕常用于比擬度量單位不同或均數(shù)相差懸殊的兩組或多組資料的變異度。CV=100%假設檢驗1,假設檢驗〔hypothesistest〕亦稱顯著性檢驗〔significancetest〕,其根本思想是先對總體的參數(shù)或分布做出*種假設,如設總體均數(shù)〔或率〕為一定值;兩總體均數(shù)〔或率〕相等;總體服從正態(tài)分布或兩分布一樣等,然后根據(jù)樣本信息選用適當?shù)姆椒?,推斷此假設應當拒絕或不拒絕。2,假設檢驗的一般步驟:〔1〕建立假設和確定檢驗水準:根據(jù)實際情況確定單、雙側檢驗,建立假設,確定檢驗水準;〔2〕選定檢驗方法和計算統(tǒng)計量:根據(jù)設計的類型及研究目的選擇適宜的檢驗方法并計算出對應的統(tǒng)計量;〔3〕確定P值并做出推斷結論。假設t≥tα,v,則P≤α,按檢驗水準,拒絕H0,承受H1,尚可認為差異顯著有統(tǒng)計學意義;相反則差異不顯著,無統(tǒng)計學意義3,假設檢驗時應注意的事項:〔1〕要有嚴密的抽樣研究設計;樣本必須是從同質總體中隨機抽取的,要保證組間的均衡性和資料的可比性,可能影響結果的非處理因素在比照組間應盡可能一樣或相近;〔2〕正確選擇檢驗方法;根據(jù)現(xiàn)有的資料類型、設計類型、分析目的、樣本含量等因素選用適當?shù)臋z驗方法,如不符合條件可做適當轉換;〔3〕正確理解"差異無顯著性〞的含義,差異有統(tǒng)計學意義,不能理解為兩者差差大,也不能理解為所分析的指標在實際應用上就有"顯著效果〞?!?〕檢驗假設的推斷結論為概率結論,不能絕對化:檢驗水準人為規(guī)定,是相對的,報告結論時應列出檢驗統(tǒng)計量和P值確實切范圍。〔5〕注意是單側檢驗還是雙側檢驗I型錯誤和II型錯誤:I型錯誤〔typeIerror〕拒絕了實際上成立的,即樣本原本來自的總體,由于抽樣的偶然性得到了較大的t值,所以拒絕了,承受了,這類棄真錯誤稱為第一類錯誤,犯第一類錯誤的概率是。II型錯誤〔typeIIerror〕是不拒絕實際上不成立的,即"存?zhèn)唯暭礃颖驹緛碜缘目傮w,但是由于抽樣的偶然性,得到了較小的t值,得到了較大的P值,沒有拒絕,這類存?zhèn)五e誤稱為第二類錯誤,犯第二類錯誤的概率是1-正態(tài)性檢驗:用均數(shù)和標準差描述資料的分布特征,對例數(shù)n較小的樣本進展t檢驗時,首先要求樣本取自正態(tài)分布的總體。兩個方差的齊性檢驗:兩樣本均數(shù)比擬的t檢驗和多個樣本均數(shù)比擬的方差分析要求各樣本所來自的總體方差相等。兩樣本方差的齊性檢驗:〔4.12〕式中為較大的樣本方差,為較小的樣本方差,為分子的自由度,為分母的自由度,相應的樣本例數(shù)分別為和。當兩總體方差齊同時,F(xiàn)值一般不會離1太遠;假設算得的F值較大,大于我們規(guī)定的界值時,就認為兩樣本所在總體的方差不齊。t檢驗t檢驗:常用于總體標準差未知且樣本含量較小時樣本均數(shù)與總體均數(shù)的比擬,成組設計的兩個小樣本的均數(shù)的比擬及配對設計的兩樣本均數(shù)的比擬。t檢驗的應用條件:a,n≤50b,樣本來自正態(tài)分布的總體c,兩樣本均數(shù)比擬時要求兩樣本總體方差相等。1,單樣本t檢驗〔onesamplet-test〕:樣本均數(shù)與總體均數(shù)比擬,目的是推斷樣本所代表的未知總體均數(shù)與總體均數(shù)有無差異。〔〕〔4.1〕式中為樣本均數(shù),為總體均數(shù),s為樣本標準差,n為樣本含量,為自由度。步驟如下〔可為u檢驗〕1〕建立假設,確定檢驗水準。H0:μ=μ0H1:μ≠μ0α=0.052〕計算統(tǒng)計量。,(總體均數(shù))μ0=,n=,=,s=3〕確定P值,做出推斷結論。按v=n-1,查t界值表,得P>0.05〔或P<0.05〕,按α檢驗水準,不拒絕H0〔或拒絕H0,承受H1〕,即根據(jù)本資料尚不能〔可以〕認為?與?有差異。2,配對設計資料的t檢驗分為3種情況:①將受試對象按一定條件配成對子〔同種屬、同體重、同年齡、同性別等〕,再隨機分配每對中的2個受試對象到不同的處理組;②同一受試對象分別承受2種不同處理,其目的是推斷2種處理的效果有無差異;③同一受試對象處理前后的比擬,其目的是推斷*種處理有無作用。配對設計資料的t檢驗〔pairedt-testfordependentsamples〕的根本思路:首先計算出各對差值d的均數(shù),當2種處理結果無差異或*種處理不起作用時,理論上差值的總體均數(shù)應該為0,故可將配對設計資料的t檢驗視為樣本均數(shù)與總體均數(shù)的比擬?!?.2〕式中為樣本中各對差值d的均數(shù),為樣本差值的標準差,n為對子數(shù),為自由度。先列表求差值d和1〕建立假設,確定檢驗水準。H0:μd=0H1:μd≠0α=0.052〕計算統(tǒng)計量。,n=,∑d=,∑=3〕確定P值,做出推斷結論。按v=n-1,查t界值表,得P>0.05〔或P<0.05〕,按α檢驗水準,不拒絕H0〔或拒絕H0,承受H1〕,即根據(jù)本資料尚不能〔可以〕認為?。3,成組設計資料兩樣本均數(shù)比擬的t檢驗〔two-samplet-testforindependentsamples〕:在臨床醫(yī)學研究中,進展配對設計比擬困難,一般分別從2個總體中隨機抽樣,進展成組設計兩樣本均數(shù)的比擬,目的是推斷2個總體均數(shù)是否相等。所比擬的兩個樣本含量最好相等,此時抽樣誤差最小?!?.3〕可為t,u檢驗1〕建立假設,確定檢驗水準。:μ1=μ2:μ1≠μ2α=0.052〕計算統(tǒng)計量。,n1=,∑*1=,∑=,n2=,∑*2=,∑=1=∑*1/n1=,2=∑*2/n2=〔,n1=,1=,s1=,n2=,2=,s2=3〕確定P值,做出推斷結論。按v=n1+n2-2,查t界值表,得P>0.05〔或P<0.05〕,按α檢驗水準,不拒絕H0〔或拒絕H0,承受H1〕,可以認為?的差異無〔或有〕統(tǒng)計學意義。檢驗u檢驗〔u-test,或Z-test〕:用檢驗統(tǒng)計量u來命名的。用于樣本含量n足夠大〔n>50〕,或n雖小但總體標準差時的樣本均數(shù)與總體均數(shù)的比擬、成組設計兩樣本均數(shù)的比擬。1,單樣本u檢驗〔onesampleu-test〕:〔4.4〕式中為樣本均數(shù),為總體均數(shù),s為樣本標準差,n為樣本含量。2,成組設計的兩樣本均數(shù)比擬的u檢驗〔two-sampleu-testforindependentsamples〕:〔4.5〕式中,分別為兩樣本均數(shù),為兩樣本均數(shù)差值的標準誤,、為分別為兩樣本的方差,、分別為兩樣本例數(shù)。標準正態(tài)分布〔u分布〕與t分布有何異同?答:一樣點:t分布和標準正態(tài)分布〔u分布〕都是以0為中心的正態(tài)分布。標準正態(tài)分布是t分布的特例〔自由度是無限大時〕。不同點:t分布為抽樣分布,u分布為理論分布;t分布比標準正態(tài)分布的峰值低,且尾部翹得更高;t分布受自由度大小的影響,隨著自由度的增大,逐漸趨近于標準正態(tài)分布;t分布有無數(shù)條曲線,而u分布只有唯一一條曲線。方差分析1,方差分析的根本思想:按研究目的和設計類型,將總變異中的離均差平方和SS和自由度分別分解成相應的假設干局部,然后求得各相應局部的變異;由于其中的組內(nèi)〔或誤差〕變異主要反映個體差異或抽樣誤差,其他各局部的變異與之比擬得出統(tǒng)計量F值,根據(jù)F值的大小確定P值,并做出推斷。2,方差分析的優(yōu)點:〔1〕不受比擬組數(shù)的限制,可比擬多組均數(shù)〔2〕可同時分析多個因素的作用〔3〕可分析同類間的交互作用3,方差分析的應用范圍:〔1〕2個或多個樣本均數(shù)間的比擬〔2〕分析2個或多個因素間的交互作用〔3〕回歸方程的線性假設檢驗〔4〕多元線性回歸分析中偏回歸系數(shù)的假設檢驗〔5〕兩樣本方差齊性檢驗完全隨機設計的方差分析:是將總變異中的離均差平方和SS和自由度分別分解成組間和組內(nèi)兩局部,SS/和SS/SS分別為組間變異〔MS〕和組內(nèi)變異〔MS〕,兩者之比即為統(tǒng)計量F。〔1〕總離均差平方和及自由度:SS=〔5.2〕=〔5.3〕〔2〕組間離均差平方和、自由度和均方:SS=〔5.4〕=〔組數(shù)-1〕〔5.5〕MS=〔5.6〕〔3〕組內(nèi)離均差平方和、自由度和均方:SS=SS-SS〔5.7〕=N-k〔樣本量-組數(shù)〕〔5.8〕MS=〔5.9〕當方差分析的推斷結果為拒絕H0,承受H1,各總體均數(shù)不同或不全一樣時,應對均數(shù)進一步兩兩比擬,即多重比擬(multiplecomparisons)。可用q檢驗進展分析:〔5.14〕式中為方差分析的組內(nèi)均方,假設為兩因素或兩因素以上的方差分析,則為誤差項均方;和分別為兩樣本的樣本含量。配伍組設計資料的方差分析配伍組設計亦稱隨機區(qū)組設計〔randomizedblockdesign〕,其多個樣本均數(shù)比擬可用無重復數(shù)據(jù)的兩因素方差分析〔two-wayANOVA〕。2個因素是指主要的研究因素和配伍組因素。兩因素的方差分析是把總變異中的離均差平方和與自由度分別分解成處理組間、配伍組間和誤差三局部。計算公式如下:變異來源離均差平方和自由度均方MSF總-C處理組間k-1配伍組間b-1誤差SS-SS-SS〔k-1〕〔b-1〕,為配伍組數(shù)二,分類變量統(tǒng)計描述常用相對數(shù),即率,構成比,和相比照對分類資料進展統(tǒng)計描述1,率〔rate〕:率又稱頻率指標,它說明*現(xiàn)象發(fā)生的頻率或強度率=2,構成比〔proportion〕:又稱構成指標,它說明一事物內(nèi)部各組成局部所占的比重或分布,常以百分數(shù)表示構成比=3,相比照〔relativeratio〕亦稱比,是A,B2個有關指標之比,說明A和B的假設干倍或百分之幾,是相對數(shù)的最簡單形式。A,B性質可一樣可不同。相比照=4,應用相對數(shù)時應注意的事項:〔一〕計算相對數(shù)的分母不宜過小?!捕撤治鰰r不能以構成比代替率?!踩硨τ^察單位數(shù)不等的幾個率,不能直接用相加求其平均率。〔四〕資料的比照應注意可比性?!参濉硨颖韭省不驑嫵杀取车谋葦M應遵循隨機抽樣,要做假設檢驗。〔六〕區(qū)別清分子分母。5,率的u檢驗1〕,樣本率與總體率比擬:目的是推斷樣本率所代表的總體率與*總體率是否相等。根據(jù)資料的不同情況,可以采用不同的假設檢驗方法:①假設很小,可用Poisson分布原理做檢驗;②假設不太靠近0或1時,可用二項分布原理做檢驗;當樣本含量n足夠大時,或且,二項分布逼近正態(tài)分布,可用u檢驗計算其樣本檢驗統(tǒng)計量?!?.1〕式中p為樣本率,為總體率〔常為理論值或標準值〕,n為樣本含量。2〕,兩樣本率比擬:兩個樣本率作比擬的目的是推斷兩個樣本各自代表的兩總體率是否相等,當兩個樣本滿足正態(tài)近似條件且樣本含量較大時,可用u檢驗,其公式:〔6.2〕式中、分別為兩個樣本率,、分別為兩樣本含量,為兩個樣本率之差的標準誤,為合并陽性率,,、為兩個樣本陽性例數(shù)。四格表資料的檢驗適用于分類變量資料中推斷兩個或多個總體率〔或構成比〕之間有無差異,兩個分類指標之間有無相關關系的檢驗以及檢驗頻數(shù)分布的擬合優(yōu)度。(6.3)式中A代表實際頻數(shù),T代表理論頻數(shù)。格子理論頻數(shù)可用同樣方法求得,其計算公式為:〔6.4〕〔6.5〕四格表資料的專用公式:〔6.6〕式中a、b、c、d分別為四格表的實際頻數(shù)=a+b+c+d。四格表的值的校正。①當所有T>5,n>40時用上述公式;②當有1<T<5,且n>40時,需進展連續(xù)性校正:〔6.7〕〔6.7〕③或n<40時,需用四格表資料確實切概率法。行×列表資料的檢驗。(6.9)式中n是總例數(shù),A是每個格子的實際頻數(shù),,分別為*格子對應的行合計和列合行×列表檢驗考前須知〔1〕*2檢驗要求理論頻數(shù)不宜太小,否則將導致偏性。一般認為行*列表資料中不宜有1/5以上的格子理論數(shù)小于5,或有一個格子理論數(shù)小于1。處理方法:最好的方法是增加樣本例數(shù),以增大理論頻數(shù);且準確概率法;進展合理的合并;刪除理論頻數(shù)太小的行和列,后兩種方法將損失一定的信息并影響樣本的隨機性?!?〕單向有序列行*列表的統(tǒng)計處理:當效應按強弱分為假設干個級別,試驗結果整理為單向有序行列表,在比擬各處理組的效應有無差異時,宜用秩和檢驗或Ridit分析?!?〕當多個樣本率比擬的檢驗。結論為拒絕H0,只能認為各總體率或總體構成比之間總的說來有差異,但不能說明它們彼此間都有差異,或*兩者間有差異。假設要進一步解決此問題,可用卡方分割法。配對四格表資料的卡方檢驗:〔一〕關聯(lián)性分析:〔1〕建立假設檢驗,確定檢驗水準。H0:兩種方法的檢驗結果無關系H1:兩種方法的檢驗結果有關系α=0.05〔2〕計算統(tǒng)計量*2值。①n>=40,T>=5,②n>=40,1<T<5,③n<40或T<1,四格表確切概率法?!?〕確定P值,做出推斷結論。*2>3.84,P<0.05,按α=0.05檢驗水準,拒絕H0,承受H1,可以認為兩種方法的檢驗結果有關系?!捕巢町愋詸z驗:〔1〕建立假設檢驗,確定檢驗水準。H0:兩總體的B=CH1:兩總體的B不等于Cα=0.05〔2〕計算統(tǒng)計量*2值。①b+c>40時:②b+c<40時,〔3〕確定P值,做出推斷結論。*2>3.84,P<0.05,按α=0.05檢驗水準,拒絕H0,承受H1,可以認為兩種方法的檢驗結果有差異?!?20.05(1)=3.84,*20.005(1)=7.88〕非參數(shù)檢驗參數(shù)檢驗和非參數(shù)檢驗的優(yōu)缺點:參數(shù)檢驗的優(yōu)點是對資料的分析利用充分,統(tǒng)計分析的效率高;缺點是對資料的要求高,適用范圍有限。非參數(shù)檢驗的優(yōu)點:〔1〕適用范圍廣,對變量的類型和分布無特殊要求,不受總體分布的限制;〔2〕對數(shù)據(jù)的要求不嚴,對*些指標不便準確測定的資料也可應用;〔3〕方法簡便,易于理解和掌握。缺點是如果對符合參數(shù)檢驗的資料用了非參數(shù)檢驗,因不能充分利用資料提供的信息,會使檢驗效能低于非參數(shù)檢驗;假設要使檢驗效能一樣,往往需要更大的樣本含量。配對設計的符號秩和檢驗Wilco*on符號秩和檢驗〔Wilco*onsignedranktest〕是推斷其差值是否來自中位數(shù)為零的總體的方法,可用于配對設計差值的比擬和單一樣本與總體中位數(shù)的比擬?!惨弧掣舅枷肫浼僭O是差值的總體中位數(shù)等于0,備擇假設是差異的總體中位數(shù)不等于0,如果差異太大,就拒絕;反之,不拒絕?!捕撤椒ú襟E:1,建立檢驗假設,確定檢驗水準;2,計算檢驗統(tǒng)計量T值:a,求各對的差值;b,編秩;c,求秩和,確定統(tǒng)計量T;3,確定P值,做出推斷結論。完全隨機設計兩樣本比擬的秩和檢驗亦稱兩個樣本比擬的秩和檢驗,利用兩樣本觀察值的秩和來推斷樣本分別代表的總體分布是否一樣。成組設計多樣本比擬的秩和檢驗,利用多個樣本的秩和來推斷各樣本分別代表的總體的分布有無差異。配伍組設計的秩和檢驗M檢驗秩和檢驗步驟:(1)建立檢驗假設,確定檢驗水
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 算法與計算方法課程設計
- 2024年學校安全工作應急預案
- 2024年一年級語文上全冊各單元測試題分解
- 年度其它新型計算機外圍設備戰(zhàn)略市場規(guī)劃報告
- 年度碳纖維預浸布市場分析及競爭策略分析報告
- 2025年度專業(yè)打印紙銷售渠道建設合同4篇
- 2025年度新能源項目出借咨詢及項目管理協(xié)議4篇
- 2025年新型門窗安裝工程承包合同4篇
- 錘片粉碎機課程設計
- 精壓機課程設計2020
- 吸入療法在呼吸康復應用中的中國專家共識2022版
- 1-35kV電纜技術參數(shù)表
- 信息科技課程標準測(2022版)考試題庫及答案
- 施工組織設計方案針對性、完整性
- 2002版干部履歷表(貴州省)
- DL∕T 1909-2018 -48V電力通信直流電源系統(tǒng)技術規(guī)范
- 2024年服裝制版師(高級)職業(yè)鑒定考試復習題庫(含答案)
- 門診部縮短就診等候時間PDCA案例-課件
- 第21課《鄒忌諷齊王納諫》對比閱讀 部編版語文九年級下冊
- NB-T32042-2018光伏發(fā)電工程建設監(jiān)理規(guī)范
評論
0/150
提交評論