醫(yī)學統(tǒng)計學總結_第1頁
醫(yī)學統(tǒng)計學總結_第2頁
醫(yī)學統(tǒng)計學總結_第3頁
醫(yī)學統(tǒng)計學總結_第4頁
醫(yī)學統(tǒng)計學總結_第5頁
已閱讀5頁,還剩145頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

醫(yī)學統(tǒng)計學總結一.緒論1,醫(yī)學統(tǒng)計學:運用概率論和數(shù)理統(tǒng)計學的原理和方法,研究醫(yī)學領域中隨機現(xiàn)象有關數(shù)據(jù)的搜集、整理、分析和推斷,進而闡明其客觀規(guī)律性的一門應用科學。2,醫(yī)學統(tǒng)計學的主要內容:1)統(tǒng)計研究設計 調查研究設計和實驗研究設計2)醫(yī)學統(tǒng)計學的基本原理和方法 研究設計和數(shù)據(jù)處理中的基本統(tǒng)計理論和方法。 A:資料的搜集與整理B:常用統(tǒng)計描述,集中趨勢和離散趨勢, 相對數(shù),相關系數(shù),回歸系數(shù),統(tǒng)計表,統(tǒng)計圖C:統(tǒng)計推斷,如參數(shù)估計和假設檢驗。3 )醫(yī)學多元統(tǒng)計方法 多元線性回歸和逐步回歸分析、 判別分析、聚類分析、主成分分析、因子分析、logistic 回歸與Cox回歸分析。3,統(tǒng)計工作步驟:1)設計明確研究目的和研究假說, 確定觀察對象與觀察單位, 樣本含量和抽樣方法, 擬定研究方案,預期分析指標,誤差控制措施,進度與費用。2)搜集材料A,搜集材料的原則 及時、準確、完整B,統(tǒng)計資料的來源 醫(yī)學領域的統(tǒng)計資料的來源主要有三個方面。 一是統(tǒng)計報表,二是經(jīng)常性工作記錄,三是專題調查或專題實驗。C,資料貯存3)整理資料a檢查核對 b設計分組c擬定整理表 d歸表4)分析資料 統(tǒng)計分析包括統(tǒng)計描述和統(tǒng)計推斷4,同質(homogeneity):指被研究指標的影響因素相同。變異(variation) :同質基礎上的各觀察單位間的差異。變量(variable) :收集資料過程中,根據(jù)研究目的確定同質觀察單位,再對每個觀察單位的某項特征進行測量或觀察,這種特征稱為變量變量值:變量的觀察結果或測量值。變量類型變量值表現(xiàn)實例資料類型數(shù)值變量離散型產(chǎn)前檢查次數(shù)定量測量值,有計量單位計量資料連續(xù)型身高分無二分類對立的兩類屬性性別(男女)類序多分類不相容的多類屬性血型(A,B,O,AB)計數(shù)資料變量有多分類類間有程度差異的屬性受教育程度(小學,中序學,高中,大學)等級資料5,總體(population )根據(jù)研究目的所確定的同質研究對象中所有觀察單位某變量值的集合??傮w具有的基本特征是:同質性樣本(sample)從總體中隨機抽取部分觀察單位,其變量值的集合構成樣本。樣本必須具有代表性。代表性是指樣本來自同質總體,足夠的樣本含量和隨機抽樣的前提。精品文檔統(tǒng) 計 量 ( statistics ) 描 述 樣 本 變 量 值 特 征 的 指 標( 樣 本 率 ,-- 2精品文檔樣 本 均 數(shù) ,樣本標準差)。-- 3精品文檔參數(shù)(parameter)描述總體變量值特征的指標 (總 體 率 , 標 準 差 ,總體均數(shù))。-- 4精品文檔抽樣誤差(samplingerror):由于個體差異的存在,即使在同一整體中隨機抽取若干樣本,各樣本的統(tǒng)計量往往不等,統(tǒng)計量與參數(shù)也會有所不同。這種因抽樣研究引起的差異稱抽樣誤差。隨機事件(randomevent)對隨機試驗的各種可能結果的集合。概率(probability )描述隨機事件發(fā)生的可能性大些哦的一個度量。小概率事件 若隨機事件 A的概率P(A)≤α,習慣上,α =0.05時,就稱 A為小概率事件。其統(tǒng)計學意義是小概率事件在一次隨機試驗中認為不會發(fā)生。抽樣誤差1,抽樣誤差(samplingerror)由抽樣而造成的樣本統(tǒng)計量與總體參數(shù)之間的差異或各樣本統(tǒng)計量之間的差異。在醫(yī)學統(tǒng)計學中,常把由抽樣造成的樣本均數(shù)與總體均數(shù)間的差異稱為均數(shù)的抽樣誤差;由抽樣造成的樣本率與總體率之間的差異稱為率的抽樣誤差。-- 5精品文檔2,樣本均數(shù)的標準差 (簡稱標準誤,standarderror)反映均數(shù)的抽樣誤差大小的指標。 大,抽樣誤差大;反之, 小,抽樣誤差小。-- 6精品文檔(3.1)實際工作中 往往未知的,可用樣本標準差 s作的 估 計 值 ,計 算標 準 誤 的 估 計 值-- 7精品文檔。(3.2)3,標準誤的用途: a,衡量樣本均數(shù)的可靠性; b,估計總體均數(shù)的置信區(qū)間; 3,用于均數(shù)的假設檢驗。-- 8精品文檔4,標準誤的估計值 的用途:,描述抽樣誤差的大??;,總體參數(shù)的估計;,用來進行假設檢驗。5,率的抽樣誤差:由抽樣造成的樣本率與總體率的差異稱為率的抽樣誤差。-- 9精品文檔衡量率的抽樣誤差大小的指標是率的標準誤 。越 小 , 率 的 抽 樣 誤 差 越 小 ;越大,率的抽樣誤差越大。-- 10精品文檔(3.3)其中 為總體率。實際工作中 ,由于往 往是 未知 的 ,可 用樣 本率 p 作-- 11精品文檔的 估 計 值 , 計 算 率 的 標 準 誤的 估 計 值。-- 12精品文檔(3.4)。標準差(s) 標準誤計 算 公 式s=(1)表示觀察值的變異程度(1)估計均數(shù)的抽樣誤差的大?。?)計算變異系數(shù)(2)估計總體均數(shù)的可信區(qū)間CV=(-- 13精品文檔,100%)(3)確定醫(yī)學參考值范圍 (3)進行假設檢驗4)計算標準誤簡述標準差、標準誤的區(qū)別與聯(lián)系?區(qū)別:(1)含義不同:標準差 S表示觀察值的變異程度,描述個體變量值( x)之間的變異度大小, S越大,變量值(x)越分散;反之變量值越集中,均數(shù)的代表性越強。標準誤-- 14精品文檔估計均數(shù)的抽樣誤差的大小,是描述樣本均數(shù)之間的變異度大小,標準誤越大,樣本均數(shù)與總體均數(shù)間差異越大,抽樣誤差越大;反之,樣本均數(shù)越接近總體均數(shù),抽樣誤差越小。(2)與n的關系不同:n增大時,S趨于σ(恒定),標準誤減少并趨于0(不存在抽樣誤差)。(3)用途不同:標準差表示x的變異度大小、計算變異系數(shù)、確定醫(yī)學參考值范圍、計算標準誤等,標準誤用于估計總體均數(shù)可信區(qū)間和假設檢驗。聯(lián)系:二者均為變異度指標,樣本均數(shù)的標準差即為標準誤,標準差與標準誤成正比。-- 15精品文檔標 準 差 : 標 準 誤 :.分布正態(tài)分布,正態(tài)分布的函數(shù)-- 16精品文檔其 中 為 總 體 均 數(shù) ,為 總 體 標 準 差 ,-- 17精品文檔為 圓 周 率 ,為 自 然 對 數(shù) 的 底 , 且 僅為 變 量 。 以-- 18精品文檔為 橫 軸 , 以為縱軸,當均數(shù)和標準差已知時即可繪出正態(tài)分布曲線。-- 19精品文檔為應用方便,將式中 進行變量變換,使原來的正態(tài)分 布變 為 的標 準正 態(tài) 分 布 ,亦 稱分 布 。-- 20精品文檔被稱為標準正態(tài)變量或標準正態(tài)離差,將代入上述公式即得標準正態(tài)分布的密度函數(shù)。-- 21精品文檔2.17)(2.18),正態(tài)分布的特征1)正態(tài)曲線(normalcurve)在橫軸上方均數(shù)處最高。2)正態(tài)分布以均數(shù)為中心,左右對稱。-- 22精品文檔(3)正態(tài)分布有 2個參數(shù)(parameter),即均數(shù) (位置 ) 和 標 準 差 ( 形 狀 ) 。 當固 定 不 變 時 ,-- 23精品文檔越大,曲線沿橫軸越向右移動;反之,越小,則曲線沿橫軸越向左移動。當固 定 不 變 時 ,-- 24精品文檔越 大 , 曲 線 越 平 闊 ;越 小 , 曲 線 越 尖 峭 。 通 常 用 N( ,-- 25精品文檔) 表 示 均 數(shù) 為、 方 差 為的正態(tài)分布。用( 0,1)表示標準正態(tài)分布。( 4)-- 26精品文檔正 態(tài) 分 布 在1處各有一個拐點。(5)正態(tài)曲線下面積的分布有一定規(guī)律。-- 27精品文檔3 , 常 用 的 兩 個 區(qū) 間 :1.96及-- 28精品文檔2.58的區(qū)間面積分別占總面積的 95%及99%。4,正態(tài)分布的應用-- 29精品文檔),制定醫(yī)學參考值范圍a, 正 態(tài)分 布 法 適 用 于 正態(tài) 或 近 似 正 態(tài) 分布 的 資 料 雙 側 界值 :; 單 側 上-- 30精品文檔界 : , 或 單 側 下 界 :。-- 31精品文檔b , 對 數(shù) 正 態(tài) 分 布 法 適 用 于 對 數(shù) 正 態(tài) 分 布 資 料 雙 側界 值 :; 單 側 上 界 :-- 32精品文檔, 或 單 側 下 界,百分位數(shù)法常用于偏態(tài)分布資料及資料中一端或兩端無確切數(shù)值的資料。雙側界值:和-- 33精品文檔; 單 側 上 界 :, 或 單 側 下 界 :。-- 34精品文檔2 ) 正 態(tài) 分 布 是 多 種 統(tǒng) 計 方 法 的 理 論 基 礎 如 t 分 布 , F 分布 ,分布都是在正態(tài)分布的基礎上推導出來的,分布也是以正態(tài)分布為基礎的。另外 t分布,二項分布,poisson分布的極限為正態(tài)分布,一定條件下可按正態(tài)分布原理處理。分布-- 35精品文檔1,t分布:(3.5)分布的特征為:1. 以0為中心,左右對稱的單峰分布。2. t 分 布 曲 線 形 態(tài) 變 化 與 自 由 度 的 大 小 有 關 。 自 由 度越小,則t值越分散,曲線越低平;-- 36精品文檔自由度 逐漸增大時,則t分布逐漸逼近 正 態(tài) 分 布 ( 標 準 正 態(tài) 分 布 ) 。 當=-- 37精品文檔時,t分布為u分布。t界值表附圖中非陰影部分面積的概率為:-- 38精品文檔2,總體均數(shù)的估計:用樣本指標估計總體參數(shù)稱為參數(shù)估計,是統(tǒng)計推斷的一個重要方面??傮w均數(shù)的估計有 2種方法。一是直接用統(tǒng)計量 估計總體參數(shù),稱為點值估計。由于抽樣誤差的存在,此法很難估計準確。二是區(qū)間估計(interval estimation)法。區(qū)間估計是按一定的概率 100-- 39精品文檔(1- )%估計總體均數(shù)所在的范圍,亦稱可信區(qū)間confidenceinterval,CI)。常取的可信度為95%和99%,即95%可信區(qū)間和99%可信區(qū)間。計算方法有種:(1) 未知且 n小 按t分布原理用式( 3.6)計算可信區(qū)間。-- 40精品文檔由 于 將代 入 , 得-- 41精品文檔則總體均數(shù)的 100(1- )%可信區(qū)間的通式為:( 3.6 ) 或 寫 成-- 42精品文檔( ,)。-- 43精品文檔(2)未知,但n足夠大時(n>100)t分布逼近u分布,按正態(tài)分布原理,用式(3.7)估計可信區(qū)間。()(3.7)-- 44精品文檔(3)已知按正態(tài)分布原理,用式(3.8)估計可信區(qū)間。( )(3.8)標準正態(tài)分布( u分布)與 t分布有何異同?答:相同點:t分布和標準正態(tài)分布( u分布)都是以 0為中心的正態(tài)分布。標準正態(tài)分布是 t分布的特例(自由度是無限大時)。不同點:t分布為抽樣分布, u分布為理論分布; t分布比標準正態(tài)分布的峰值低,且尾部翹得更高; t分布受自由度大小的影響,隨著自由度的增大,逐漸趨近于標準正態(tài)分布; t分布有無數(shù)條曲線,而 u分布只有唯一一條曲線。二項分布1,二項分布(binomial distribution)是對只具有 2種互斥結果的離散型隨機事件的規(guī)律性進行描述的一種概率分布。-- 45精品文檔二項分布概率公式:(3.9)式中n為獨立的貝努力試驗次數(shù), 為成功的概率,(1- )為失敗的概率, X為在n次貝努力試驗中出-- 46精品文檔現(xiàn)“成功”的次數(shù), 表示在n次試驗中出現(xiàn) X的各種組合數(shù),在此稱為二項系數(shù)( binomialcoefficient)。2,二項分布的應用條件:(1)各觀察單位只能具有相互對立的一種結果,如陽性或陰性,生存或死亡。-- 47精品文檔(2)已知發(fā)生某一結果(陽性)的概率為 ,其對立結果的概率為 1- ,實際工作中要求是從大量觀察中獲得比較穩(wěn)定的數(shù)值。-- 48精品文檔(3)n次試驗在相同條件下進行,且各個觀察單位的觀察結果相互獨立。3,二項分布的性質:A,二項分布的均數(shù)和標準差 在二項分布的資料中,當 和 n 已 知 時 , 它 的 均 數(shù)及 其 標 準 差-- 49精品文檔如 下 :=n3.11)-- 50精品文檔(3.12)若均數(shù)和標準差不用絕對數(shù)表示,而是用率表示時,即對式( 3.11)(3.12)分別除以 n,得:(3.13)-- 51精品文檔3.14)是 樣 本 率 的標 準誤 的 理 論 值 , 當未 知 時 , 常 用 樣 本 率 p 作 為-- 52精品文檔的 估 計 值 , 則 :(3.15)B,二項分布的累計概率 二項分布的累計概率( cumulativeprobability)常用的有左側累計和右側累計 2種方法。-- 53精品文檔從陽性率為 的總體中隨機抽取 n個個體,則(1)最多有k例陽性的概率(3.16)(2)最少有k例陽性的概率-- 54精品文檔(3.17)D,二項分布的形狀取決于 和n的大?。?- 55精品文檔( 1) 當 =0.5 時, 分 布 對 稱 ; 當<0.5 時,分布呈正偏態(tài),且固定 n 時,越 小 , 分 布 越 偏 ; 當-- 56精品文檔>0.5 時,分布呈負偏態(tài),且固定 n 時,越大,分布越偏。(2)對固定的 ,分布隨 n的增大趨于對稱。-- 57精品文檔4,總體率的估計總體率的估計也有點估計和區(qū)間估計, 點估計是簡單地用樣本率來估計總體率; 區(qū)間估計是求出總體率的可能范圍。樣本率的理論分布和樣本含量 n、陽性率 p的大小有關,所以需要根據(jù) n和p的大小不同,分別選用下列 2種方法。(一)查表法 當樣本含量 n較小,如n≤50,特別是p很接近于0或1時,按二項分布的原理估計總體率的可信區(qū)間。(二)正態(tài)近似法 當樣本含量 n足夠大,且樣本率 p或1-p均不太小,如 np與n(1-p)均大于 5時,樣本率的p的抽樣分布近似正態(tài)分布,總體率 的可信區(qū)間可按下列式( 3.17)進行估計。(3.17)Poisson分布-- 58精品文檔1,Poisson分布 泊松分布是在 很小,樣本含量 n趨向于無窮大時,二項分布的極限形式。更多地用于研究單位時間、單位人群、單位空間內,某罕見事件發(fā)生的次數(shù)的分布。-- 59精品文檔X=0 , 1 ,2 (3.19)-- 60精品文檔式 中=n為Poisson分布的總體均數(shù),X為單位時間或單位空間內某事件的發(fā)生數(shù), e為自然對數(shù)的底,約等于 2.71828。在實際運算中, P(X)亦可按式(3.20)作遞-- 61精品文檔推 計 算 。(3.20)2,Poisson分布應用條件:A,要求事件的發(fā)生是相互獨立B,發(fā)生的概率相等C,結果是二分類3,Poisson分布的性質:-- 62精品文檔A , 該 分 布 是 一 種 單 參 數(shù) 的 離 散 型 分 布 , 其 參 數(shù) 為,它表示單位時間或空間內某件事平均發(fā)生的次數(shù),又稱強度參數(shù)。-- 63精品文檔B, Poisson 分布的 方差 和均數(shù)相 等 , 即-- 64精品文檔=C,Poisson分布的累計概率(1)最多為k次的概率-- 65精品文檔(2)最少為k次的概率4,Poisson分布的圖形-- 66精品文檔已知 ,就可按公式計算得出 X=0,1,2,時的P(X)值,以 X為橫坐標,以 P(X)為縱坐標作圖,即可會出 Poisson分布的圖形。-- 67精品文檔值 越 小 , 分 布 越 偏 , 隨 著的 增 大 , 分 布 越 趨 于 對 稱 , 當=20 時 , 分 布 接 近 正 態(tài) 分 布 , 當-- 68精品文檔=50 時,可以認為 Poisson分布呈正態(tài)分布N( ,)按正態(tài)分布處理。-- 69精品文檔5,Poisson分布具有可加性6,總體參數(shù)的估計由樣本均數(shù)(樣本計數(shù)) X估計總體均數(shù) 也有點(值)估計和區(qū)間估計,區(qū)間估計的方法,需視樣本計數(shù)(樣本均數(shù)) X的大小而定,X小時用查表法,X大時用正態(tài)近似法。(一)查表法-- 70精品文檔當樣本計數(shù) X 時,用X值查附表 poisson分布的 可 信 區(qū) 間 , 可 得 總 體 均 數(shù)的95%或99%可信區(qū)間。-- 71精品文檔(二)正態(tài)近似法當 樣 本 計 數(shù) X>50 時 , 可 用 正 態(tài) 近 似 原 理 下 面 公 式 求 總 體 均 數(shù)的 95% 或 99% 可 信 區(qū) 間正態(tài)分布、二項式和泊松分布的關系 :二項分布(binomialdistribution):對只具有兩種互斥結果的離散型隨機事件的規(guī)律性進行描述的一種概率分布。Poisson分布是在π很小,樣本含量 n趨于無窮大時,二項分布的極限形式。當 v=∞時,t分布即為u分布,趨向正態(tài)分布。可信區(qū)間與參考值范圍的區(qū)別 :意義、計算公式和用途均不同。 (1)參考值范圍是指同質總體內包括百分之幾十個體值的估計范圍。而可信區(qū)間是指在百分之幾十的可信度估計的總體參數(shù)的所在范圍。 (2)同樣的百分之幾十,參考值范圍是樣本范圍,可信區(qū)間是指可信度范圍,二者有著本質的不同。 (3)從意義來看,95%參考值范圍是指同質總體內包括 95%個體值的估計范圍,而總體均數(shù) 95%可信區(qū)間是指按 95%可信度估計的總體均數(shù)的所在范圍。(4)從計算公式看,若指標服從正態(tài)分布,95%參考值范圍的公式是:-- 72精品文檔±1.96s??傮w均數(shù) 95%可信區(qū)間的公式是:。前者用標準差,后者用標準誤。前者用 1.96,后者用α為0.05,自由度為 v的t界值。(5)從用途上看,可信區(qū)間用來估計總體均數(shù),參考值范圍用來判斷觀察對象的某項指標是否正常。簡述檢驗假設與可信區(qū)間的聯(lián)系與區(qū)別 。答:(1)可信區(qū)間用于推斷總體參數(shù)所在的范圍,假設檢驗用于推斷總體參數(shù)是否不同。前者估計總體參數(shù)的大小,后者推斷總體參數(shù)有無質的不同。 (2)可信區(qū)間也可回答假設檢驗的問題。但可信區(qū)間不能提供確切的P值范圍,只能給出在α水準上有無統(tǒng)計意義。( 3)可信區(qū)間還可提示差別有無實際意義。統(tǒng)計圖表1,繪制統(tǒng)計圖的基本要求:A,根據(jù)資料性質和分析目的據(jù)頂適當圖形。B,標題應說明資料的內容、時間和地點,一般位于圖的下方。C,圖的縱、橫軸應注明標目及對應單位,尺度應等距或具有規(guī)律性,一般自左而右、自下而上、由小到大。D,為使圖形美觀并便于比較,統(tǒng)計圖的長寬比例一般為 7:5,有時為了說明問題也可以變動。-- 73精品文檔E, 比較、說明不同的事物時,可用不同顏色或線條表示,并常附圖例說明,但不宜過多。2,常用統(tǒng)計圖的適用條件與繪制1.條圖(bargraph)用等寬長條的高度表示按性質分類資料各類別的數(shù)值大小,用于表示它們之間的對比關系。2.圓圖(piegraph) 圓形圖適用于百分構成比資料,表示事物各組成部分所占的比重或構成。3.百分條圖(percentbar)意義及適用資料同圓圖,也稱構成條圖。4.線圖(linegraph)線圖適用于連續(xù)性資料,以不同的線段升降來表示資料的變化,并可表明一事物隨另一食物(時間)而變動的情況。5.直方圖(histogram)直方圖用于表達連續(xù)性資料的頻數(shù)分布。6.散點圖(scatterdiagram)散點圖以直角坐標系中各點的密集程度和趨勢來表示兩現(xiàn)象間的關系。常用在對資料進行相關分析之前適用。單變量資料一,數(shù)值變量統(tǒng)計描述1,頻數(shù)表的編制 求全距 定組段和組距 列頻數(shù)表 畫頻數(shù)圖2,頻數(shù)分布的兩個重要特征:集中趨勢和離散趨勢3,頻數(shù)分布可以分為正態(tài)分布和偏態(tài)分布4,頻數(shù)表的用途:揭示資料分布類型和分布特征,以便選取適當?shù)慕y(tǒng)計方法;便于進一步計算指標和統(tǒng)計處理;便于發(fā)現(xiàn)某些特大或者特小的可疑值。5,集中趨勢的描述:均數(shù) 幾何均數(shù) 中位數(shù) 百分位數(shù)6 , 均 數(shù) (mean) : 算 術 均 數(shù) 的 簡 稱 。 常 用=-- 74精品文檔=表示。7,中位數(shù)(median):一組由小到大按順序排列的觀察值中位次居中的數(shù)值,用 M表示??捎糜诿枋鋈魏畏植?,特別是偏態(tài)分布資料以及頻數(shù)分布的一端或兩端無確切數(shù)據(jù)資料的中心位置。-- 75精品文檔8,百分位數(shù)(percentile)是一種位置指標,用 表示。一個百分位數(shù) P 將一組觀察值分為兩部分,理論上有x%的觀察值比它小,有( 100-x)%的觀察值比它大??捎糜诖_定非正態(tài)分布資料的醫(yī)學參考值范圍。9,離散趨勢的描述:全距( range)四分位數(shù)間距( quartile) 方差 標準差10,全距(range) 亦稱極差,為一組同質觀察值中最大值和最小值之差。反映個體差異的范圍,優(yōu)點是計算簡單,缺點是: 1)只考慮最大最小值之間的差異,不能反映組內其他觀察值的變異度; 2)樣本含量相差懸殊時不宜用全距比較。11,四分位數(shù)間距(quartile)上四分位數(shù)與下四分位數(shù)之差。常用于描述偏態(tài)頻數(shù)分布以及分布的一端或兩端無確切數(shù)值資料的離散程度。-- 76精品文檔12,方差(variance)離均差的平方和表示。13,標準差(standardvariance)的作用:a,估計變量值的離散程度 b,計算變異系數(shù) c,與均數(shù)結合,估計變異值的頻數(shù)分布范圍 d,計算標準誤-- 77精品文檔( 總 體 )s= (樣本)14,變異系數(shù)(coefficientofvariation)常用于比較度量單位不同或均數(shù)相差懸殊的兩組或多組資料的變異度 。-- 78精品文檔CV=100%假設檢驗1,假設檢驗(hypothesistest)亦稱顯著性檢驗(significancetest),其基本思想是先對總體的參數(shù)或分布做出某種假設,如設總體均數(shù)(或率)為一定值;兩總體均數(shù)(或率)相等;總體服從正態(tài)分布或兩分布相同等,然后根據(jù)樣本信息選用適當?shù)姆椒?,推斷此假設應當拒絕或不拒絕。2,假設檢驗的一般步驟:1)建立假設和確定檢驗水準:根據(jù)實際情況確定單、雙側檢驗,建立假設,確定檢驗水準;2)選定檢驗方法和計算統(tǒng)計量:根據(jù)設計的類型及研究目的選擇合適的檢驗方法并計算出對應的統(tǒng)計量;(3)確定P值并做出推斷結論。若 t≥tα,v,則P≤α,按檢驗水準,拒絕 H0,接受 H1,尚可認為差異顯著有統(tǒng)計學意義;相反則差異不顯著,無統(tǒng)計學意義3,假設檢驗時應注意的事項:1)要有嚴密的抽樣研究設計;樣本必須是從同質總體中隨機抽取的,要保證組間的均衡性和資料的可比性,可能影響結果的非處理因素在對比組間應盡可能相同或相近;2)正確選擇檢驗方法;根據(jù)現(xiàn)有的資料類型、設計類型、分析目的、樣本含量等因素選用適當?shù)臋z驗方法,如不符合條件可做適當轉換;-- 79精品文檔3)正確理解“差別無顯著性”的含義,差別有統(tǒng)計學意義,不能理解為兩者差差大,也不能理解為所分析的指標在實際應用上就有“顯著效果”。4)檢驗假設的推斷結論為概率結論,不能絕對化:檢驗水準人為規(guī)定,是相對的,報告結論時應列出檢驗統(tǒng)計量和 P值的確切范圍。(5)注意是單側檢驗還是雙側檢驗I型錯誤和 II型錯誤:I型錯誤(typeIerror)拒絕了實際上成立的 ,即樣本原本來自 的總體,由于抽樣的偶然性得到了-- 80精品文檔較大的 t 值,所以拒絕了 ,接受了,這類棄真錯誤稱為第一類錯誤,犯第一類錯誤的概率是 。-- 81精品文檔II 型 錯 誤 ( type II error ) 是 不 拒 絕 實 際 上 不 成 立 的, 即 “ 存 偽 ” 即 樣 本 原 本 來 自的總體,但是由于抽樣的偶然性,得到了較小的 t-- 82精品文檔值,得到了較大的 P值,沒有拒絕 ,這類存?zhèn)五e誤稱為第二類錯誤,犯第二類錯誤的概率是 1-正態(tài)性檢驗:用均數(shù)和標準差描述資料的分布特征,對例數(shù) n較小的樣本進行 t檢驗時,首先要求樣本取自正態(tài)分布的總體。兩個方差的齊性檢驗 :兩樣本均數(shù)比較的 t檢驗和多個樣本均數(shù)比較的方差分析要求各樣本所來自的總體方差相等。兩樣本方差的齊性檢驗:-- 83精品文檔4.12)-- 84精品文檔式 中 為 較 大 的 樣 本 方 差 ,為 較 小 的 樣 本 方 差 ,為 分 子 的 自 由 度 ,-- 85精品文檔為分母的自由度,相應的樣本例數(shù)分別為和-- 86精品文檔。當兩總體方差齊同時, F值一般不會離 1太遠;若算得的F值較大,大于我們規(guī)定的界值時,就認為兩樣本所在總體的方差不齊。t檢驗t檢驗:常用于總體標準差未知且樣本含量較小時樣本均數(shù)與總體均數(shù)的比較, 成組設計的 兩個小樣本的均數(shù)的比較及配對設計的兩樣本均數(shù)的比較。t檢驗的應用條件: a,n≤50b,樣本來自正態(tài)分布的總體 c,兩樣本均數(shù)比較時要求兩樣本總體方差相等。-- 87精品文檔1,單樣本 t檢驗(onesamplet-test ):樣本均數(shù)與已知總體均數(shù)比較,目的是推斷樣本所代表的未知總 體 均 數(shù) 與 已 知 總 體 均 數(shù)有無差別。-- 88精品文檔()(4.1)-- 89精品文檔式 中 為 樣 本 均 數(shù) ,為已知總體均數(shù), s為樣本標準差, n為樣本含量,為自由度。-- 90精品文檔步驟如下(可為 u檢驗)1)建立假設,確定檢驗水準。H0:μ=μ0H1:μ≠μ0=0.052)計算統(tǒng)計量。已知,(總體均數(shù))μ0=,n=, =,s=3)確定P值,做出推斷結論。按v=n-1,查t界值表,得 P>0.05(或P<0.05),按α檢驗水準,不拒絕 H0(或拒絕H0,接受H1),即根據(jù)本資料尚不能(可以)認為?與?有差異。2,配對設計資料的 t檢驗 分為3種情況:①將受試對象按一定條件配成對子(同種屬、同體重、同年齡、同性別等),再隨機分配每對中的 2個受試對象到不同的處理組; ②同一受試對象分別接受 2種不同處理,其目的是推斷2種處理的效果有無差別;③同一受試對象處理前后的比較,其目的是推斷某種處理有無作用。-- 91精品文檔配對設計資料的 t檢驗(pairedt-testfordependentsamples)的基本思路:首先計算出各對差值 d的均數(shù),當2種處理結果無差別或某種處理不起作用時,理論上差值的總體均數(shù) 應該為 0,故可將配對設計-- 92精品文檔資料的 t 檢驗視為樣本均數(shù) 與總體均數(shù)的比較。-- 93精品文檔4.2)-- 94精品文檔式中 為樣本中各對差值 d 的均數(shù),為樣本差值的標準差,n 為對子數(shù),為自由度。-- 95精品文檔先列表求差值 d和1)建立假設,確定檢驗水準。H0:μd=0 H1:μd≠0=0.052)計算統(tǒng)計量。已知,n=,∑d=,∑ =-- 96精品文檔3)確定P值,做出推斷結論。-- 97精品文檔按v=n-1,查t界值表,得 P>0.05(或P<0.05),按α檢驗水準,不拒絕 H0(或拒絕H0,接受H1),即根據(jù)本資料尚不能(可以)認為?。3,成組設計資料兩樣本均數(shù)比較的 t檢驗(two-samplet-testforindependentsamples):在臨床醫(yī)學研究中,進行配對設計比較困難,一般分別從 2個總體中隨機抽樣,進行成組設計兩樣本均數(shù)的比較,目的是推斷個總體均數(shù)是否相等。所比較的兩個樣本含量最好相等,此時抽樣誤差最小。(4.3)可為t,u檢驗1)建立假設,確定檢驗水準。-- 98精品文檔: μ 1= μ 2:μ1≠μ2=0.052)計算統(tǒng)計量。-- 99精品文檔已知,n1=,∑X1=,∑ =,n2=,∑X2=,∑=-- 100精品文檔1= ∑ X1/n1= ,2=∑X2/n2=-- 101精品文檔( 已 知 , n1= , 1= , s1=, n2= ,2=,s2=-- 102精品文檔3)確定P值,做出推斷結論。按v=n1+n2-2,查t界值表,得 P>0.05(或P<0.05),按α檢驗水準,不拒絕 H0(或拒絕H0,接受H1),可以認為?的差別無(或有)統(tǒng)計學意義。檢驗u檢驗(u-test,或Z-test):用檢驗統(tǒng)計量 u來命名的。用于樣本含量 n足夠大(n>50),或n雖小但總體標準差 已知時的樣本均數(shù)與總體均數(shù)的比較、成組設計兩樣本均數(shù)的比較。1,單樣本 u檢驗(onesampleu-test):-- 103精品文檔(4.4)式 中 為 樣 本 均 數(shù) ,為已知總體均數(shù), s為樣本標準差, n為樣本含量。-- 104精品文檔2,成組設計的兩樣本均數(shù)比較的 u檢驗(two-sampleu-testforindependentsamples):(4.5)-- 105精品文檔式 中 ,分 別 為 兩 樣 本 均 數(shù) ,為 兩 樣 本 均 數(shù) 差 值 的 標 準 誤 ,-- 106精品文檔、為 分 別 為 兩 樣 本 的 方 差 ,-- 107精品文檔、分別為兩樣本例數(shù)。標準正態(tài)分布( u分布)與 t分布有何異同?答:相同點:t分布和標準正態(tài)分布( u分布)都是以 0為中心的正態(tài)分布。標準正態(tài)分布是 t分布的特例(自由度是無限大時)。不同點: t分布為抽樣分布, u分布為理論分布; t分布比標準正態(tài)分布的峰值低,且尾部翹得更高; t分布受自由度大小的影響,隨著自由度的增大,逐漸趨近于標準正態(tài)分布; t分布有無數(shù)條曲線,而 u分布只有唯一一條曲線。方差分析-- 108精品文檔1,方差分析的基本思想:按研究目的和設計類型,將總變異中的離均差平方和 SS和自由度分別分解成相應的若干部分,然后求得各相應部分的變異;由于其中的組內(或誤差)變異主要反映個體差異或抽樣誤差,其他各部分的變異與之比較得出統(tǒng)計量F值,根據(jù)F值的大小確定P值,并做出推斷。2,方差分析的優(yōu)點:1)不受比較組數(shù)的限制,可比較多組均數(shù)2)可同時分析多個因素的作用3)可分析同類間的交互作用3,方差分析的應用范圍:1)2個或多個樣本均數(shù)間的比較2)分析2個或多個因素間的交互作用3)回歸方程的線性假設檢驗4)多元線性回歸分析中偏回歸系數(shù)的假設檢驗5)兩樣本方差齊性檢驗完全隨機設計的方差分析:-- 109精品文檔是將總變異中的離均差平方和 SS和自由度 分別分 解 成 組 間 和 組 內 兩 部 分 ,SS /和-- 110精品文檔SS /SS分 別 為 組 間 變 異-- 111精品文檔( MS ) 和 組 內 變 異(MS ),兩者之比即為統(tǒng)計量 F。(1)總離均差平方和及自由度:-- 112精品文檔SS =(5.2)-- 113精品文檔=(5.3)(2)組間離均差平方和、自由度和均方:-- 114精品文檔SS =(5.4)-- 115精品文檔=(組數(shù)-1)(5.5)-- 116精品文檔MS =(5.6)(3)組內離均差平方和、自由度和均方:-- 117精品文檔SS =SS-SS(5.7)-- 118精品文檔=N-k(樣本量-組數(shù))(5.8)-- 119精品文檔MS =(5.9)當方差分析的推斷結果為拒絕 H0,接受 H1,各總體均數(shù)不同或不全相同時,應對均數(shù)進一步兩兩比較,即多重比較(multiplecomparisons) ??捎胵檢驗進行分析:-- 120精品文檔5.14)-- 121精品文檔式中 為方差分析的組內均方, 若為兩因素或兩因素以上的方差分析,則為誤差項均方 ;-- 122精品文檔和分別為兩樣本的樣本含量。配伍組設計資料的方差分析配伍組設計亦稱隨機區(qū)組設計( randomizedblockdesign),其多個樣本均數(shù)比較可用無重復數(shù)據(jù)的兩因素方差分析(two-wayANOVA)。2個因素是指主要的研究因素和配伍組因素。兩因素的方差分析是把總變異中的離均差平方和與自由度分別分解成處理組間、配伍組間和誤差三部分。計算公式如下:變異來源 離均差平方和 自 由 度 均方MS F-- 123精品文檔總-C處理組間k-1配伍組間b-1誤差 SS (k-1)(b-1)-SS-SS-- 124精品文檔,為配伍組數(shù)二,分類變量統(tǒng)計描述 常用相對數(shù),即率,構成比,和相對比對分類資料進行統(tǒng)計描述1,率(rate):率又稱頻率指標,它說明某現(xiàn)象發(fā)生的頻率或強度-- 125精品文檔率=2,構成比(proportion):又稱構成指標,它說明一事物內部各組成部分所占的比重或分布,常以百分數(shù)表示構成比=3,相對比(relativeratio)亦稱比,是 A,B2個有關指標之比,說明 A和B的若干倍或百分之幾,是相對數(shù)的最簡單形式。 A,B性質可相同可不同。-- 126精品文檔相對比=,應用相對數(shù)時應注意的事項:(一) 計算相對數(shù)的分母不宜過小。(二) 分析時不能以構成比代替率。(三) 對觀察單位數(shù)不等的幾個率,不能直接用相加求其平均率。(四) 資料的對比應注意可比性。(五) 對樣本率(或構成比)的比較應遵循隨機抽樣,要做假設檢驗。(六) 區(qū)別清分子分母。5,率的u檢驗1) , 樣 本 率 與 總 體 率 比 較 : 目 的 是 推 斷 樣 本 率 所 代 表 的 總 體 率與 某 已 知 總 體 率-- 127精品文檔是否相等。根據(jù)資料的不同情況,可以采用不同的假設檢驗方法:①若 很小,可用Poisson分布原理做檢驗;②若 不太靠近 0或1時,可用二項分布原理-- 128精品文檔做檢驗;當樣本含量 n 足夠大時,或 且,二項分布逼近正態(tài)分布,可用 u檢驗計算其樣本檢驗統(tǒng)計量。-- 129精品文檔(6.1)式中p為樣本率, 為已知總體率(常為理論值或標準值),n為樣本含量。2),兩樣本率比較:兩個樣本率作比較的目的是推斷兩個樣本各自代表的兩總體率是否相等,當兩個樣本滿足正態(tài)近似條件且樣本含量較大時,可用 u檢驗,其公式:-- 130精品文檔(6.2)式 中 、分 別 為 兩 個 樣 本 率 ,-- 131精品文檔、分 別 為 兩 樣 本 含 量 ,為 兩 個 樣 本 率 之 差 的 標 準 誤 ,-- 132精品文檔為 合 并 陽 性 率 ,,-- 133精品文檔、為兩個樣本陽性例數(shù)。四格表資料的 檢驗-- 134精品文檔適用于分類變量資料中推斷兩個或多個總體率(或構成比)之間有無差別,兩個分類指標之間有無相關關系的檢驗以及檢驗頻數(shù)分布的擬合優(yōu)度。(6.3)-- 135精品文檔式 中 A 代 表 實 際 頻 數(shù) , T 代 表 理 論 頻 數(shù) 。 格 子 理 論 頻 數(shù)可用同樣方法求得,其計算公式為:(6.4)-- 136精品文檔(6.5)四格表資料的專用公式: (6.6)式中a、b、c、d分別為四格表的實際頻數(shù) =a+b+c+d。-- 137精品文檔四格表的 值的校正。①當所有 T>5,n>40時用上述公式;②當有1<T<5,且n>40時,需進行連續(xù)性校正:(6.7)-- 138精品文檔(6.7)③ 或n<40時,需用四格表資料的確切概率法。-- 139精品文檔行×列表資料的 檢驗。(6.9)-- 140精品文檔式中 n是總例數(shù),A是每個格子的實際頻數(shù), ,分別為某格子對應的行合計和列合行×列表 檢驗注意事項-- 141精品文檔(1)X2檢驗要求理論頻數(shù)不宜太小,否則將導致偏性。一般認為行 X列表資料中不宜有 1/5以上的格子理論數(shù)小于5,或有一個格子理論數(shù)小于1。處理方法:最好的方法是增加樣本例數(shù),以增大理論頻數(shù);且精確概率法;進行合理的合并;刪除理論頻數(shù)太小的行和列,后兩種方法將損失一定的信息并影響樣本的隨機性。(2)單向有序列行 X列表的統(tǒng)計處理:當效應按強弱分為若干個級別,試驗結果整理為單向有序行列表,在比較各處理組的效應有無差別時,宜用秩和檢驗或 Ridit分析。(3)當多個樣本率比較的 檢驗。結論為拒絕 H0,只能認為各總體率或總體構成比之間總的說來有差別,但不能說明它們彼此間都有差別,或某兩者間有差別。若要進一步解決此問題,可用卡方分割法。配對四格表資料的卡方檢驗 :(一)關聯(lián)性分析:(1)建立假設檢驗,確定檢驗水準。H0:兩種方法的檢驗結果無關系H1:兩種方法的檢驗結果有關系=0.05(2)計算統(tǒng)計量 X2值。n>=40,T>=5,-- 142精品文檔n>=40,1<T<5,③n<40或T<1,四格表確切概率法。(3)確定P值,做出推斷結論。X2>3.84,P<0.05,按α=0.05檢驗水準,拒絕 H0,接受H1,可以認為兩種方法的檢驗結果有關系。(二)差別性檢驗:(1)建立假設檢驗,確定檢驗水準。H0:兩總體的 B=CH1:兩總體的 B不等于C=0.05(2)計算統(tǒng)計量 X2值。-- 143精品文檔b+c>40時:b+c<40時,(3)確定P值,做出推斷結論。X2>3.84,P<0.05,按α=0.05檢驗水準,拒絕 H0,接受H1,可以認為兩種方法的檢驗結果有差別。X20.05(1)=3.84,X20.005(1)=7.88)非參數(shù)檢驗參數(shù)檢驗和非參數(shù)檢驗的優(yōu)缺點:參數(shù)檢驗的優(yōu)點是對資料的分析利用充分, 統(tǒng)計分析的效率高;缺點是對資料的要求高, 適用范圍有限。非參數(shù)檢驗的優(yōu)點:( 1)適用范圍廣,對變量的類型和分布無特殊要求,不受總體分布的限制;( 2)對數(shù)據(jù)的要求不嚴,對某些指標不便準確測定的資料也可應用;( 3)方法簡便,易于理解和掌握。缺點是如果對符合參數(shù)檢驗的資料用了非參數(shù)檢驗,因不能充分利用資料提供的信息,會使檢驗效能低于非參數(shù)檢驗;若要使檢驗效能相同,往往需要更大的樣本含量。配對設計的符號秩和檢驗Wilcoxon符號秩和檢驗(Wilcoxonsignedranktest)是推斷其差值是否來自中位數(shù)為零的總體的方法,可用于配對設計差值的比較和單一樣本與總體中位數(shù)的比較。-- 144精品文檔(一)基本思想 其假設 是差值的總體中位數(shù)等于0,備擇假設 是差別的總體中位數(shù)不等于 0,如果差-- 145精品文檔別 太大 , 就拒 絕 ; 反 之 , 不拒 絕。(二)方法步驟:1,建立檢驗假設,確定檢驗水準;2,計算檢驗統(tǒng)計量T值:a,求各對的差值;b,編秩;c,求秩和,確定統(tǒng)計量T;3,確定P值,做出推斷結論。完全隨機設計兩樣本比較的秩和檢驗亦稱兩個樣本比較的秩和檢驗,利用兩樣本觀察值的秩和來推斷樣本分別代表的總體分布是否相同。成組設計多樣本比較的秩和檢驗 ,利用多個樣本的秩和來推斷各樣本分別代表的總體的分布有無差別。配伍組設計的秩和檢驗 M檢驗秩和檢驗步驟:建立檢驗假設,確定檢驗水準。H0:?和?的?總體分布相同。H1:?和?的?總體分布不同。計算統(tǒng)計量T值。1)編秩 將2組數(shù)據(jù)由小到大統(tǒng)一編秩,相同數(shù)據(jù)取平均秩次。-- 146精品文檔2)求秩和,確定統(tǒng)計量T2組秩次分別相加,若兩組例數(shù)相等,則任取一組的秩和為統(tǒng)計量;若兩組例數(shù)不等,則以樣本例數(shù)較小者對應的秩和為統(tǒng)計量。3)確定P值,做出推斷結論。查T界值表(成組設計用),若 T值在界值范圍內, P>0.05,按α=0.05

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論