程琮獲得院一等獎?wù)n件醫(yī)學(xué)統(tǒng)計學(xué)好用_第1頁
程琮獲得院一等獎?wù)n件醫(yī)學(xué)統(tǒng)計學(xué)好用_第2頁
程琮獲得院一等獎?wù)n件醫(yī)學(xué)統(tǒng)計學(xué)好用_第3頁
程琮獲得院一等獎?wù)n件醫(yī)學(xué)統(tǒng)計學(xué)好用_第4頁
程琮獲得院一等獎?wù)n件醫(yī)學(xué)統(tǒng)計學(xué)好用_第5頁
已閱讀5頁,還剩662頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、程琮獲得院一等獎?wù)n件醫(yī)學(xué)統(tǒng)計學(xué)好用The teaching planfor medical studentsProfessor Cheng CongDept. of Preventive Medicine Taishan Medical College2 預(yù)防醫(yī)學(xué)教授,碩士生導(dǎo)師。男,1959年6月出生。漢族,無黨派。1982年12月,山東醫(yī)學(xué)院公共衛(wèi)生專業(yè)五年本科畢業(yè),獲醫(yī)學(xué)學(xué)士學(xué)位。1994年7月,上海醫(yī)科大學(xué)公共衛(wèi)生學(xué)院研究生畢業(yè),獲醫(yī)學(xué)碩士學(xué)位。2003年12月晉升教授?,F(xiàn)任預(yù)防醫(yī)學(xué)教研室副主任。主要從事醫(yī)學(xué)統(tǒng)計學(xué)、預(yù)防醫(yī)學(xué),醫(yī)學(xué)人口統(tǒng)計學(xué)等課程的教學(xué)及科研工作,每年聽課學(xué)生500-8

2、00人。自2000年起連續(xù)六年,為碩士研究生開設(shè)醫(yī)學(xué)統(tǒng)計學(xué)、SPSS統(tǒng)計分析簡明教程、衛(wèi)生經(jīng)濟學(xué)等課程,同時指導(dǎo)研究生的科研設(shè)計、開題報告及科研資料的統(tǒng)計處理與分析。發(fā)表醫(yī)學(xué)統(tǒng)計學(xué)及預(yù)防醫(yī)學(xué)的科研論文30多篇。代表作有“鋅對乳癌細胞生長、增殖與基因表達的影響”,“行列相關(guān)的測度” 等。主編、副主編各類教材及專著8部,代表作有醫(yī)學(xué)統(tǒng)計學(xué)、SPSS統(tǒng)計分析簡明教程獲得院級科研論文及科技進步獎8項,院第四屆教學(xué)能手比賽二等獎一項,院教學(xué)評建先進工作者一項。獲2004年泰山醫(yī)學(xué)院首屆十大教學(xué)名師獎。 程琮教授簡介3醫(yī)學(xué)統(tǒng)計學(xué)總目錄 第1章緒論 第2章定量資料統(tǒng)計描述 第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗

3、 第4章方差分析 第5章定性資料的統(tǒng)計描述 第6章總體率的區(qū)間估計和假設(shè)檢驗 第7章二項分布與泊松分布 第8章秩和檢驗 第9章直線相關(guān)與回歸 第10章實驗設(shè)計 第11章調(diào)查設(shè)計 第12章統(tǒng)計表與統(tǒng)計圖4第1章緒論 目錄 第五節(jié) 學(xué)習(xí)統(tǒng)計學(xué)應(yīng)注意的幾個問題 第二節(jié) 統(tǒng)計工作的基本步驟 第三節(jié) 統(tǒng)計資料的類型 第四節(jié) 統(tǒng)計學(xué)中的幾個基本概念 第一節(jié) 醫(yī)學(xué)統(tǒng)計學(xué)的定義和內(nèi)容5第一章 緒論第一節(jié) 醫(yī)學(xué)統(tǒng)計學(xué)的定義和內(nèi)容 醫(yī)學(xué)統(tǒng)計學(xué)(medical statistics) -是以醫(yī)學(xué)理論為指導(dǎo),運用數(shù)理統(tǒng)計學(xué)的原理和方法研究醫(yī)學(xué)資料的搜集、整理與分析,從而掌握事物內(nèi)在客觀規(guī)律的一門學(xué)科。 6醫(yī)學(xué)研究的對

4、象-主要是人以及與其健康有關(guān)的各種影響因素。醫(yī)學(xué)統(tǒng)計學(xué)的主要內(nèi)容 :1.統(tǒng)計設(shè)計 包括實驗設(shè)計和調(diào)查設(shè)計,它可以合理地、科學(xué)地安排實驗和調(diào)查工作,使之能較少地花費人力、物力和時間,取得較滿意和可靠的結(jié)果。2.資料的統(tǒng)計描述和總體指標的估計 通過計算各種統(tǒng)計指標和統(tǒng)計圖表來描述資料的集中趨勢、離散趨勢和分布特征況(如正態(tài)分布或偏態(tài)分布);利用樣本指標來估計總體指標的大小。 73.假設(shè)檢驗 是通過統(tǒng)計檢驗方法(如t檢驗、u檢驗、F檢驗、卡方檢驗、秩和檢驗等)來推斷兩組或多組統(tǒng)計指標的差異是抽樣誤差造成的還是有本質(zhì)的差別。4.相關(guān)與回歸 醫(yī)學(xué)中存在許多相互聯(lián)系、相互制約的現(xiàn)象。如兒童的身高與體重、胸

5、圍與肺活量、血糖與尿糖等,都需要利用相關(guān)與回歸來分析。8 5.多因素分析 如多元回歸、判別分析、聚類分析、正交設(shè)計分析、主成分分析、因子分析、logistic回歸、Cox比例風(fēng)險回歸等,都是分析醫(yī)學(xué)中多因素有效的方法(本書不涉及,請參考有關(guān)統(tǒng)計書籍)。這些方法計算復(fù)雜,大部分需借助計算機來完成。 6.健康統(tǒng)計 研究人群健康的指標與統(tǒng)計方法,除了用上述的某些方法外,他還有其特有的方法,如壽命表、生存分析、死因分析、人口預(yù)測等方法9醫(yī)學(xué)統(tǒng)計工作可分為四個步驟:統(tǒng)計設(shè)計、搜集資料、整理資料和分析資料。這四個步驟密切聯(lián)系,缺一不可,任何一個步驟的缺陷和失誤,都會影響統(tǒng)計結(jié)果的正確性。第二節(jié) 統(tǒng)計工作的

6、基本步驟 10設(shè)計(design)是統(tǒng)計工作的第一步,也是關(guān)鍵的一步,是對統(tǒng)計工作全過程的設(shè)想和計劃安排。 統(tǒng)計設(shè)計就是根據(jù)研究目的確定試驗因素、受試對象和觀察指標,并在現(xiàn)有的客觀條件下決定用什么方式和方法來獲取原始資料,并對原始資料如何進行整理,以及整理后的資料應(yīng)該計算什么統(tǒng)計指標和統(tǒng)計分析的預(yù)期結(jié)果如何等。 一、統(tǒng)計設(shè)計 11搜集資料(collection of date) 是根據(jù)設(shè)計的要求,獲取準確可靠的原始資料,是統(tǒng)計分析結(jié)果可靠的重要保證。醫(yī)學(xué)統(tǒng)計資料的來源主要有以下三個方面:1.統(tǒng)計報表 統(tǒng)計報表是醫(yī)療衛(wèi)生機構(gòu)根據(jù)國家規(guī)定的報告制度,定期逐級上報的有關(guān)報表。如法定傳染病報表、出生死

7、亡報表、醫(yī)院工作報表等,報表要完整、準確、及時。 二、搜集資料122.醫(yī)療衛(wèi)生工作記錄 如病歷、醫(yī)學(xué)檢查記錄、衛(wèi)生監(jiān)測記錄等。 3.專題調(diào)查或?qū)嶒炑芯?它是根據(jù)研究目的選定的專題調(diào)查或?qū)嶒炑芯?,搜集資料有明確的目的與針對性。它是醫(yī)學(xué)科研資料的主要來源。13 整理資料(sorting data)的目的就是將搜集到的原始資料進行反復(fù)核對和認真檢查,糾正錯誤,分類匯總,使其系統(tǒng)化、條理化,便于進一步的計算和分析。整理資料的過程如下:1.審核:認真檢查核對,保證資料的準確性和完整性。 2.分組:歸納分組,分組方法有兩種: 質(zhì)量分組,即將觀察單位按其類別或?qū)傩苑纸M,如按性別、職業(yè)、陽性和陰性等分組。數(shù)量

8、分組,即將觀察單位按其數(shù)值的大小分組,如按年齡的大小、藥物劑量的大小等分組。三、整理資料 143.匯總: 分組后的資料要按照設(shè)計的要求進行匯總,整理成統(tǒng)計表。原始資料較少時用手工匯總,當(dāng)原始資料較多時,可使用計算機匯總。四、分析資料 分析資料(analysis of data) 是根據(jù)設(shè)計的要求,對整理后的數(shù)據(jù)進行統(tǒng)計學(xué)分析,結(jié)合專業(yè)知識,作出科學(xué)合理的解釋。 151.統(tǒng)計描述(descriptive statistics) 將計算出的統(tǒng)計指標與統(tǒng)計表、統(tǒng)計圖相結(jié)合,全面描述資料的數(shù)量特征及分布規(guī)律。 2.統(tǒng)計推斷(inferential statistics) 使用樣本信息推斷總體特征。通過

9、樣本統(tǒng)計量進行總體參數(shù)的估計和假設(shè)檢驗,以達到了解總體的數(shù)量特征及其分布規(guī)律,才是最終的研究目的。 統(tǒng)計分析包括以下兩大內(nèi)容: 16醫(yī)學(xué)統(tǒng)計資料按研究指標的性質(zhì)一般分為定量資料、定性資料和等級資料三大類。一、定量資料定量資料(quantitative data) 亦稱計量資料(measurement data),是用定量的方法測定觀察單位(個體)某項指標數(shù)值的大小,所得的資料稱定量資料。如身高()、體重()、脈搏(次/分)、血壓(kPa)等為數(shù)值變量,其組成的資料為定量資料。 第三節(jié) 統(tǒng)計資料的類型 17 定性資料(qualitative data) 亦稱計數(shù)資料(enumeration da

10、ta)或分類資料(categorical data),是將觀察單位按某種屬性或類別分組,清點各組的觀察單位數(shù),所得的資料稱定性資料。 定性資料的觀察指標為分類變量(categorical variable)。如人的性別按男、女分組;化驗結(jié)果按陽性、陰性分組;動物實驗按生存、死亡分組;調(diào)查某人群的血型按A、B、O、AB分組等,觀察單位出現(xiàn)的結(jié)果為分類變量,分類變量沒有量的差別,只有質(zhì)的不同,其組成的資料為定性資料。二、定性資料 18三、等級資料等級資料(ranked data)亦稱有序分類資料(ordinal categorical data),是將觀察單位按屬性的等級分組,清點各組的觀察單位數(shù)

11、,所得的資料為等級資料。如治療結(jié)果分為治愈、顯效、好轉(zhuǎn)、無效四個等級。 19 根據(jù)需要,各類變量可以互相轉(zhuǎn)化。若按貧血的診斷標準將血紅蛋白分為四個等級:重度貧血、中度貧血、輕度貧血、正常,可按等級資料處理。有時亦可將定性資料或等級資料數(shù)量化,如將等級資料的治療結(jié)果賦以分值,分別用0、1、2等表示,則可按定量資料處理。 如調(diào)查某人群的尿糖的情況,以人為觀察單位,結(jié)果可分、五個等級。 20同質(zhì)(homogeneity) 是指觀察單位或研究個體間被研究指標的主要影響因素相同或基本相同。如研究兒童的生長發(fā)育,同性別、同年齡、同地區(qū)、同民族、健康的兒童即為同質(zhì)兒童。變異(variation) 由于生物個

12、體的各種指標所受影響因素極為復(fù)雜,同質(zhì)的個體間各種指標存在差異,這種差異稱為變異。如同質(zhì)的兒童身高、體重、血壓、脈搏等指標會有一定的差別。第四節(jié) 統(tǒng)計學(xué)中的幾個基本概念一、同質(zhì)與變異21二、總體與樣本樣本(sample):是從總體中隨機抽取的部分觀察單位變量值的集合。樣本的例數(shù)稱為樣本含量(sample size)。注意:1??傮w是相對的,總體的大小是根據(jù)研究目的而確定的。2。樣本應(yīng)有代表性,即應(yīng)該隨機抽樣并有足夠的樣本含量。 22圖示:總體與樣本populationsample2sample1sample3sample4 sample523三、參數(shù)與統(tǒng)計量參數(shù)(parameter):由總體計

13、算或得到的統(tǒng)計指標稱為參數(shù)??傮w參數(shù)具有很重要的參考價值。如總體均數(shù),總體標準差等。統(tǒng)計量(statistic):由樣本計算的指標稱為統(tǒng)計量。如樣本均數(shù),樣本標準差s等。注意:一般不容易得到參數(shù),而容易獲得樣本統(tǒng)計量。24四、抽樣誤差抽樣誤差(sample error): 由于隨機抽樣所引起的樣本統(tǒng)計量與總體參數(shù)之間的差異以及樣本統(tǒng)計量之間的差別稱為抽樣誤差。如樣本均數(shù)與總體均數(shù)之間的差別,樣本率與總體率的差別等。注意:抽樣誤差是不可避免的。無論抽樣抽得多么好,也會存在抽樣誤差。25五、概率概率(probability):是描述隨機事件發(fā)生可能性大小的量值。用英文大寫字母P來表示。概率的取值范

14、圍在01之間。當(dāng)P0時,稱為不可能事件;當(dāng)P1時,稱為必然事件。小概率事件:統(tǒng)計學(xué)上一般把P0.05或P0.01的事件稱為小概率事件。小概率原理:小概率事件在一次試驗中幾乎不可能發(fā)生。利用該原理可對科研資料進行假設(shè)檢驗。26第五節(jié) 學(xué)習(xí)醫(yī)學(xué)統(tǒng)計學(xué)應(yīng)注意的問題 1.重點掌握醫(yī)學(xué)統(tǒng)計學(xué)的基本知識、基本技能、基本概念和基本方法,掌握使用范圍和注意事項。2.要培養(yǎng)科學(xué)的統(tǒng)計思維方法,提高分析問題、解決問題的能力。 3.掌握調(diào)查設(shè)計和實驗設(shè)計的原則,培養(yǎng)搜集、整理、分析統(tǒng)計資料的系統(tǒng)工作能力。 27課后作業(yè) 列舉出計量資料、分類資料、等級資料各10個實例。 列舉出可能事件、必然事件、不可能事件及小概率事

15、件各10個。 認真復(fù)習(xí)本章已學(xué)過的基本概念23遍。28 Best Wishes to All of You! Thank You for Listening!THE END 29醫(yī)學(xué)本科生用主講 程 琮泰山醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室醫(yī)學(xué)統(tǒng)計學(xué)30The teaching planfor medical studentsProfessor Cheng CongDept. of Preventive Medicine Taishan Medical College31第2章定量資料的統(tǒng)計描述 目錄 第二節(jié) 集中趨勢的描述 第三節(jié) 離散趨勢的描述 第四節(jié) 正態(tài)分布 第一節(jié) 頻數(shù)分布表32統(tǒng)計描述:是用統(tǒng)計

16、圖表、統(tǒng)計指標來描述資料的分布規(guī)律及其數(shù)量特征。頻數(shù)分布表(frequency distribution table):主要由組段和頻數(shù)兩部分組成表格。第一節(jié) 頻數(shù)分布表第二章 定量資料的統(tǒng)計描述33二、頻數(shù)分布表的編制 編制步驟 :1. 計算全距 (range): 一組變量值最大值和最小值之差稱為全距(range),亦稱極差,常用R表示。 2. 確定組距(class interval): 組距用i表示; 3. 劃分組段: 每個組段的起點稱組下限,終點稱組上限。一般分為815組。 ;4. 統(tǒng)計頻數(shù): 將所有變量值通過劃記逐個歸入相應(yīng)組段 ;5.頻率與累計頻率: 將各組的頻數(shù)除以n所得的比值被稱

17、為頻率。累計頻率等于累計頻數(shù)除以總例數(shù)。 34表2-2 某年某市120名12歲健康男孩身高(cm)的頻數(shù)分布 身高組段 (1) 頻數(shù) (2)頻率(%) (3)累計頻數(shù) (4)累計頻率 (%) (5)12510.83 10.8312943.33 54.17133108.34 1512.50合計120100.003536二、頻數(shù)分布表的用途 1.揭示資料的分布類型 2.觀察資料的集中趨勢和離散趨勢 3.便于發(fā)現(xiàn)某些特大或特小的可疑值 4.便于進一步計算統(tǒng)計指標和作統(tǒng)計處理 3738第二節(jié) 集中趨勢的描述 集中趨勢 :代表一組同質(zhì)變量值的集中趨勢 或平均水平。 常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)和中位

18、數(shù)。另外不常用的有:眾數(shù),調(diào)和平均數(shù)和調(diào)整均數(shù)等。39一、算術(shù)均數(shù)算術(shù)均數(shù) (arithmetic mean): 簡稱均數(shù)。適用條件:對稱分布或近似對稱分布的資料。 習(xí)慣上以希臘字母表示總體均數(shù)(population mean),以英文字母表示樣本均數(shù)(sample mean)401. 直接法:用于觀察值個數(shù)不多時 計算方法41(weighting method):用于變量值個數(shù) 較多時。 注意:權(quán)數(shù)即頻數(shù)f,為權(quán)重權(quán)衡之意。42 身高 (1) 組中值X (2) 頻數(shù)f (3) fX(4)=(2)(3) fX2(5)=(2)(4) 1251271127161291291314524686441

19、33135101350182250合計 120 17168 2460040 表2-4 120名12歲健康男孩身高(cm)均數(shù)和標準差加權(quán)法計算表 4344cm。 計算結(jié)果45幾何均數(shù)(geometric mean,簡記為):表示其平均水平。 適用條件:對于變量值呈倍數(shù)關(guān)系或呈對數(shù)正態(tài)分布(正偏態(tài)分布),如抗體效價及抗體滴度,某些傳染病的潛伏期,細菌計數(shù)等。計算公式:有直接法和加權(quán)法。 二、幾何均數(shù) 461.直接法: 用于變量值的個數(shù)n較少時 47直接法計算實例482.加權(quán)法 : 用于資料中相同變量值的個數(shù)f(即頻數(shù))較多時。 49 抗體滴度 (1)頻數(shù)f (2)滴度倒數(shù)X (3) lgX (4

20、) flgX (5)=(2)(4) 1:4240.60201.20401:8680.90315.41861:167161.20418.4287合計 50 89.1045 表2-5 50名兒童麻疹疫苗接種后血凝抑制抗體滴度幾何均數(shù)計算表505150名兒童麻疹疫苗接種后平均血凝抑制抗體滴度為。 計算結(jié)果:將有關(guān)已知數(shù)據(jù)代入公式有52變量值中不能有0;不能同時有正值和負值;若全是負值,計算時可先把負號去掉,得出結(jié)果后再加上負號。計算幾何均數(shù)注意事項:53中位數(shù) 定義:將一組變量值從小到大按順序排列,位次居中的變量值稱為中位數(shù)(median,簡記為M)。適用條件:變量值中出現(xiàn)個別特小或特大的數(shù)值;資料

21、的分布呈明顯偏態(tài),即大部分的變量值偏向一側(cè);變量值分布一端或兩端無確定數(shù)值,只有小于或大于某個數(shù)值;資料的分布不清。 三、中位數(shù)及百分位數(shù) 54定義:百分位數(shù)(percentile)是一種位置指標,以Px表示。百分位數(shù)是將頻數(shù)等分為一百的分位數(shù)。一組觀察值從小到大按順序排列,理論上有x%的變量值比Px小,有(100-x)%的變量值比Px大。故P50分位數(shù)也就是中位數(shù),即P50=M 。 百分位數(shù) 55描述一組資料在某百分位置上的水平;用于確定正常值范圍;計算四分位數(shù)間距。百分位數(shù)的應(yīng)用條件:56計算方法:有直接法和加權(quán)法1.直接法:用于例數(shù)較少時 n為奇數(shù)時 n為偶數(shù)時 572.頻數(shù)表法: 用于

22、例數(shù)較多時 中位數(shù)百分位數(shù)58 潛伏期(小時) (1)頻數(shù)f (2)累計頻數(shù) (3) 累計頻率() (4) 0171711.76 466343.412 3810169.9合計 145 表2-6 145例食物中毒病人潛伏期分布表 5960先找到包含Px的最小累計頻率;該累計頻率同行左邊的組段值為L;L同行右邊的頻數(shù)為fx(或fm);L前一行的累計頻數(shù)為fL;將上述已知條件代入公式計算Px或P50 。計算中位數(shù)及百分位數(shù)的步驟:61計算結(jié)果:62定義:用來說明變量值的離散程度或變異程度。注意:僅用集中趨勢尚不能完全反映一組數(shù)據(jù)的特征。故應(yīng)將集中趨勢和離散趨勢結(jié)合起來才能更好地反映一組數(shù)據(jù)的特征。常

23、用離散指標有:極差、四分位數(shù)間距、標準差、方差、變異系數(shù)。第三節(jié) 離散趨勢的描述 63甲組: 184 186 188 190 192乙組: 180 184 188 192 196兩組球員的平均身高都是188cm,但甲組球員身高比較集中,乙組球員身高比較分散。為了說明離散趨勢,就要用離散指標。 實例分析64極差 極差(range,簡記為R)亦稱全距,即一組變量值中最大值與最小值之差 。特點:計算簡單,不穩(wěn)定,不全面,易變化;可用于各種分布的資料。一、極差和四分位數(shù)間距 65四分位數(shù)間距 公式: Q= P75P25 特點:比極差穩(wěn)定,只反映中間兩端值的差異。 計算不太方便。可用于各種分布的資料。6

24、6二、方差和標準差 方差(variance) 總體方差 樣本方差 67自由度(degree of freedom)的概念n-1是自由度,用希臘小寫字母表示,讀作nju:。定義:在N維或N度空間中能夠自由選擇的維數(shù)或度數(shù)。例:ABC,共有n=3個元素,其中只能任選2個元素的值,故自由度n-1=3-1=2。 68方差的特點充分反映每個數(shù)據(jù)間的離散狀況,意義深刻;指標穩(wěn)定,應(yīng)用廣泛,但計算較為復(fù)雜,不易理解;方差的單位與原數(shù)據(jù)不同,有時使用時不太方便;在方差分析中應(yīng)用甚廣而極為重要。69(二)標準差(standard deviation) 總體標準差 樣本標準差 70牢記:離均差平方和展開式: 71

25、標準差的特點:意義同方差,是方差的開平方;標準差的單位與原數(shù)據(jù)相同,使用方便,意義深刻,應(yīng)用廣泛;故一般已作為醫(yī)學(xué)生物學(xué)領(lǐng)域中反映變異的標準,故稱標準差。72標準差的計算方法:可分為直接法和加權(quán)法。 2.加權(quán)法 73直接法:標準差計算實例:例2.12 例2.2中7名正常男子紅細胞數(shù)(1012/L)如下:4.67, 4.74, 4.77, 4.88,4.76, 4.72, 4.92,計算其標準差。 x22222222 74計算結(jié)果:75例2.13 對表2-4資料用加權(quán)法計算120名12歲健康男孩身高值的標準差。加權(quán)法:標準差計算實例:在表2-4中已算得fx=17168,fx2 =2460040,

26、 代入公式 76變異系數(shù)(coefficient of variation): 簡記為CV ;特征:變異系數(shù)為無量綱單位,可以比較不同單位指標間的變異度;變異系數(shù)消除了均數(shù)的大小對標準差的影響,所以可以比較兩均數(shù)相差較大時指標間的變異度。 三、變異系數(shù)77cmcmkg,kg。試比較身高與體重的變異程度。變異系數(shù) 計算實例78身高 體重變異系數(shù) 計算結(jié)果79第四節(jié) 正態(tài)分布一、正態(tài)分布的概念和特征 正態(tài)分布(normal distribution):也稱高斯分布,是醫(yī)學(xué)和生物學(xué)最常見的連續(xù)性分布。如身高、體重、紅細胞數(shù)、血紅蛋白等。 80圖2-1 120名12歲健康男孩身高的頻數(shù)分布81 正態(tài)分

27、布的函數(shù)和圖形正態(tài)分布的密度函數(shù),即正態(tài)曲線的方程為:82圖2-2 頻數(shù)分布逐漸接近正態(tài)分布示意 83為了應(yīng)用方便,常按公式(2.19)作變量變換 u值稱為標準正態(tài)變量或標準正態(tài)離差,有的參考書也將u值稱為z值。 84這樣將正態(tài)分布變換為標準正態(tài)分布(standard normal distribution) 85圖2-3 正態(tài)分布的面積與縱高 86正態(tài)分布的特征 1. 集中性 正態(tài)曲線的高峰位于正中央, 即均數(shù)所在的位置。對稱性 正態(tài)曲線以均數(shù)為中心,左右對稱, 3. 正態(tài)分布有兩個參數(shù),即均數(shù)和標準差。 4. 正態(tài)曲線下面積有一定的分布規(guī)律 87圖2-4 不同標準差的正態(tài)分布示意 88二、

28、正態(tài)曲線下面積的分布規(guī)律 89標準正態(tài)分布表(u值表) 標準正態(tài)分布曲線下的面積,由此表可查出曲線下某區(qū)間的面積。查表時應(yīng)注意:表中曲線下面積為-到u 的下側(cè)累計面積;當(dāng)已知、和X時,先按公式(2.19)求得u值,再查表;當(dāng)和未知時,并且樣本例數(shù)在100例以上,常用樣本均數(shù)和標準差S分別代替和 ,按公式(2.19)求得u值;曲線下橫軸上的總面積為100%或1 90 前例2.1中,某年某市120名12歲健康男孩身高,已知均數(shù)=143.07cm,標準差S=5.70cm,估計該地12歲健康男孩身高在135cm以下者占該地12歲男孩總數(shù)的百分數(shù);估計身高界于135cm150cm范圍內(nèi)12歲男孩的比例;

29、分別求出均數(shù)1SSS范圍內(nèi)12歲男孩人數(shù)占該120名男孩總數(shù)的實際百分數(shù),說明與理論百分數(shù)是否接近。91根據(jù)題意,按公式(2.19)作u變換 92身高范圍所占面積 故估計該地12男孩身高在135cm以下者約占7.78; 身高界于135cm150cm范圍內(nèi)者約占81.10。 93三、正態(tài)分布的應(yīng)用 制定醫(yī)學(xué)參考值范圍 參考值范圍也稱為正常值范圍。醫(yī)學(xué)上常把絕大數(shù)正常人的某指標范圍稱為該指標的正常值范圍。這里的“絕大多數(shù)”可以是90、95、99,最常用的是95。質(zhì)量控制 常以均數(shù)2S作為上、下警戒值,以均數(shù)3S作為上、下控制值。 正態(tài)分布是很多統(tǒng)計方法的理論基礎(chǔ) 94THE END THANK Y

30、OU FOR LISTENING95本科生用醫(yī)學(xué)統(tǒng)計學(xué)教案主講 程 琮泰山醫(yī)學(xué)院預(yù)防醫(yī)學(xué)教研室96The teaching planfor medical studentsProfessor Cheng CongDept. of Preventive Medicine Taishan Medical College97第3章總體均數(shù)的區(qū)間估計和假設(shè)檢驗 目錄 第五節(jié) 均數(shù)的 u 檢驗 第二節(jié) t 分布 第三節(jié) 總體均數(shù)的區(qū)間估計 第四節(jié) 假設(shè)檢驗的意義和基本步驟 第一節(jié) 均數(shù)的抽樣誤差與標準誤 第六節(jié) 均數(shù)的 t 檢驗 第七節(jié)兩個方差的齊性檢驗和t檢驗 第八節(jié) 型錯誤和型錯誤 第九節(jié) 應(yīng)用假設(shè)

31、檢驗應(yīng)注意的問題98圖示:總體與樣本Populationsample2sample1sample3sample4 sample599一、標準誤的意義及其計算統(tǒng)計推斷(statistical inference) :根據(jù)樣本信息來推論總體特征。均數(shù)的抽樣誤差 :由抽樣引起的樣本均數(shù)與總體均數(shù)的差異稱為均數(shù)的抽樣誤差。 標準誤(standard error):反映均數(shù)抽樣誤差大小的指標。 第一節(jié) 均數(shù)的抽樣誤差與標準誤100已知:標準誤計算公式未知:101 實例:cmcm,按公式計算,則標準誤為:102 ;2.進行總體均數(shù)的區(qū)間估計; 3.進行均數(shù)的假設(shè)檢驗等 。二、標準誤的應(yīng)用 103正態(tài)變量X

32、采用u(X)/變換,則一般的正態(tài)分布N (,)即變換為標準正態(tài)分布N (0,1)。又因從正態(tài)總體抽取的樣本均數(shù)服從正態(tài)分布 N(, ),同樣可作正態(tài)變量的u變換,即第二節(jié) t 分布 一、t 分布的概念 104 實際工作中由于理論的標準誤往往未知,而用樣本的標準誤作為的估計值, 此時就不是u變換而是t變換了,即下式: 105t分布于1908年由英國統(tǒng)計學(xué)家以“Student”筆名發(fā)表,故又稱Student t 分布(Students t-distribution)。 106二、t分布曲線的特征 t分布曲線是單峰分布,以0為中心,左右兩側(cè)對稱,曲線的中間比標準正態(tài)曲線(u分布曲線)低,兩側(cè)翹得比標

33、準正態(tài)曲線略高。t分布曲線隨自由度而變化,當(dāng)樣本含量越?。▏栏竦卣f是自由度 =n-1越小),t分布與u分布差別越大;當(dāng)逐漸增大時,t分布逐漸逼近于u分布,當(dāng) =時,t分布就完全成正態(tài)分布 。t分布曲線是一簇曲線,而不是一條曲線。t分布下面積分布規(guī)律:查t分布表。107t 分布示意圖108t分布曲線下雙側(cè)或單側(cè)尾部合計面積我們常把自由度為的t分布曲線下雙側(cè)尾部合計面積或單側(cè)尾部面積為指定值時,則橫軸上相應(yīng)的t界值記為t,。如當(dāng) =20, =0.05時,記為t0.05, 20;當(dāng) =22, =0.01時,記為t0.01, 22。對于t, 值,可根據(jù)和值,查附表2,t界值表。109t分布是t檢驗的理

34、論基礎(chǔ)。由公式(3.4)可知,t值與樣本均數(shù)和總體均數(shù)之差成正比,與標準誤成反比 。在t分布中t值越大,其兩側(cè)或單側(cè)以外的面積所占曲線下總面積的比重就越小 ,說明在抽樣中獲得此t值以及更大t值的機會就越小,這種機會的大小是用概率P來表示的。t值越大,則P值越??;反之,t值越小,P值越大。根據(jù)上述的意義,在同一自由度下,t t ,則P ; 反之,tt,則P。110第三節(jié) 總體均數(shù)的區(qū)間估計 參數(shù)估計:用樣本指標(統(tǒng)計量)估計總體指標(參數(shù))稱為參數(shù)估計。估計總體均數(shù)的方法有兩種,即:點值估計(point estimation )區(qū)間估計(interval estimation)。111一、點值估

35、計 點值估計:是直接用樣本均數(shù)作為總體均數(shù)的估計值。此法計算簡便,但由于存在抽樣誤差,通過樣本均數(shù)不可能準確地估計出總體均數(shù)大小,也無法確知總體均數(shù)的可靠程度 。112二、區(qū)間估計 區(qū)間估計是按一定的概率(1-)估計包含總體均數(shù)可能的范圍,該范圍亦稱總體均數(shù)的可信區(qū)間(confidence interval,縮寫為CI)。1-稱為可信度,常取1-為0.95和0.99,即總體均數(shù)的95%可信區(qū)間和99%可信區(qū)間。1-(如95)可信區(qū)間的含義是:總體均數(shù)被包含在該區(qū)間內(nèi)的可能性是1-,即(95),沒有被包含的可能性為,即(5)。113總體均數(shù)的可信區(qū)間的計算 且n較小(n100),可用u檢驗。不同

36、的統(tǒng)計檢驗方法,可得到不同的統(tǒng)計量,如t 值和u值。1244.確定概率P值 P值是指在H0所規(guī)定的總體中作隨機抽樣,獲得等于及大于(或小于)現(xiàn)有統(tǒng)計量的概率。t t, ,則P ;t 。 1255.作出推斷結(jié)論 當(dāng)P時,表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有統(tǒng)計量的概率是小概率,根據(jù)小概率事件原理,現(xiàn)有樣本信息不支持H0,因而拒絕H0,結(jié)論為按所取檢驗水準拒絕H0,接受H1,即差異有統(tǒng)計學(xué)意義,如例3.3 可認為兩總體脈搏均數(shù)有差別;當(dāng)P時,表示在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有統(tǒng)計量的概率不是小概率,現(xiàn)有樣本信息還不能拒絕H0,結(jié)論為按所取檢驗水準不拒絕H0,即差異無統(tǒng)計意義,如例3.

37、3 尚不能認為兩總體脈搏均數(shù)有差別。126下結(jié)論時的注意點:P ,拒絕H0,不能認為H0肯定不成立,因為雖然在H0成立的條件下出現(xiàn)等于及大于現(xiàn)有統(tǒng)計量的概率雖小,但仍有可能出現(xiàn);同理,P ,不拒絕H0,更不能認為H0肯定成立。由此可見,假設(shè)檢驗的結(jié)論是具有概率性的,無論拒絕H0或不拒絕H0,都有可能發(fā)生錯誤,即第一類錯誤或第二類錯誤 127第五節(jié) 均數(shù)的u檢驗國外統(tǒng)計書籍及統(tǒng)計軟件亦稱為單樣本u檢驗(one sample u-test)。樣本均數(shù)與總體均數(shù)比較的u檢驗適用于:總體標準差已知的情況;樣本含量較大時,比如n100時。對于后者,是因為n較大,也較大,則t分布很接近u分布的緣故。 一、

38、樣本均數(shù)與總體均數(shù)比較的u檢驗128u 值的計算公式為:總體標準差已知時,不管n的大小??傮w標準差未知時,但n100時。129 某托兒所三年來測得2124月齡的47名男嬰平均體重11kg。查得近期全國九城市城區(qū)大量調(diào)查的同齡男嬰平均體重11.18kg,標準差為1.23kg。問該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平有無不同?(全國九城市的調(diào)查結(jié)果可作為總體指標) 實 例130(1)建立檢驗假設(shè) H0: 0 ,即該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平相同, 0.05(雙側(cè))H1: 0 ,即該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平不同。(2)計算u值 本例因總體標準差已知

39、,故可用u檢驗。本例n=47, 樣本均數(shù)=11, 總體均數(shù)=11.18,總體標準差=1.23, 代入公式(3.7)131(3)確定P值,作出推斷結(jié)論 查u界值表(附表2,t界值表中為一行),得u=1.96,0.05。按=0.05水準,不拒絕H0,差異無統(tǒng)計學(xué)意義。結(jié)論:可認為該托兒所男嬰的體重發(fā)育狀況與全國九城市的同期水平相同。 132二、兩樣本均數(shù)比較的u檢驗該檢驗也稱為獨立樣本u檢驗(independent sample u-test),適用于兩樣本含量較大(如n150且n250)時,u值可按下式計算:133 測得某地2024歲健康女子100人收縮壓均數(shù)為15.27kPa,標準差為1.16

40、kPa;又測得該地2024歲健康男子100人收縮壓均數(shù)為16.11kPa,標準差為1.41kPa。問該地2024歲健康女子和男子之間收縮壓均數(shù)有無差別? 實 例134(1)建立檢驗假設(shè) H0:1 2 ,即該地2024歲健康女子和男子之間收縮壓均數(shù)相同; H1: 12 ,即該地2024歲健康女子和男子之間收縮壓均數(shù)不同。 0.05(雙側(cè))(2)計算u值 本例 n1=100, 均數(shù)1=15.27, S1 n2=100, 均數(shù)2=16.11, S2135(3)確定P值,作出推斷結(jié)論 查u界值表(附表2,t界值表中為一行),得u=1.96,現(xiàn)uu=1.96,故P0.05。按水準 =0.05,拒絕H0,

41、接受H1,差異有統(tǒng)計學(xué)意義。結(jié)論:可認為該地2024歲健康人的收縮壓均數(shù)男性高于女性。 136第六節(jié) 均數(shù)的 t 檢驗 當(dāng)樣本含量較?。ㄈ鏽50)時,t分布和u分布有較大的出入,所以小樣本的樣本均數(shù)與總體均數(shù)的比較以及兩個樣本均數(shù)的比較要用t檢驗。t檢驗的適用條件:樣本來自正態(tài)總體或近似正態(tài)總體;兩樣本總體方差相等。 137一、樣本均數(shù)與總體均數(shù)比較的t檢驗 亦稱為單樣本t檢驗(one sample t-test)。即樣本均數(shù)代表的未知總體均數(shù)與已知的總體均數(shù)(一般為理論值、標準值或經(jīng)過大量觀察所得的穩(wěn)定值等)進行比較。這時檢驗統(tǒng)計量t值的計算在H0成立的前提條件下由公式(3.4)變?yōu)椋?13

42、8t檢驗。 (1)建立檢驗假設(shè) H0: 0 ,即該山區(qū)健康成年男子脈搏均數(shù)與一般健康成年男子脈搏均數(shù)相同; H1:0 ,即該山區(qū)健康成年男子脈搏均數(shù)與一般健康成年男子脈搏均數(shù)不同。 0.05(雙側(cè)) (2)計算t值 本例n = 25 , s = 6.5 , 樣本均數(shù)=74.2 ,總體均數(shù) =72 , 代入公式(3.10)139(3)確定P值, 作出推斷結(jié)論 本例 =251=24,查附表2,t界值表,得t0.05,24=2.064,現(xiàn)t=1.6920.05。按 =0.05的水準,不拒絕H0,差異無統(tǒng)計學(xué)意義。 結(jié)論:即根據(jù)本資料還不能認為此山區(qū)健康成年男子脈搏數(shù)與一般健康成年男子不同。 140二

43、、配對資料的t檢驗 醫(yī)學(xué)科研中配對資料的三種主要類型:同一批受試對象治療前后某些生理、生化指標的比較;同一種樣品,采用兩種不同的方法進行測定,來比較兩種方法有無不同;配對動物試驗,各對動物試驗結(jié)果的比較等。配對實驗設(shè)計得到的資料稱為配對資料。 141 先求出各對子的差值d的均值, 若兩種處理的效應(yīng)無差別,理論上差值d 的總體均數(shù)應(yīng)為0。所以這類資料的比較可看作是樣本均數(shù)與總體均數(shù)為0的比較。要求差值的總體分布為正態(tài)分布。 t檢驗的公式為:配對資料的 t 檢驗(paired samples t-test)142 設(shè)有12名志愿受試者服用某減肥藥,服藥前和服藥后一個療程各測量一次體重(kg),數(shù)據(jù)

44、如表3-4所示。問此減肥藥是否有效? (1)建立檢驗假設(shè) H0:d=0, 即該減肥藥無效; H1:d0 ,即該減肥藥有效。 單側(cè)=0.05 143表3-4 某減肥藥研究的體重(kg)觀察值 144(2)計算t值本例n = 12, d = -16,d2 = 710,差值的均數(shù)=d /n = -16/12 = -1.33(kg )145(3)確定P值,作出推斷結(jié)論 自由度=n-1=12-1=11,查附表2,t界值表,得單側(cè)t0.05,11=2.201,現(xiàn)t=0.58 0.05。按=0.05水準,不拒絕H0, 差異無統(tǒng)計學(xué)意義。結(jié)論:故尚不能認為該減肥藥有減肥效果。146 某單位研究飲食中缺乏維生素

45、E與肝中維生素A含量的關(guān)系,將同種屬的大白鼠按性別相同,年齡、體重相近配成8對,并將每對中的兩頭動物隨機分到正常飼料組和維生素E缺乏組,然后定期將大白鼠殺死,測得其肝中維生素A的含量如表3-5。問不同飼料組的大白鼠肝中維生素A含量有無差別? (自學(xué)內(nèi)容) 147三、兩樣本均數(shù)比較的t檢驗兩本均數(shù)比較的t檢驗亦稱為成組t檢驗,又稱為獨立樣本t檢驗(independent samples t-test)。適用于比較按完全隨機設(shè)計而得到的兩組資料,比較的目的是推斷它們各自所代表的總體均數(shù)和是否相等。 148樣本估計值為 :總體方差已知:標準誤的計算公式149若n1=n2時:已知S1和S2時:150

46、測得14名慢性支氣管炎病人與11名健康人的尿中17酮類固醇(mol/24h)排出量如下,試比較兩組人的尿中17酮類固醇的排出量有無不同。 原始調(diào)查數(shù)據(jù)如下:病 人X1健康人X2:n=11; 17.95 30.46 10.88 22.38 12.89 23.01 13.89 19.40 15.83 26.72 17.29 151(1)建立檢驗假設(shè) H0:1 2 ,即病人與健康人的尿中17酮類固醇的排出量相同H1: 1 2 ,即病人與健康人的尿中17酮類固醇的排出量不同 152(2)計算t值 本例n1=14, X1=212.35, X12 n2=11, X2=210.70, X22=4397.64

47、 153(3)確定P值 作出推斷結(jié)論 =14+11-2=23,查t界值表,得t0.05,23=2.069,現(xiàn)t=1.80350.05。按=0.05水準,不拒絕H0,差異無統(tǒng)計學(xué)意義。結(jié)論:尚不能認為慢性支氣管炎病人與健康人的尿中17酮類固醇的排出量不同。154四、兩樣本幾何均數(shù)t檢驗比較兩樣本幾何均數(shù)的目的是推斷它們各自代表的總體幾何均數(shù)有無差異。適用于:觀察值呈等比關(guān)系,如血清滴度;觀察值呈對數(shù)正態(tài)分布,如人體血鉛含量等。兩樣本幾何均數(shù)比較的t檢驗公式與兩樣本均數(shù)比較的t檢驗公式相同。只需將觀察X用lgX來代替就行了 155例3.10 將20名鉤端螺旋體病人的血清隨機分為兩組,分別用標準株和

48、水生株作凝溶試驗,抗體滴度的倒數(shù)(即稀釋度)結(jié)果如下。問兩組抗體的平均效價有無差別? 標準株(11人):100 200 400 400 400 400 800 1600 1600 1600 3200水生株(9人): 100 100 100 200 200 200 200 400 1600將兩組數(shù)據(jù)分別取對數(shù),記為x1, x2 。 x1: 2.000 2.301 2.602 2.602 2.602 2.602 2.903 3.204 3.204 x2156一、兩樣本方差的齊性檢驗 用較大的樣本方差S2比較小的樣本方差S2 第七節(jié) 兩總體方差的齊性檢驗和t檢驗 1為分子自由度,2為分母自由度 15

49、7注意:方差齊性檢驗本為雙側(cè)檢驗,但由于公式(3.18)規(guī)定以較大的方差作分子,F(xiàn)值必然大于1,故附表3單側(cè)0.025的界值,實對應(yīng)雙側(cè)檢驗P=0.05;當(dāng)樣本含量較大時(如n1和n2均大于50),可不必作方差齊性檢驗。 158深層水:n1=8, 樣本均數(shù)=1.781(mg/L), S1=1.899 (mg/L)表層水:n2=10,樣本均數(shù)=0.247(mg/L), S2=0.210 (mg/L) 某研究所為了了解水體中汞含量的垂直變化,對某氯堿廠附近一河流的表層水和深層水作了汞含量的測定,結(jié)果如下。試檢驗兩個方差是否齊性。159 確定P值 作出推斷結(jié)論 本例18-1=7 , 210-1=9

50、,查附表3,F(xiàn)界值表(方差齊性檢驗用), 得F0.05,7,9=4.20, 本例F80.97 F 0.05,7,9=4.20; 故P0.05, 按=0.05 水準,拒絕H0, 接受H1,結(jié)論:故可認為兩總體方差不齊。160方差不齊時,兩小樣本均數(shù)的比較,可選用以下方法:采用適當(dāng)?shù)淖兞孔儞Q,使達到方差齊的要求;采用秩和檢驗;采用近似法t 檢驗。二、t 檢驗161計算統(tǒng)計量t 值 162例3.12 由例3.11已知表層水和深層水含汞量方差不齊,試比較其均數(shù)有無差別?自學(xué)內(nèi)容163假設(shè)檢驗中作出的推斷結(jié)論可能發(fā)生兩種錯誤:拒絕了實際上是成立的H0,這叫型錯誤(typeerror)或第一類錯誤,也稱為

51、錯誤。 不拒絕實際上是不成立的H0,這叫型錯誤(typeerror)或第二類錯誤,也稱為錯誤。 第八節(jié) 型錯誤和型錯誤164表3-6 可能發(fā)生的兩類錯誤165166聯(lián)系:一般增大,則減小; 減小,則增大;區(qū)別:(1)一般為已知,可取單側(cè)或雙側(cè),如0.05,或0.01。 (2)一般為未知,只取單側(cè),如取0.1或0.2。1 (把握度)0.75。兩類錯誤的聯(lián)系與區(qū)別1671-稱為檢驗效能(power of test)或把握度,其意義是兩總體確有差別,按水準能發(fā)現(xiàn)它們有差別的能力。 與的大小應(yīng)根據(jù)實際情況適當(dāng)取值。 1682.選用假設(shè)檢驗的方法應(yīng)符合其應(yīng)用條件 3.正確理解差別有無顯著性的統(tǒng)計涵義 正

52、確理解差別有統(tǒng)計學(xué)意義 及臨床上的差別的統(tǒng)計學(xué)意義。4.假設(shè)檢驗的推斷結(jié)論不能絕對化 5.要根據(jù)資料的性質(zhì)事先確定采用雙側(cè)檢驗或單側(cè)檢驗 第九節(jié) 應(yīng)用假設(shè)檢驗的注意問題169THANK YOU FOR LISTENINGTHE END 170醫(yī)學(xué)本科生用泰山醫(yī)學(xué)院 預(yù)防醫(yī)學(xué)教研室Email: 主 講 程 琮醫(yī)學(xué)統(tǒng)計學(xué)171Teaching Plan for Medical StudentsMedical StatisticsProfessor Cheng CongDept. of Preventive Medicine Taishan Medical College172第4章 方差分析 目錄

53、 第五節(jié) 多個方差的齊性檢驗 第二節(jié) 單因素方差分析 第三節(jié) 雙因素方差分析 第四節(jié) 多個樣本均數(shù)間的兩兩比較 第一節(jié) 方差分析的基本思想 第六節(jié) 變量變換173第四章 方差分析 學(xué)習(xí)要求:1。掌握方差分析的基本思想;2。掌握單因素、雙因素方差分析的應(yīng)用條件、意義及計 算方法;3。熟悉多個均數(shù)間兩兩比較的意義及方法;4。了解方差齊性檢驗和t檢驗的意義及方法;5。熟悉變量變換的意義和方法。174第一節(jié) 方差分析的基本思想一、方差分析的用途及應(yīng)用條件方差分析(analysis of variance,縮寫為ANOVA)是常用的統(tǒng)計分析方法之一。其應(yīng)用廣泛,分析效率高,節(jié)省樣本含量。主要用途有:進行

54、兩個或兩個以上樣本均數(shù)的比較;可以同時分析一個、兩個或多個因素對試驗結(jié)果的作用和影響;分析多個因素的獨立作用及多個因素之間的交互作用;進行兩個或多個樣本的方差齊性檢驗等。方差分析對分析數(shù)據(jù)的要求及條件比較嚴格,即要求各樣本為隨機樣本,各樣本來自正態(tài)總體,各樣本所代表的總體方差齊性或相等。175 二、方差分析的基本思想 處理因素可分為若干個等級或不同類型,通常稱為水平。在不同的水平下進行若干次試驗并取得多個數(shù)據(jù),可以將在每個水平下取得的這些數(shù)據(jù)看作一個樣本。若某個因素有四個水平,每個水平的數(shù)據(jù)代表一個樣本,則獲得四個樣本的數(shù)據(jù)。 設(shè)有k個相互獨立的樣本,分別來自k個正態(tài)總體X1,X2,Xk,且方

55、差相等,即要求檢驗假設(shè)為 此假設(shè)的意義為,在某處理因素的不同水平下,各樣本的總體均數(shù)相等。 1761。設(shè)某因素有多個水平,即試驗數(shù)據(jù)產(chǎn)生多個樣本。由多個樣本的全部數(shù)據(jù)可以計算出總變異,稱為總的離均差平方和。即SS總。2。數(shù)理統(tǒng)計證明,SS總可以由幾個部分構(gòu)成。單因素方差分析中, SS總由組間變異和組內(nèi)變異構(gòu)成。 SS總SS組間SS組內(nèi)。3。組間變異主要受到處理因素和個體誤差兩方面影響,組內(nèi)變異主要受個體誤差的影響。當(dāng)H0 為真時,由于處理因素不起作用,組間變異只受個體誤差的影響。此時,組間變異與組內(nèi)變異相差不能太大。177表42 PCNA在三種不同胃組織中的表達結(jié)果標本Xj不同胃組織XiABC

56、156302124637143392027Xj553221100874 (X)ni109827 ( N)均數(shù)55.3024.5612.532.37(總均值)Xj2312916273167239236( X2)1784。各種變異除以相應(yīng)的自由度,稱為均方,用MS表示,也就是方差。當(dāng)H0為真時,組間均方與組內(nèi)均方相差不大,兩者比值F值約接近于1。 即 F組間均方組內(nèi)均方1。5。當(dāng)H0不成立時,處理因素產(chǎn)生了作用,使得組間均方增大,此時,F(xiàn)1,當(dāng)大于等于F臨界值時,則P0.05。可認為H0不成立,各樣本均數(shù)不全相等。179三、方差分析的類型1。單因素方差分析(one-way ANOVA) 也稱為完全

57、隨機設(shè)計(completely random design)的方差分析。該設(shè)計只能分析一個因素下多個水平對試驗結(jié)果的影響。2。雙因素方差分析(two-way ANOVA) 稱為隨機區(qū)組設(shè)計(randomized block design)的方差分析。該設(shè)計可以分析兩個因素。一個為處理因素,也稱為列因素;一個為區(qū)組因素,也稱為行因素。 1803。三因素方差分析 也稱為拉丁方設(shè)計(Latin square design)的方差分析。該設(shè)計特點是,可以同時分析三個因素對試驗結(jié)果的作用,且三個因素之間相互獨立,不能有交互作用。4。析因設(shè)計(factorial design)的方差分析 當(dāng)兩個因素或多個

58、因素之間存在相互影響或交互作用時,可用該設(shè)計來進行分析。該設(shè)計不僅可以分析多個因素的獨立作用,也可以分析多個因素間的交互作用,是一種高效率的方差分析方法。1815。正交試驗設(shè)計的方差分析 如果要分析的因素有三個或三個以上,可進行正交試驗設(shè)計(orthogonal experimental design)的方差分析。當(dāng)分析因素較多時,試驗次數(shù)會急劇增加,用此設(shè)計進行分析則更能體現(xiàn)出其優(yōu)越性。該設(shè)計利用正交表來安排各次試驗,以最少的試驗次數(shù),得到更多的分析結(jié)果。 182四、方差分析的基本步驟1。計算總變異:指所有試驗數(shù)據(jù)的離均差平方和。 2。計算各部分變異 :單因素方差分析中,可以分出組間變異(S

59、S組間)和組內(nèi)變異(SS組內(nèi));雙因素方差分析中,可以分出處理組變異(SS處理),區(qū)組變異(SS區(qū)組)或稱為配伍組變異(SS配伍)及誤差變異(SS誤差)。 1833。計算各部分變異的均方 在方差分析中,方差也稱為均方,是各部分的離均差平方和除以其相應(yīng)的自由度,用MS表示?;竟綖椋篗SSS。 4。計算統(tǒng)計量F值 F值是指兩個均方之比。一般是用較大的均方除以較小的均方。故F值一般不會小于1。5。確定P值,推斷結(jié)論 根據(jù)分子1,分母2,查F界值表(方差分析用),得到F值的臨界值(critical value),即:如果FF界值,則PH0,接受H1。可以認為各樣本所代表的總體均數(shù)不全相等。如果想要

60、了解哪兩個樣本均數(shù)之間有差異,可以繼續(xù)進行各樣本均數(shù)的兩兩比較。 184第二節(jié) 單因素方差分析1 。特點 單因素方差分析是按照完全隨機設(shè)計的原則將處理因素分為若干個不同的水平,每個水平代表一個樣本,只能分析一個因素對試驗結(jié)果的影響及作用。其設(shè)計簡單,計算方便,應(yīng)用廣泛,是一種常用的分析方法,但其效率相對較低。該設(shè)計中的總變異可以分出兩個部分, 即SS總SS組間SS組內(nèi)。2。常用符號及其意義(1)Xij 意義為第i組的第j個數(shù)據(jù)。其中下標 i 表示列,j 表示行。 (2) 意義為將第i組的全部j個數(shù)據(jù)合計。185 (3) 將第i組的j個數(shù)據(jù)合計后平方, 再將所有各i組的平方值合計。 (4)變異來

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論