版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第十章人群健康研究的統(tǒng)計學方法《預防醫(yī)學》學習目標1.掌握:總體、樣本等統(tǒng)計學基本概念;統(tǒng)計資料的類型;統(tǒng)計表及統(tǒng)計圖的制作;數(shù)值變量資料和分類變量資料統(tǒng)計描述的指標、計算及適用條件;數(shù)值變量資料和分類變量資料區(qū)間估計的方法,常用的假設檢驗方法及應用條件。2.熟悉:醫(yī)學統(tǒng)計工作的基本步驟;頻數(shù)表的編制方法;正態(tài)分布曲線下的面積分布規(guī)律及參考值范圍的制訂。3.了解:t分布的特征;統(tǒng)計中兩型錯誤。重點及難點重點:總體和樣本的概念;統(tǒng)計資料的類型;統(tǒng)計表及統(tǒng)計圖的制作要求;數(shù)值變量資料和分類變量資料統(tǒng)計描述的指標、計算及適用條件;抽樣誤差與標準誤;數(shù)值變量資料和分類變量資料區(qū)間估計的方法;常用假設檢驗方法及應用條件。難點:抽樣誤差與標準誤;t分布與t界值;假設檢驗的基本思想;P值的含義;假設檢驗中的兩型錯誤;分布與
檢驗。第一節(jié)統(tǒng)計學概述《預防醫(yī)學》統(tǒng)計學(statistics)是研究數(shù)據(jù)的收集、整理、分析的一門科學,是認識社會和自然現(xiàn)象客觀規(guī)律數(shù)量特征的重要工具。統(tǒng)計學方法就是幫助人們透過偶然現(xiàn)象認識其內(nèi)在的規(guī)律性,揭示疾病或現(xiàn)象發(fā)生、發(fā)展規(guī)律,為預防疾病、促進健康提供客觀依據(jù)。第十章第一節(jié)(一)同質(zhì)與變異同質(zhì)(homogeneity)是指被研究指標的影響因素相同變異(variable)是同質(zhì)基礎上的各觀察單位(亦稱為個體)之間的差異第十章第一節(jié)(二)總體與樣本總體(population)是指根據(jù)研究目的確定的同質(zhì)觀察單位的全體樣本(sample)從總體中隨機抽取的部分觀察單位,其測量值(或變量值)的集合第十章第一節(jié)(三)變量與變量值總體(population)是指根據(jù)研究目的確定的同質(zhì)觀察單位的全體樣本(sample)從總體中隨機抽取的部分觀察單位,其測量值(或變量值)的集合第十章第一節(jié)(四)參數(shù)與統(tǒng)計量參數(shù)(parameter)是指總體的統(tǒng)計指標。習慣上用希臘字母表示總體參數(shù)統(tǒng)計量(statistic)是指樣本的統(tǒng)計指標。習慣上用拉丁字母表示統(tǒng)計量第十章第一節(jié)(五)誤差1.系統(tǒng)誤差(systematicerror):測量結(jié)果又傾向性。查明原因,可以避免。2.隨機測量誤差(randomerrorofmeasurement):測量結(jié)果沒有傾向性。不可避免。3.抽樣誤差(samplingerror):由于隨機抽樣所引起的樣本統(tǒng)計量與總體參數(shù)之間的差異以及各樣本統(tǒng)計量之間的差異稱為抽樣誤差。變異是絕對的,抽樣誤差不可避免。第十章第一節(jié)(六)概率概率(probability)是描述某隨機事件發(fā)生可能性大小的量值,常用符號P表示。隨機事件的概率在0~1之間,即0≤P≤1。小概率事件:P≤0.05或P≤0.01的事件。統(tǒng)計學上,認為小概率事件在一次抽樣中幾乎不可能發(fā)生。第十章第一節(jié)(一)數(shù)值變量資料數(shù)值變量資料(measurementdata)亦稱定量資料(quantitativedata)或計量資料(numericalvariabledata)(二)分類變量資料分類變量資料(categoricalvariabledata)又稱定性資料(qualitativedata)1.無序分類(unorderedcategories)2.有序分類(orderedcategories)第十章第一節(jié)資料類型的劃分是根據(jù)研究目的確定的,而統(tǒng)計分析方法的選用,則與資料類型密切相關(guān)。在資料的分析過程中,根據(jù)有關(guān)專業(yè)理論和實際需要,各類資料間可以互相轉(zhuǎn)化,以滿足不同統(tǒng)計分析方法的要求。第十章第一節(jié)(一)統(tǒng)計設計:第一步,最關(guān)鍵的環(huán)節(jié)(二)收集資料:經(jīng)常性資料和一時性資料(三)整理資料:查漏補缺,系統(tǒng)化、條理化(四)分析資料1.統(tǒng)計描述2.統(tǒng)計推斷第十章第一節(jié)第二節(jié)統(tǒng)計表和統(tǒng)計圖《預防醫(yī)學》(一)統(tǒng)計表的結(jié)構(gòu)和制表要求
1.統(tǒng)計表主要有標題、標目(包括橫標目、縱標目)、線條、數(shù)字和備注五部分構(gòu)成。2.編制統(tǒng)計表主要的要求是表的中心內(nèi)容要突出,一張表表達一個中心問題為宜。第十章第二節(jié)第十章第二節(jié)統(tǒng)計表的基本框架:
表序
標題
橫標目名稱
縱標目名稱
橫標目
數(shù)字
合計
(一)統(tǒng)計表的種類1.簡單表第十章第二節(jié)
簡單表:指被研究對象只按單一特征或標志分組的表格。
表10-1某地某年咽舒康治療急性咽喉炎療效比較
組別
例數(shù)
有效數(shù)
有效率(%)
試驗組
107
93
86.9
對照組
108
84
77.8
(一)統(tǒng)計表的種類2.復合表第十章第二節(jié)
?
復合表:指被研究對象按兩個(或兩個以上)特征分組的表格。如表3-2,將被研究對象按年齡和性別兩個特征結(jié)合起來分組,故稱為組合表。
表10
-
2某地某年不同年齡、性別的兒童青少年意外損傷情況
男
女
年齡(歲)
調(diào)查人數(shù)
損傷人數(shù)
損傷率(%)
調(diào)查人數(shù)
損傷人數(shù)
損傷率(%)
3.5~
447
66
14.77
424
29
6.84
6.5~
1215
92
7.57
1239
53
4.28
9.5~
1180
122
10.34
1070
80
7.48
12.5~
1217
150
12.33
1136
66
5.81
15.8~18.5
622
65
10.45
582
20
3.44
合計
4681
495
10.57
4451
248
5.57
(一)統(tǒng)計表的類型與選擇1.資料是連續(xù)性的,其目的是用線段升降表達事物的動態(tài)變化趨勢,選擇普通線圖;2.表示變量分布的頻數(shù)表資料,其目的是用直方的面積表達各組段的頻數(shù)或頻率分布情況,宜選擇直方圖;3.資料是相互獨立的,其目的是用直條的長短比較數(shù)值的大小,選擇直條圖;第十章第二節(jié)(一)統(tǒng)計表的類型與選擇4.事物內(nèi)部各部分的百分構(gòu)成比資料,其目的是用面積大小表達各部分所占的比重大小,則應選擇圓圖;5.雙變量連續(xù)性資料,其目的是用點的密集程度和趨勢表達兩個變量的相互關(guān)系,選擇散點圖;6.資料是連續(xù)性的,其目的是比較兩組或多組資料的集中趨勢和離散趨勢,宜選擇箱式圖。第十章第二節(jié)(二)制圖通則1.根據(jù)資料性質(zhì)和分析目的正確選用適當?shù)慕y(tǒng)計圖。2.要有標題,簡明扼要地說明統(tǒng)計圖資料的時間、地點和主要內(nèi)容,一般放在圖下方。3.繪制有坐標軸的圖形時,縱橫兩軸應有標目并注明單位。一般將兩軸的相交點即原點初定為0??v橫軸比例一般以5∶7或7∶5為宜。4.在同一張圖內(nèi)比較不同事物時,須用不同線條或顏色來表示,并附圖例加以說明。第十章第二節(jié)(三)常用統(tǒng)計圖及其繪制方法1.直條圖(bargraph)
直條圖是以等寬直條(柱)的長短來表示各指標數(shù)值的大小。適用于指標為各自獨立的分類資料。第十章第二節(jié)第十章第二節(jié)第十章第二節(jié)(三)常用統(tǒng)計圖及其繪制方法2.構(gòu)成圖(constituentratiochart)
它是以圖形的面積大小表示事物內(nèi)部各組成部分所占比重或比例。適用于按性質(zhì)分類、能計算構(gòu)成比的資料。構(gòu)成圖可分為圓形圖和百分條圖。第十章第二節(jié)第十章第二節(jié)圖10-3復方豬膽囊治療單純型老年氣管炎近期療效比較第十章第二節(jié)圖10-4復方豬膽囊治療老年性氣管炎近期療效比較(三)常用統(tǒng)計圖及其繪制方法3.線圖(linegraph):用線段的升降來表示某事物(某現(xiàn)象)隨時間或條件而變化的趨勢。適用于連續(xù)性資料。第十章第二節(jié)線圖某市城市和郊縣1989-1998年糖尿病死亡率死亡率(1/10萬)某市城市和郊縣10年間糖尿病死亡情況(1/十萬)
1989199019911992199319941995199619971998年度城市死亡率郊縣死亡率
4.454.774.655.645.786.867.457.738.9110.592.122.462.893.563.874.124.284.595.326.22第十章第二節(jié)表2-13某市1949~1957年15歲以下兒童結(jié)核病和白喉死亡率(1/10萬)年份
結(jié)核病死亡率百喉死亡率194919501951195219531954195519561957150.2148.0141.0130.0110.498.272.668.054.820.116.614.011.810.76.53.92.41.3線圖第十章第二節(jié)表2-13某市1949~1957年15歲以下兒童結(jié)核病和白喉死亡率(1/10萬)年份
結(jié)核病死亡率百喉死亡率194919501951195219531954195519561957150.2148.0141.0130.0110.498.272.668.054.820.116.614.011.810.76.53.92.41.3半對數(shù)線圖(三)常用統(tǒng)計圖及其繪制方法4.直方圖(histogram)直方圖又稱頻數(shù)分布圖,是以各矩形的面積表示各組段的頻數(shù),各矩形面積的總和為總頻數(shù),適用于表示連續(xù)性資料的頻數(shù)分布。第十章第二節(jié)第十章第二節(jié)圖10-6某市某年150名3歲女孩身高頻數(shù)分布
(三)常用統(tǒng)計圖及其繪制方法
5.散點圖(scatterdiagram)散點圖是用點的密集程度和變化趨勢來表示兩種現(xiàn)象間的相關(guān)關(guān)系。適用于雙變量資料,均具有連續(xù)性變化的特征。第十章第二節(jié)第十章第二節(jié)
圖10-715名8歲男孩身高與坐高散點圖(三)常用統(tǒng)計圖及其繪制方法6.箱式圖(boxplot)用于比較兩組或多組資料的集中趨勢和離散趨勢,箱式圖的中間橫線表示中位數(shù),箱子的長度表示四分位數(shù)間距,兩端分別是P75和P25,箱式圖最外面兩端連線表示最大值和最小值。第十章第二節(jié)第十章第二節(jié)
圖10-8抑腫瘤藥不同劑量與對照組用藥后小白鼠腫瘤重量的比較第三節(jié)數(shù)值變量資料的統(tǒng)計分析《預防醫(yī)學》1.頻數(shù)表的編制編制頻數(shù)表步驟流程圖(一)頻數(shù)分布(1)揭示數(shù)值變量頻數(shù)分布的類型和特征(2)作為陳述資料的形式(3)便于發(fā)現(xiàn)一些特大或特小的可疑值(4)便于進一步的統(tǒng)計分析2.頻數(shù)分布表的用途3.數(shù)值變量資料頻數(shù)分布的類型和特征431.算術(shù)均數(shù)(mean)樣本均數(shù):總體均數(shù):(1)應用:對稱分布資料,尤其是正態(tài)分布資料。(2)計算直接法加權(quán)法(二)集中趨勢指標442.幾何均數(shù)(geometricmean):(1)應用:等比數(shù)列資料;對數(shù)正態(tài)分布資料(2)
計算:直接法加權(quán)法453.中位數(shù)(median)(1)概念:將一組觀察值從小到大按順序排列,位次具中的觀察值就是中位數(shù)。(2)應用:偏態(tài)分布;分布一端或兩端無確定數(shù)據(jù);資料的分布情況不清楚。(3)計算:直接法
頻數(shù)表法離散趨勢即個體值之間的變異程度,數(shù)據(jù)越分散,變異程度越高。極差四分位數(shù)間距方差標準差變異系數(shù)46(三)離散趨勢指標471.全距(R)全距也稱極差,是一組觀察值中最大值與最小值之差。反映個體變異的范圍。全距大,說明離散程度大;反之,說明離散程度小。缺點:(1)除了最大值和最小值外,不能反映組內(nèi)其他數(shù)據(jù)的離散程度。(2)樣本含量懸殊時不宜比較其全距。(3)即使樣本含量不變,全距的抽樣誤差亦較大,即不夠穩(wěn)定。482.四分位數(shù)間距(Q)上四分位數(shù)(P75)與下四分位數(shù)(P25)之差Q=P75-
P25四分位數(shù)間距可看成中間一半變量值的全距。它與全距類似,數(shù)值越大,說明變異程度越大;反之,說明變異度越小。用四分位數(shù)間距作為說明個體差異的指標,比全距穩(wěn)定,但仍然未考慮到每個觀察值的離散程度。應用:與中位數(shù)結(jié)合用于說明偏態(tài)分布資料的特征。493.方差全面地考慮每個變量值的離散程度。離均差:總和為零離均差平方和:除了與變異度有關(guān)外,還與變量值的個數(shù)有關(guān)。取其均數(shù),即為方差。504.標準差(standarddeviation)總體方差開平方,就是總體標準差。標準差越大,說明個體的變異就越大,則平均數(shù)的代表性就越差。計算:直接法:加權(quán)法:51標準差的應用(1)用于描述正態(tài)分布數(shù)值變量資料的離散程度。(2)結(jié)合均數(shù)描述正態(tài)分布的特征,估計參考值范圍。(3)用于計算變異系數(shù)。(4)用于計算標準誤。525.變異系數(shù)(coefficientofvariation)即標準差與均數(shù)之比用百分數(shù)表示。變異系數(shù)是相對數(shù),沒有單位。變異系數(shù)愈小,說明一組變量值的變異程度愈?。环粗?,變異系數(shù)愈大,說明變異程度大。應用:(1)
比較度量衡單位不同的多組資料的變異度。(2)
比較均數(shù)相差較大的幾組資料的變異度。變異指標小結(jié)531.極差較粗,適合于任何分布。2.標準差與均數(shù)的單位相同,最常用,適合于近似正態(tài)分布。3.變異系數(shù)主要用于單位不同或均數(shù)相差懸殊資料4.平均指標和變異指標分別反映資料的不同特征,常配套使用如正態(tài)分布:均數(shù)、標準差;偏態(tài)分布:中位數(shù)、四分位數(shù)間距541.正態(tài)分布的特征(1)正態(tài)曲線在橫軸上方均數(shù)處最高。(2)正態(tài)分布以均數(shù)為中心,左右對稱。(3)正態(tài)分布有兩個參數(shù),即均數(shù)和標準差。均數(shù)是位置參數(shù),標準差是變異度參數(shù)。(4)正態(tài)曲線下的面積分布有一定規(guī)律。(四)正態(tài)分布與醫(yī)學參考值范圍曲線下面積分布規(guī)律μμ-σμ+σμ-1.96σμ+1.96σμ-2.58σμ+2.58σ68.27%95.00%99.00%醫(yī)學參考值:大多數(shù)正常人某指標的波動范圍?!罢H恕辈皇侵竿耆】档娜?,而是沒有患有影響研究指標疾病或有關(guān)因素的同質(zhì)人群。2.參考值范圍的估計56(1)明確研究總體,從“正常人”總體中抽樣(2)統(tǒng)一測定方法以控制測量誤差。(3)判斷是否需要分組(如性別、年齡)確定。(4)根據(jù)專業(yè)知識決定單側(cè)還是雙側(cè)。(5)確定適當?shù)陌俜址秶?。?)根據(jù)資料的分布類型選定適當?shù)姆椒ㄟM行范圍估計。制訂參考值范圍的步驟5758方法雙側(cè)界值單側(cè)上限單側(cè)下限正態(tài)分布法百分位數(shù)法兩種方法計算95%參考值范圍(一)均數(shù)的抽樣誤差與標準誤概念:樣本統(tǒng)計量的標準差叫做標準誤。意義:是描述均數(shù)抽樣誤差大小的統(tǒng)計指標。是樣本均數(shù)的標準差,反映含量相同的樣本均數(shù)的離散趨勢或變異程度。同類性質(zhì)的資料,均數(shù)的標準誤越大,說明樣本均數(shù)的變異程度越大,樣本均數(shù)圍繞總體均數(shù)分布越分散,樣本均數(shù)與總體均數(shù)越遠離,因此,用樣本均數(shù)推論總體均數(shù)的可靠性越小,抽樣誤差越大。二、數(shù)值變量資料的統(tǒng)計推斷數(shù)值變量資料抽樣誤差標準誤均數(shù)標準誤的用途1.可用來衡量樣本均數(shù)的可靠性,反映抽樣誤差的大小。標準誤越小,說明樣本均數(shù)間的離散程度越小,用樣本均數(shù)估計總體均數(shù)越可靠,反之亦然。2.可用來估計總體均數(shù)的可信區(qū)間。3.可用于均數(shù)的假設檢驗。(二)t分布t分布特征:1.單峰分布,以0為中心左右對稱。2.
t分布是一簇曲線,其形狀受自由度ν的影響。
統(tǒng)計學家已將各種自由度對應的t分布曲線下的尾部面積(概率)的百分界值編制成t界值表。由于t分布是以0為中心的對稱分布,故表中只列出正值,所以查表時,不管t值正負只用絕對值。表右上角插圖中陰影部分,表示tα/2,ν以外尾部面積占總面積的百分數(shù),即概率P。隨著自由度的增大,t界值逐漸減小,當自由度無窮大時,雙側(cè)t0.05=1.96,單側(cè)t0.05,=1.645,即為u分布的界值。t界值63點估計數(shù)值變量資料:→區(qū)間估計(三)總體均數(shù)的估計總體均數(shù)95%可信區(qū)間σ已知σ未知,且樣本量較小σ未知,且樣本量較大參數(shù)估計的方法(數(shù)值變量資料)基本步驟1.建立假設:注意單側(cè)還是雙側(cè)2.確定檢驗水準3.選定檢驗方法,計算統(tǒng)計量4.確定概率P值,作出推斷結(jié)論(四)假設檢驗的意義和基本步驟各樣本是相互獨立的隨機樣本各樣本都來自正態(tài)分布的總體各個總體方差齊對資料性質(zhì)的要求(數(shù)值變量資料)1.樣本均數(shù)與總體均數(shù)比較(1)小樣本均數(shù)與總體均數(shù)比較(2)大樣本均數(shù)與總體均數(shù)比較(3)已知總體標準差時2.配對數(shù)值變量資料的比較3.兩樣本均數(shù)的比較(1)兩小樣本均數(shù)的比較(2)兩大樣本均數(shù)的比較71假設檢驗應注意的問題1.資料必須合乎隨機化抽樣的原則2.選用的假設檢驗方法應符合其應用條件3.實際差別大小與統(tǒng)計意義的區(qū)別4.判斷不能絕對化5.單雙側(cè)檢驗的選擇72假設檢驗中的兩類錯誤Ⅰ型錯誤(第Ⅰ類錯誤):拒絕了實際上成立的H0,這類“棄真”的錯誤稱為Ⅰ型錯誤,其大小用α表示。Ⅱ型錯誤(第Ⅱ類錯誤):不拒絕實際上不成立的H0,這類“取偽”的錯誤稱為Ⅱ型錯誤,其概率大小用β表示。β值的大小在進行假設檢驗時一般并不知道。第四節(jié)分類變量資料的統(tǒng)計分析《預防醫(yī)學》一、分類變量資料的統(tǒng)計描述(一)常用的相對數(shù)指標率構(gòu)成比相對比
率(rate)稱為頻率指標或強度指標,它說明某現(xiàn)象發(fā)生的頻率程度或強度。1、率75
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年高端裝備制造技術(shù)與專利許可合同
- 2024年甲醇分銷合同
- 2024年餐飲業(yè)標準設備租賃合同模板版
- 2025年度環(huán)保設備采購與安裝合同6篇
- 2024年限定版圍墻修繕合作協(xié)議版B版
- 2025年度環(huán)保產(chǎn)業(yè)技術(shù)轉(zhuǎn)移與轉(zhuǎn)化合同3篇
- 2024年版泵車施工廢棄物處理合同
- 2024年高端裝備制造業(yè)原材料采購合同范本3篇
- 2024年職工停薪留職期間工作績效考核合同3篇
- 2024高端精密儀器制造與維修服務合同
- 中國保險行業(yè)協(xié)會-2022年度商業(yè)健康保險經(jīng)營數(shù)據(jù)分析報告
- 新人教版小學五年級數(shù)學上冊知識點歸納總結(jié)
- 四年級上冊口算、豎式計算、脫式計算
- 腎內(nèi)科降低透析器凝血發(fā)生率品管圈PDCA成果匯報
- 回族做禮拜的念詞集合6篇
- 臺區(qū)線損綜合分析臺區(qū)線損分類及計算方法
- 辯論賽醫(yī)術(shù)更重要
- 保密組織機構(gòu)及人員職責
- 競爭性磋商評分細則
- 警用無人機考試題庫(全真題庫)
- 中國傳統(tǒng)節(jié)日(作文指導)課件
評論
0/150
提交評論