醫(yī)學統(tǒng)計學知識點概括_第1頁
醫(yī)學統(tǒng)計學知識點概括_第2頁
醫(yī)學統(tǒng)計學知識點概括_第3頁
醫(yī)學統(tǒng)計學知識點概括_第4頁
醫(yī)學統(tǒng)計學知識點概括_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

醫(yī)學統(tǒng)計學(5+3一體化)出版課時一緒論第一節(jié)、醫(yī)學統(tǒng)計學的地位和作用醫(yī)學統(tǒng)計學的概念:運用統(tǒng)計學的基本原理與方法研究醫(yī)學領域(臨床和基礎醫(yī)學領域)中數(shù)據(jù)的收集、整理、分析和推斷的一門科學第二節(jié)、醫(yī)學統(tǒng)計學基本內(nèi)容和統(tǒng)計工作基本步驟統(tǒng)計工作的步驟:(一)設計根據(jù)研究目的,對某項醫(yī)學研究工作的全過程(資料收集、整理和分析)所作的總的設想和安排;是統(tǒng)計工作的第一步和最關鍵的一步。(二)收集資料任務:遵循統(tǒng)計學原理,按照設計要求,采取必要措施得到準確可靠的原始資料。原則:及時、準確、完整。(三)整理資料編碼,將數(shù)據(jù)輸入計算機糾錯改錯、補漏等根據(jù)研究目的將原始數(shù)據(jù)進行歸納、分組或計算(四)分析資料統(tǒng)計描述統(tǒng)計分析參數(shù)估計統(tǒng)計推斷假設檢驗第三節(jié)、統(tǒng)計學的若干基本概念(一)總體與樣本1.總體:是根據(jù)研究目的所確定的同質(zhì)觀察對象的全體,或者說所有同質(zhì)的某指標實測值的集合。2.樣本:根據(jù)隨機化的原則從總體中抽取有代表性的部分觀察單位,其變量實測值構成樣本。3.參數(shù)和統(tǒng)計量*①總體參數(shù)——總體、唯一性、穩(wěn)定性、未知(不可知)②統(tǒng)計量——樣本、不唯一、可變性、可知·統(tǒng)計學通常用統(tǒng)計量估計參數(shù)(參數(shù)估計)4.同質(zhì)與變異

①同質(zhì):一個總體中有許多個體,他們之所以匯集起來共同成為人們研究的對象,必定存在共性,具有同質(zhì)性。即具有相同的背景、條件、屬性等。②變異:然而,同一總體內(nèi)的各觀察單位間存在差異又是絕對的,這種現(xiàn)象稱為變異。(二)變量與資料·變量:觀測單位的某種特征或?qū)傩浴び^察單位:亦稱個體(人、動物、家庭、地區(qū)、樣品、采樣點……)·變量值(資料):變量的觀察結果,可以是定量的,也可以是定性的。例:三歲兒童身高、性別·根據(jù)變量值的獲取方法把變量進行分類:定量變量和定性變量。1.定量變量:數(shù)值變量或計量數(shù)據(jù)。①定義:通過度量衡的方法,測量每一個觀察單位的某項研究指標的量的大小,得到的一系列數(shù)據(jù)資料。②特點:有度量衡單位。③舉例:調(diào)查某地某年七歲女童的身體發(fā)育狀況。每個人的身高(cm)、體重(kg)、脈搏(次/分)、血壓(kPa)、坐高指數(shù)(%,坐高/身高)等均屬定量變量。④類型:·離散型變量:變量取值可以一一列舉的資料。例:家庭人口數(shù),脈搏數(shù)·連續(xù)型變量:變量取值不能一一列舉的資料(變量取值為一定范圍內(nèi)的任意值)。例:人體的身高、體重、總膽固醇2.定性變量(分類資料)①定義:將全體觀測單位按照某種性質(zhì)或特征分組,然后再分別清點各組觀察單位的個數(shù)。②特點:沒有度量衡單位,多為間斷性變量(通過枚舉或記數(shù)得來)③類型:二分類變量:陰性和陽性/男和女·無序分類變量:類與類之間無程度大小的差別多分類變量:血型:A、B、O、AB職業(yè):教師、醫(yī)生、工人·有序分類變量(等級變量):類與類之間有程度大小的差別療效:治愈、好轉(zhuǎn)、無效;尿蛋白:(-、±、+、++)文化程度:小學及以下、中學、大專、本科及以上(三)誤差1.誤差:實際觀察值與真實值之差2.誤差分類:(四)頻率和概率1.頻率:稱f為事件A在這n次試驗中出現(xiàn)的頻率2.概率:當觀察次數(shù)n越來越大,頻率f的波動幅度越來越小,并最終趨向于一個常數(shù)p——隨機事件A發(fā)生的概率。·概率描述了隨機事件發(fā)生的可能性的大小,是一種參數(shù);頻率作為概率的估計值,是統(tǒng)計量3.小概率事件:概率小于等于0.05的事件(醫(yī)學)·原理:在某一次試驗中,由于其發(fā)生的可能性十分小,近似認為是不會發(fā)生的課時二定量資料的統(tǒng)計描述第一節(jié)、頻數(shù)分布表和頻數(shù)分布圖1、離散型定量變量的頻數(shù)表;2、連續(xù)型定量變量的頻數(shù)表:要特別注意:分組除了最后一段外均為左閉右開區(qū)間,最后一個分組一定要有上限;3、頻數(shù)分布圖4、頻數(shù)分布表和頻數(shù)分布圖的作用⑴揭示頻數(shù)分布的特征:集中趨勢、離散趨勢(當集中趨勢與離散趨勢結合起來時能全面反映頻數(shù)的分布。)⑵揭示頻數(shù)分布的類型:對稱型、不對稱型(分為正偏態(tài)和負偏態(tài))第二節(jié)、集中位置的描述1.算數(shù)均數(shù)的相關知識⑴計算方法:直接法:加權法:⑵均數(shù)的特性:各觀察值與均數(shù)之差(離均差)的總和等于零; 各觀察值的離均差平方和最小。⑶均數(shù)的應用:它是集中趨勢的最常用指標;易受極端值的影響;用于定量數(shù)據(jù),不能用于分類數(shù)據(jù)和等級數(shù)據(jù);適用于服從對稱分布定量資料(正態(tài)或近似正態(tài))的集中趨勢描述。2.幾何均數(shù)的相關知識⑴計算方法:直接法、加權法(對比算數(shù)均數(shù),在其基礎上加上對數(shù))⑵幾何均數(shù)的應用:觀察值間呈倍數(shù)或近似倍數(shù)關系的數(shù)據(jù);正偏態(tài)分布資料(對數(shù)正態(tài)分布或近似對數(shù)正態(tài)分布)中位數(shù)的相關知識⑴計算方法:直接法:頻數(shù)表法:⑵中位數(shù)的應用:中位數(shù)主要應用于不對稱分布型的資料,兩端無確切值或分布不明確的資料。第三節(jié)、離散程度的描述1.極差的相關知識極差一般用于單峰對稱分布小樣本資料或者初步了解資料的變異程度;一般極差越大,則數(shù)據(jù)的變異性越大;但是它沒有考慮除極值外其他數(shù)據(jù)的變異情況;而且樣本的極差通常過小地估計了總體的極差;2.四分位數(shù)間距的相關知識⑴計算方法:直接法頻數(shù)表法(常用):Px=Lx+i/fx(n·x%—ΣfL)⑵四分位數(shù)間距的應用:四分位數(shù)間距常用于描述偏態(tài)分布資料、兩端無確切值或分布不明確資料的離散程度。3.方差與標準差(總體的方差與標準差公式見課本P55)⑴計算方法:樣本的方差:樣本的標準差:4.變異系數(shù)的相關知識⑴計算方法:CV=S/X*100%⑵變異系數(shù)的應用:消除了數(shù)據(jù)水平高低和計量單位的影響,用于不同性質(zhì)數(shù)據(jù)或均數(shù)相差較大時,離散程度的比較;5.各種指標之間的使用方法:課時三正態(tài)分布及其應用第一節(jié)、正態(tài)分布的概念和特征1.概念:在醫(yī)學衛(wèi)生領域中,許多變量的頻數(shù)分布是中間(靠近均數(shù)處)頻數(shù)多,兩邊頻數(shù)少,且左右對稱,兩側逐漸低下,兩端在無窮遠處與橫軸無限接近。如人體的許多生理、生化指標等。這種變量的頻數(shù)分布規(guī)律可用概率論中的一種重要的隨機變量分布—正態(tài)分布(Normaldistribution)加以描述。若變量x的頻率曲線對應于數(shù)學上的正態(tài)分布曲線,則稱該變量服從正態(tài)分布。2.特征①密度函數(shù):②特征:中間(靠近均數(shù)處)頻數(shù)多,兩邊頻數(shù)少;且左右對稱;二個參數(shù)(μ、σ),固定σ,改變μ,曲線左右移動,形態(tài)不變,固定μ,σ越小曲線越陡峭,但中心位置不變。3.正態(tài)密度函數(shù)曲線下的面積規(guī)律①正態(tài)密度函數(shù)曲線與橫軸間的面積恒等于1或100%;②正態(tài)分布是一種對稱分布,其對稱軸為直線X=μ,X>μ與X<μ范圍內(nèi)曲線下的面積相等,各占50%;③曲線下在區(qū)間(μ-σ,μ+σ)的面積為68.27%,曲線下在區(qū)間(μ-1.64σ,μ+1.64σ)的面積為90%,曲線下在區(qū)間(μ-1.96σ,μ+1.96σ)的面積為95%,曲線下在區(qū)間(μ-2.58σ,μ+2.58σ)的面積為99%。第二節(jié)、標準正態(tài)分布為了計算方便,對于正態(tài)或近似正態(tài)分布的資料,只要得出均數(shù)和標準差,可通過標準轉(zhuǎn)化,轉(zhuǎn)化成求標準正態(tài)曲線下橫軸自-∞到z的面積。標準化變化:若x服從正態(tài)分布N(μ,σ2),則z就服從均數(shù)為0、標準差為1的正態(tài)分布,這種正態(tài)分布稱為標準正態(tài)分布或z分布,記為N(0,12),這一變換也稱為標準化變換。

例題1.已知z1=-1.20,z2=1.60,欲求標準正態(tài)下(-1.20,1.60)范圍的面積。解:查表φ(-1.20)=0.1151;φ(1.60)=1-0.0548=0.9452則D=φ(1.60)-φ(-1.20)=0.8301第三節(jié)、正態(tài)分布的應用①估計頻數(shù)分布例題;某項目研究嬰兒的出生體重服從正態(tài)分布,其均數(shù)為3150g,標準差為350g。若以2500g作為低體重兒,試估計低體重兒的比例。解:首先計算標準正態(tài)離差z:查標準正態(tài)分布表:φ(-1.86)=0.0314結果:估計低體重兒所占比例為96.86%②制定醫(yī)學參考值范圍(又稱正常值范圍),作為判斷正常與異常的參考標準確定參考值范圍的注意事項:單、雙側問題:單側下限:肺活量,IQ,單側上限:轉(zhuǎn)氨酶,尿鉛,雙側:紅細胞計數(shù)、血清總膽固醇…選擇百分界值(90%,95%)根據(jù)資料特點,選用恰當計算方法計算醫(yī)學參考值范圍常用的方法:1.正態(tài)分布法:適用于正態(tài)或近似正態(tài)分布資料。雙側界值:單側上界:;單側下界:2.對數(shù)正態(tài)分布法:適用于對數(shù)正態(tài)分布資料雙側界值:3.百分位數(shù)法:常用于偏態(tài)分布資料雙側界值:P2.5和P97.5;單側上界:P95;或單側下界:P5例4.24某地調(diào)查正常成年男子200人的紅細胞數(shù),得均數(shù)=55.26×1012/L,標準差S=0.38×1012/L,試估計該地正常成年男子紅細胞數(shù)的95%參考值范圍。解:該地正常成年男子紅細胞數(shù)的95%參考值范圍為下限:-1.96S=55.26-1.96×0.38=54.52(×1012/L)上限:+1.96S=55.26+1.96×0.38=56.00(×1012/L)例4.252005年某市進行的小學生體質(zhì)評價研究中,測定了120名9歲男孩的肺活量,均數(shù)=1.672L,S=0.298L,試估計9歲男孩的肺活量的95%參考值范圍。解:因肺活量僅過低屬異常,故取單側下限。肺活量的95%參考值范圍為:下限:即該地估計該地小學生中9歲男孩的肺活量的95%參考值范圍為不低于1.183L。例.測得某年某地282名正常人的尿汞值如下表所示,試制定正常人尿汞的95%參考值范圍。解:正常人的尿汞值為偏態(tài)分布,且過高為異常,故用百分位數(shù)法計算,且取單側上限。其95%參考值范圍為:上限:即該地正常人尿汞的95%參考值范圍為不高于43.6μg/L。③質(zhì)量控制④正態(tài)分布是許多統(tǒng)計方法的理論基礎課時四總體均數(shù)的估計第一節(jié)、均數(shù)的抽樣誤差與標準誤樣本均數(shù)的特點·各個樣本均數(shù)之間都不相同——抽樣誤差表現(xiàn)形式之一·各個樣本均數(shù)都不等于總體均數(shù),有的比總體均數(shù)大,有的比它小——抽樣誤差表現(xiàn)形式之二·相對于各樣本的個體值,樣本均數(shù)間的變異程度較小樣本均數(shù)的分布規(guī)律·大多數(shù)的樣本均數(shù)相互之間存在差異,絕大多數(shù)的樣本均數(shù)不等于x的總體均數(shù)·樣本均數(shù)的集中趨勢位置與個體資料x的集中趨勢位置較為接近,樣本均數(shù)的頻數(shù)圖均呈現(xiàn)出中間多、兩邊少且基本對稱的正態(tài)分布特征?!颖揪鶖?shù)的分布范圍較個體值小;隨著樣本含量的增大,樣本均數(shù)的頻數(shù)分布范圍越來越窄·樣本均數(shù)的標準差都非常接近(?為個體資料x的總體標準差,n為個體數(shù))中心極限定理1.從正態(tài)分布N(u,?^2)中,以固定n抽取樣本,樣本均數(shù)的分布仍服從正態(tài)分布,樣本均數(shù)的總體均數(shù)仍為u,樣本均數(shù)的標準差為2.即使是從偏態(tài)分布總體抽樣,只要n足夠大,樣本均數(shù)的分布也近似正態(tài)分布;3.隨著樣本量的增大,樣本均數(shù)的變異范圍也逐漸變窄。樣本均數(shù)的標準誤·為了與個體的標準差相互區(qū)別,樣本均數(shù)的標準差又稱為樣本均數(shù)的標準誤(SE),或理論標準誤·反映了樣本均數(shù)間的離散程度,如果SE很大則不同的樣本均數(shù)間參差不齊,同時樣本均數(shù)的分布范圍較大,也反映了樣本均數(shù)與總體均數(shù)間的差異可能較大,因而標準誤反映均數(shù)·抽樣誤差的大??;它與總體標準差成正比,與總體中的個體數(shù)的平方根成反比代表樣本均數(shù)的標準誤,其表達式為均數(shù)的標準誤的影響因素·從標準誤的計算公式中看出它與原先個體觀察值的總體標準差s有關,同時也和樣本含量n有關·在固定樣本含量的情況下,總體標準差越大,則樣本均數(shù)間越參差不齊,抽樣誤差越大;但是總體標準差是參數(shù),在抽樣之前就已經(jīng)存在,無法改變它的大小·故可行的方法是通過擴大樣本含量減少標準誤;從而減少抽樣誤差樣本均數(shù)標準誤的估計值。抽樣誤差越小,表示樣本均數(shù)與總體均數(shù)越接近,用樣本均數(shù)估計總體均數(shù)的可靠性越高;反之則越低標準誤與標準差的區(qū)別:(1)概念不同標準差是描述樣本個體值間的變異,標準差小,說明變量值圍繞均數(shù)的波動小,均數(shù)的代表性好。標準誤是描述樣本均數(shù)的抽樣誤差,標準誤越小,表示樣本均數(shù)圍繞總體均數(shù)的波動越小。用途不同標準差表示變量值對均數(shù)的波動大小,當資料呈正態(tài)分布時,與均數(shù)結合估計正常值范圍、計算變異系數(shù)、標準誤等。標準誤表示樣本統(tǒng)計量對總體參數(shù)的波動情況,用于估計參數(shù)的置信區(qū)間、進行假設檢驗。(3)聯(lián)系1)兩者均為變異指標;2)樣本含量不變時,均數(shù)的標準誤與標準差成正比;3)兩者均可與均數(shù)結合使用(但描述的內(nèi)容各不相同)。在應用過程中要注意標準差和標準誤的區(qū)別:第二節(jié)、t分布·t分布的由來.t分布曲線的特點①單峰分布,曲線在t=0處最高,并以t=0為中心左右對稱②與標準正態(tài)分布相比,曲線最高處較矮,兩尾部翹得高③其形態(tài)變化與自由度的大小有關。自由度越小,則t值越分散,曲線越低平;隨自由度增大,曲線逐漸接近正態(tài)分布。它與樣本例數(shù)n或自由度ν有關,某個自由度對應于一條t分布曲線。當n或ν不同時,曲線形狀不同。當v→無窮大時,t分布趨近于標準正態(tài)分布。自由度:ν=n-1(隨機變量能夠自由取值的個數(shù))t分布曲線下面積規(guī)律t分布曲線下總面積仍為1或100%由于t分布是一簇曲線,故t分布曲線下面積固定面積(如95%或99%)的界值不是一個常量,而是隨自由度的大小而變化,如附表3。第三節(jié)、總體均數(shù)的估計參數(shù)的估計點估計:由樣本統(tǒng)計量直接估計總體參數(shù)(缺點:沒有考慮抽樣誤差。)區(qū)間估計:在一定可信度下,同時考慮抽樣誤差。在點估計的基礎上,結合抽樣誤差的大小,給出總體參數(shù)估計的一個區(qū)間范圍(由上、下限構成的置信區(qū)間)該區(qū)間按照一定的概率可能性,包含所推斷的總體參數(shù)置信區(qū)間:假設已知的樣本均數(shù)是從較小的m總體中抽取的,它成立的統(tǒng)計條件是從該總體中抽取一個樣本,其均數(shù)為當前均數(shù)以及更大的可能性并非小概率事件置信區(qū)間與置信度:按預先給定的概率(1-a)確定的包含未知總體參數(shù)的可能范圍,該范圍通常稱為參數(shù)的信區(qū)間或可信區(qū)間.預先給定的概率(1-a)稱為可信度或置信度,常取95%或99%置信區(qū)間的確切含義95%置信區(qū)間:從總體中作隨機抽樣,作100次抽樣,每個樣本可算得一個置信區(qū)間,得100個置信區(qū)間,平均有95個置信區(qū)間包括μ(估計正確),只有5個置信區(qū)間不包括μ(估計錯誤)??傮w均數(shù)的置信區(qū)間估計方法資料不同,總體均數(shù)的估計方法也不同,根據(jù)資料的條件,計算方法有三種:未知,且n?。喊磘分布原理計算置信區(qū)間。未知,但n足夠大時(n>100),t分布逼近z分布。按z分布原理計算置信區(qū)間。σ已知,故可按正態(tài)分布原理估計總體均數(shù)的置信區(qū)間,計算公式為:置信區(qū)間的注意問題1.置信區(qū)間的涵義意思是從總體中作隨機抽樣,每個樣本可以算得一個置信區(qū)間。如95%置信區(qū)間意味著做100次抽樣,算得100個置信區(qū)間,平均有95個估計正確,估計錯誤的只有5次。5%是小概率事件,實際發(fā)生的可能性很小,當然這種估計方法會有5%犯錯誤的風險。2.置信區(qū)間的兩個要素:一是準確度:反映在可信度的大小,即區(qū)間包含總體均數(shù)的概率的大小,愈接近1愈好。二是精密度:反映在區(qū)間的長度,長度愈小愈好。在樣本含量確定的情況下,二者是矛盾的,若只管提高可信度,會把區(qū)間變得很長,故不宜認為99%置信區(qū)間比95%置信區(qū)間好,一般來說95%置信區(qū)間更為常用。3.均數(shù)置信區(qū)間與參考值范圍的區(qū)別95%的置信區(qū)間中的95%是置信度,即所求置信區(qū)間包含總體參數(shù)的可信程度為95%;95%的參考值范圍中的95%是一個比例,即所求參考值范圍包含了95%的正常人。課時五假設檢驗第一節(jié)、基本思想反證法+小概率事件原理目前已知這兩組樣本的數(shù)據(jù)不相等,新療法為4min,常規(guī)療法3min,那么造成這兩者之間的差異的原因可能有以下兩種:1.抽樣誤差,即假設兩者之間的治療效果是沒有差別的,兩個樣本平均數(shù)之間差別產(chǎn)生的原因單純是因為抽樣誤差所導致的。2.這兩組治療效果的確有區(qū)別。于是我們經(jīng)過分析得到了以上兩個假設,假設1即認為兩組樣本來自同一個大的總體(兩者之間的治療效果沒有差別),差異是由抽樣誤差導致的,該假設否認了兩組之間的差異,記為H0(零假設);假設2認為兩個樣本來自不同的總體,即兩者之間的確存在差異,記為H1(備擇假設)。我們這里之所以將抽樣誤差的情況設為零假設是因為抽樣誤差出現(xiàn)的可能性(P)是可以通過計算得到的,若P小于等于5%(即小概率事件),我們認為在一次的抽樣中是不會得到小概率事件的,于是我們就可以否認造成差異的原因是抽樣誤差而是兩組數(shù)據(jù)來自不同的總體。如果反過來,我們是無法直接證明這兩組數(shù)據(jù)是不同的,所以在這里一定要用反證法來證明兩者之間得而差別,這就是假設檢驗的原理。當兩組數(shù)據(jù)本來就十分接近時,P值便容易得到大于5%的情況,此時便不能否認抽樣誤差的可能性,便不能證明兩組數(shù)據(jù)有差異。第二節(jié)、基本步驟1.建立假設檢驗,確定檢驗水準H0:差異抽樣誤差H1:兩組數(shù)據(jù)的確存在差異A=0.052.計算檢驗統(tǒng)計量3.查表,得到P值4.下結論當P≤a(一般為0.05)時,(根據(jù)小概率原理,一次抽樣中不可能出現(xiàn)小概率事件,于是否認抽樣誤差存在的可能性)拒絕H0,接受H1,有統(tǒng)計學意義。當P≥a(一般為0.05)時,(由于此時的差異有可能是抽樣誤差造成的,不能否認抽樣誤差的可能性)尚不能拒絕H0,(不能得出兩組數(shù)據(jù)確實存在差異的結論)結果沒有統(tǒng)計學意義。第三節(jié)、Ⅰ型錯誤與Ⅱ型錯誤Ⅰ型錯誤:很不幸,你的一次抽樣就抽到了小概率事件a(一般為0.05),于是把原本只是單純的抽樣誤差造成的差異,判斷為了兩組樣本所在的總體是不同的,于是對不起,你就犯了Ⅰ型錯誤——這兩組數(shù)據(jù)其實沒有不同。你煩這種錯誤的可能性與你臉黑在一次抽樣中抽到小概率事件的判斷標準(a)是一樣的。Ⅱ型錯誤:很遺憾,當P≥a(一般為0.05)時,你判斷認為在這種情況下,這兩組數(shù)據(jù)的差異有可能來自抽樣誤差,于是你就拒絕了H1(兩組數(shù)據(jù)確實存在差異)的情況,然而事實上,兩組數(shù)據(jù)所來自的總體確實存在差異,只是差異很小,被你誤認為是由于抽樣誤差造成的,那么很抱歉,你犯了Ⅱ型錯誤,你犯這種錯誤的概率取決于P大于等于a(一般為0.05)的部分與H1成立相交的面積β(未知)相等。檢驗效能:你不犯Ⅱ型錯誤的可能性1-β。注:Ⅰ型錯誤與Ⅱ型錯誤只能盡量減小卻不能完全避免。第四節(jié)、單側檢驗與雙側檢驗一般用雙側,因為你一般無法知道差異是會變大還是變小,只有在有專業(yè)知識的情況下才考慮用單側檢驗。因為單側檢驗更容易拒絕H0,故應用雙側檢驗時用單側檢驗會使犯Ⅰ型錯誤的可能性加大。第五節(jié)、需要注意的問題自己看吧第六節(jié)、假設檢驗與區(qū)間估計的聯(lián)系假設檢驗的結果和區(qū)間估計的方法不能但所得出的結論是相同。課時六t檢驗根據(jù)問題,需要進行假設檢驗的時候,如果:1)資料是定量資料,且要求正態(tài)總體或近似正態(tài)總體,就選用t檢驗;2)如果是定性資料,就用卡方檢驗。當選擇用t檢驗,t檢驗有三種:單樣本t檢驗、成組t檢驗、配對t檢驗。t檢驗的使用條件:1)單樣本t檢驗:總體標準差未知且樣本含量較小。用于樣本均數(shù)與總體均數(shù)的比較。2)配對t檢驗:是單樣本t檢驗的特殊情況,主要有三種類型:(1)配對的對象接受不同的處理。(2)同一樣品用兩種不同的方法或儀器檢測。(3)同一對象處理前后的對比。配對t檢驗用來推斷兩種處理方法結果有無差別。3)成組t檢驗:兩小樣本均數(shù)比較時,且總體方差相等時。備注:對于兩大樣本(均數(shù)均大于50)的均數(shù)比較時,可用Z檢驗。第一節(jié)、單樣本t檢驗(例8.1)解:第二節(jié)、配對t檢驗重要的是使用條件:(1)配對的對象接受不同的處理。(2)同一樣品用兩種不同的方法或儀器檢測。(3)同一對象處理前后的對比。配對t檢驗用來推斷兩種處理方法結果有無差別。(例8.2)第三節(jié)、成組t檢驗1)什么是成組資料設計?為了研究兩種處理效果的差別,將所收集的研究對象隨機分配到兩種不同的處理組中,事先沒有作任何匹配2)常見的成組設計情況有:沒有交代使用匹配方案,均按照成組資料設計處理;相當于將兩個樣本視為來自兩個不同的總體,比較兩個未知的總體參數(shù)是否相同。3)假定兩樣本分別服從正態(tài)分布,且兩樣本的總體方差相等,可估計出兩樣本的的合并方差,其計算式為:(例8.3)如果兩個總體的方差不同,那么可以使用近似t檢驗(或也稱為校正t檢驗或t’檢驗)(這個不要求掌握)補充:如何判斷兩樣本所來源的總體方差是否相等?第四節(jié)、F檢驗(常用的方差齊性檢驗的一種)1)用來判斷兩樣本所來源的總體方差是否相等。2)兩組樣本方差不同,那么S1≠S2究竟是由于兩個樣本的總體方差不同還是僅僅由于抽樣誤差導致3)現(xiàn)假設樣本標準差間的差別僅僅由于抽樣誤差所導致,那么兩個樣本方差間的差別應該不會很大,換句話說兩者的比值應該在1附近,如果距離1很遠,例如比1大很多或小很多,那么兩樣本所來源的總體方差就可能不同4)統(tǒng)計學家發(fā)現(xiàn)方差比值(樣本含量分別為n1與n2)滿足自由度為v1=n1-1與v2=n2-1的F分布,其中v1與v2分別稱為分子自由度與分母自由度。(例8.3)兩組對象(n1=n2=12)的標準差分別為s1=27.7,s2=19.5,請問兩組患者的總體方差是否相同?課時七定性資料的統(tǒng)計描述定性變量的取值為某種屬性,例如:血型(A、B、O、AB)人群中某病發(fā)生與否(發(fā)生、不發(fā)生)性別(男性、女性)視力等級(差、中、好)第一節(jié)、常用相對數(shù)及其應用相對數(shù)是分類資料的描述性統(tǒng)計指標,是兩個有聯(lián)系指標之比。常用相對數(shù)有率、構成比、相對比。1、率率(rate)包括頻率和速率*頻率有如下指標

*速率如下2、構成比(即說明事物內(nèi)部各組成部分所占比例)如下表:某精神病醫(yī)院2010與2012年精神病的住院情況比較疾病2010年2012年病人數(shù)構成比(%)病人數(shù)構成比(%)抑郁2010.0208.0精神分裂14070.019076.0神經(jīng)質(zhì)2010.0208.0其他2010.0208.0合計200100.0250100.0特點: