醫(yī)學統(tǒng)計學知識點_第1頁
醫(yī)學統(tǒng)計學知識點_第2頁
醫(yī)學統(tǒng)計學知識點_第3頁
醫(yī)學統(tǒng)計學知識點_第4頁
醫(yī)學統(tǒng)計學知識點_第5頁
已閱讀5頁,還剩26頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

實用標準文案第一章 緒論1、統(tǒng)計學,是關(guān)于數(shù)據(jù)收集、整理、分析、表達和解釋的普遍原理和方法。2、研究對象:具有不確定性結(jié)果的事物。3、統(tǒng)計學作用:能夠透過偶然現(xiàn)象來探測其規(guī)律性,使研究結(jié)論具有科學性。4、統(tǒng)計分析要點:正確選用統(tǒng)計分析方法,結(jié)合專業(yè)知識作出科學的結(jié)論。5、醫(yī)學統(tǒng)計學基本內(nèi)容 :統(tǒng)計設計、數(shù)據(jù)整理、統(tǒng)計描述、統(tǒng)計推斷。6、醫(yī)學統(tǒng)計學中的基本概念(1)同質(zhì)與變異同質(zhì),指根據(jù)研究目的所確定的觀察單位其性質(zhì)應大致相同。變異,指總體內(nèi)的個體間存在的、絕對的差異。統(tǒng)計學通過對變異的研究來探索事物。(2)變量與數(shù)據(jù)類型變量,是反映實驗或觀察對象生理、生化、解剖等特征的指標。變量的觀測值,稱為 數(shù)據(jù)分為三種類型: 定量數(shù)據(jù),也稱計量資料,指對每個觀察單位某個變量用 測量或其他定量方法準確獲得的定量結(jié)果。(如身高、體重、血壓、溫度等)定性數(shù)據(jù),也稱計數(shù)資料,指將觀察單位按某種屬性分組 計數(shù)的定性觀察結(jié)果。包括二分類、無序多分類。(進一步分為二分類和多分類,如性別分為男和女,血型分為 A、B、O、AB等)有序數(shù)據(jù),也稱半定量數(shù)據(jù)或等級資料 ,指將觀察單位按某種屬性的不同程度或次序分成等級后分組計數(shù)的觀察結(jié)果,具有半定量性質(zhì)。統(tǒng)計方法的選用與數(shù)據(jù)類型有密切的關(guān)系。精彩文檔(3)總體與樣本總體,指根據(jù)研究目的確定的所有 同質(zhì)觀察單位的全體,包括所有定義范圍內(nèi)的個體變量值。樣本,是從研究總體中隨機抽取部分有代表性的觀察單位,對變量進行觀測得到的數(shù)據(jù)。抽樣,是從研究總體中隨機抽取部分有代表性的觀察單位。參數(shù),指描述總體特征的指標。統(tǒng)計量,指描述 樣本特征的指標。4)誤差誤差,指觀測值與真實值、統(tǒng)計量與參數(shù)之間的差別。可分為三種:系統(tǒng)誤差,也稱統(tǒng)計偏倚,是某種必然因素所致,不是偶然機遇造成的,誤差的大小通常恒定,具有明確的方向性。隨機測量誤差,是偶然機遇所致,誤差沒有固定的大小和方向。抽樣誤差,是抽樣引起的統(tǒng)計量與參數(shù)間的差異。抽樣誤差主要來源于個體的變異。統(tǒng)計學主要研究抽樣誤差。5)概率概率,是描述某事件發(fā)生可能性大小的量度。必然事件,事件肯定發(fā)生,概率 P(U)=1;隨機事件,事件可能發(fā)生,可能不發(fā)生,概率介于 0≤P(A)≤1;不可能事件,事件肯定不發(fā)生,概率 P(∮)=0;小概率事件,事件發(fā)生的可能性很小,概率 P(A)≤0.05、或P(A)≤0.01。醫(yī)學科研中, P(A)≤0.05 作為事物差別有統(tǒng)計意義, P(A)≤0.01 作為事物差別有高實用標準文案度統(tǒng)計意義。第二章 定量數(shù)據(jù)的統(tǒng)計描述定量數(shù)據(jù)的統(tǒng)計描述方法: 頻數(shù)表、直方圖、統(tǒng)計指標。(1)頻數(shù)分布頻數(shù)分布的目的: 了解數(shù)據(jù)的分布范圍、集中位置以及分布形態(tài)等特征,以便根據(jù)資料分布情況選擇合適的統(tǒng)計方法。頻數(shù)分布的用途:①作為陳述資料的形式;②便于觀察數(shù)據(jù)的分布類型;③便于發(fā)現(xiàn)數(shù)據(jù)中特大或特小的可疑值;④當樣本量大時,可用各組段的頻率作為概率的估計值。計算全距(range,R):是一組數(shù)據(jù)的最大值與最小值之差。 R=Max-Min確定組數(shù)與組距樣本量在 100例左右,組數(shù)選擇 8~15 之間,一般取 10組左右。組距≈全距/組數(shù)確定組限第一組段必須包括最小值,最后一組段必須包括最大值。最后一組段包括最大值,且一般情況下應包含該組段上限,其余各組段區(qū)間左閉右開。計算各組段頻數(shù)( frequency ):即計算各組段內(nèi)觀察值的個數(shù)。計算各組段頻率( percent ):即計算各組段頻數(shù)與總觀察值個數(shù)之比,用百分數(shù)表示。計算累計頻數(shù)( cumulative frequency )和累計頻率( cumulative percent ):累計頻數(shù)是由上至下將頻數(shù)累加; 累計頻率是由上至下將頻率累加。精彩文檔(2)直方圖直方圖,是以垂直條段代表頻數(shù)分布的一種圖形。(3)頻數(shù)分布表的用途、作為稱述資料的形式,可以代替原始資料,便于進一步分析。、便于觀察數(shù)據(jù)的分布類型。資料分布類型分為:對稱分布和偏態(tài)分布。在統(tǒng)計分析時常需要根據(jù)資料的分布形式選擇相應的統(tǒng)計分析方法,因此對數(shù)據(jù)分布形式的判定非常重要。、便于發(fā)現(xiàn)資料中某些遠離群體的特大或特小值。、當樣本含量比較大時,可用各組段的頻率作為概率的估計值。集中趨勢的統(tǒng)計指標平均數(shù),是描述一組觀察值集中位置或平均水平的統(tǒng)計指標,常作為一組數(shù)據(jù)的代表值用于分析和進行組間的比較。常用的有算術(shù)均數(shù)、幾何均數(shù)、中位數(shù)、百分位數(shù)等。算術(shù)均數(shù),等于一個變量所有觀察值的和除以觀察值個數(shù)??傮w均數(shù)用希臘字母μ表示,樣本均數(shù)用符號Χ拔 表示。算術(shù)均數(shù)適用于對稱分布的資料,如分布均勻的小樣本數(shù)據(jù)或近似正態(tài)分布的大樣本數(shù)據(jù)。算術(shù)均數(shù)易受極端值的影響,并且受極大值的影響大于受極小值的影響。幾何均數(shù)幾何均數(shù)(geometricmean ,G),等于一個變量所有 n個觀察值的乘積的 n次方根。幾何均數(shù)適用于取對數(shù)后近似呈對稱分布的資料,尤其是右偏態(tài)分布數(shù)據(jù)。醫(yī)學研究中常用于比例數(shù)據(jù)。實用標準文案【注】計算幾何均數(shù)的觀察值不能小于或等于 0,因為無法求對數(shù)。中位數(shù)中位數(shù)(median ,M),是在按大小順序排列的變量的所有觀察值中,位于正中間的一個或兩個數(shù)值。當數(shù)據(jù)呈偏態(tài)分布、或頻數(shù)分布兩端無確定數(shù)值,均宜采用中位數(shù)描述集中趨勢。中位數(shù)的確定取決于它在數(shù)據(jù)序列中的位置,因此對極端值不敏感。百分位數(shù)百分位數(shù)(percentile ),是一個位置指標,它將一組變量值排列后劃分為若干相等部分的分割點數(shù)值。用 Px表示,X用百分數(shù)表示。表示在按照升序排列的數(shù)據(jù)中,其左側(cè)(≤ Px)的觀察值個數(shù)在整個樣本中所占百分比為X%,其右側(cè)(≥ Px)的觀察值個數(shù)在整個樣本中所占百分比為 (100-X)%。百分位數(shù)不論資料分布類型均可計算,在實際工作中常用于確定醫(yī)學參考值范圍;在假設檢驗中用作拒絕或不拒絕檢驗假設的界值。百分位數(shù)并非由全部觀察值綜合計算得來,因此,它不如均數(shù)和標準差精確;然而中間部分的百分位數(shù)因不受資料中個別極端數(shù)據(jù)的影響,具有較好的穩(wěn)定性。小結(jié)指標意義適用場合均數(shù)個體的平均值對稱分布,特別是正態(tài)分布資料。幾何均數(shù)平均倍數(shù)取對數(shù)后對稱分布。中位數(shù)位次居中的觀察值①非對稱分布;②半定量資料;③末端無確切數(shù)值;④分布不明。精彩文檔變異程度的統(tǒng)計指標變異指標,又稱離散指標, 用以描述一組計量資料各觀察值之間參差不齊的程度。變異指標越大,觀察值之間差異愈大,說明變異程度越大;反之亦然。常用的有極差、四分位數(shù)間距、方差、標準差和變異系數(shù)。極差極差(range,R),等于一個變量所有觀察值中最大值與最小值之間的差值。R=Max -Min缺點:①沒有利用觀察值的全部信息,不能反映其它數(shù)據(jù)的離散度;②各樣本含量大小懸殊時,不宜比較其極差;③極差的抽樣誤差也較大,所以不夠穩(wěn)定。極差僅適用于對未知分布的小樣本資料作粗略的分析。四分位數(shù)間距四分位數(shù),是統(tǒng)計學對特殊的三個百分位數(shù) P25% 、P50% 和P75%的統(tǒng)稱四分位數(shù)間距( quartilerange ,Q), 等于第三四分位數(shù)與第一四分位數(shù)之間的差值。Q=P75% -P25%缺點:①沒有利用觀察值的全部信息,不能反映其它數(shù)據(jù)的離散度;四分位數(shù)間距僅用來描述大樣本偏態(tài)資料的變異情況。方差實用標準文案方差(variance ),是描述一個變量的所有觀察值與總體均數(shù)的平均離散程度的指標??傮w方差用σ2表示,樣本方差用 S2表示。標準差標準差(standard deviation ,S), 是描述一個變量的所有觀察值與均數(shù)的平均離散程度的指標??傮w標準差用σ表示,樣本標準差用 S表示。標準差方差或標準差屬同類變異指標,它們多用來描述均勻分布或近似正態(tài)分布的資料,大、小樣本均可,其中以標準差的應用最廣,通常與均數(shù)結(jié)合使用。比如在許多醫(yī)學研究報告中常用 X拔±S的形式表達資料。變異系數(shù)變異系數(shù)(coefficientofvariation ,CV), 是一個度量相對離散程度的指標。CV是無量綱的指標,可以用來比較幾個量綱不同的指標變量之間的離散程度的差異,或比較量綱相同但均數(shù)相差懸殊的變量之間的離散程度的差異。小結(jié)指標意義適用場合極差觀察值的取值范圍不拘分布形式,概略分析。四分位數(shù)居中半數(shù)觀察值的極差①非對稱分布;②半定量資料;間距③末端無確切數(shù)值;④分布不明。標準差觀察值距離均數(shù)的平均程度對稱分布,特別是正態(tài)分布資料。(方差)精彩文檔變異系數(shù) 變異程度大小的對比 ①不同量綱的變量間比較;②量綱相同但數(shù)量級相差懸殊的變量間比較。第三章 正態(tài)分布與醫(yī)學參考值范圍正態(tài)分布,是一種連續(xù)型隨機變量常見而重要的分布。正態(tài)曲線,是一條高峰位于中央,兩側(cè)逐漸下降并完全對稱,曲線兩端永遠不與橫軸相交的鐘型曲線。如果隨機變量 X的分布服從概率密度函數(shù)和概率分布函數(shù)稱連續(xù)型隨機變量 X服從正態(tài)分布,記為X~N( μ,σ2)。π為圓周率,為自然對數(shù)的底值,σ為總體標準差,μ為總體均數(shù)。正態(tài)分布的特征1、正態(tài)分布是單峰分布,以 X=μ為中心,左右完全對稱,正態(tài)曲線以 X軸為漸近線,兩端與X軸不相交。2、正態(tài)曲線在 X=μ處有最大值,其值為 f(μ)=1/(μ√2π);X越遠離μ,f(X)值越小,在X= μ±σ處有拐點,呈現(xiàn)鐘形。、正態(tài)分布完全由參數(shù)μ和σ決定。μ是位置參數(shù),決定正態(tài)曲線在 X軸上的位置。在σ一定時, μ增大,曲線沿橫軸向?qū)嵱脴藴饰陌赣乙苿樱?μ較小,曲線沿橫軸向左移動。σ是形狀參數(shù),決定正態(tài)曲線的分布形態(tài)。σ越大,曲線的形狀越“矮胖”,表示數(shù)據(jù)分布越分散; σ越小,曲線的形狀越“瘦高”,表示數(shù)據(jù)分布越集中。正態(tài)曲線下面積分布規(guī)律、服從正態(tài)分布的隨機變量在某一區(qū)間上的曲線下面積與其在同一區(qū)間上取值的概率相等。2、曲線下的總面積為 1或100%,以μ為中心左右兩側(cè)面積各占 50%,越靠近μ處曲線下面積越大,兩邊逐漸減少。、所有的正態(tài)曲線,在μ左右的任意個標準差范圍內(nèi)面積相同。一些特殊情況,在μ±σ范圍內(nèi)的面積約為 68.27%,在μ±1.96σ范圍內(nèi)的面積約為95.00%,在μ±2.58σ范圍內(nèi)的面積約為 99.00%。標準正態(tài)分布對任意一個服從 N(μ,σ2)分布的隨機變量 X,經(jīng)Z=X-μ/σ變換都可以轉(zhuǎn)為μ=0、σ=1的標準正態(tài)分布,也稱隨機變量的標準化變換。標準正態(tài)分布的應用實際應用中,經(jīng) z變換可把求解任意一個正態(tài)分布曲線下面積的問題,轉(zhuǎn)化成標準正態(tài)分布曲線下相應面積的問題。正態(tài)分布的應用、制定醫(yī)學參考值范圍、質(zhì)量控制、正態(tài)分布是很多統(tǒng)計方法的理論基礎(chǔ)醫(yī)學參考值范圍精彩文檔醫(yī)學參考值范圍 ,指正常人的解剖、生理、生化、免疫及組織代謝產(chǎn)物的含量等各種數(shù)據(jù)的波動范圍。醫(yī)學參考值范圍,習慣上是包含

95%的參照總體的范圍。制訂的注意事項a、抽取足夠例數(shù)的同質(zhì)“正常人”樣本★“正常人”的定義,樣本量( n>120),隨機化。、確定具有實際意義的統(tǒng)一測量標準★指標的測量方法等要有規(guī)定,控制測量誤差。c、根據(jù)指標的性質(zhì)確定是否要分組★根據(jù)實際情況、專業(yè)知識。、根據(jù)指標含義決定單、雙側(cè)范圍★單側(cè)下限,過低異常;單側(cè)上限,過高異常;雙側(cè),過高、過低均異常。、選擇適當?shù)陌俜址秶锝^大多數(shù)人,一般 80%、90%、95%、99%;★減少誤診,取較大范圍;減少漏診,取較小范圍。、估計參考值范圍★根據(jù)資料分布類型:正態(tài)分布法、百分位數(shù)法。第四章 定性數(shù)據(jù)的統(tǒng)計描述相對數(shù),是兩個有關(guān)的絕對數(shù)之比,也可以是兩個統(tǒng)計指標之比。計算相對數(shù)的意義 主要是把基數(shù)化作相等,便于相互比較。相對數(shù)主要用于定性資料的統(tǒng)計描述。常用的指標有頻率、構(gòu)成比、相對比。實用標準文案頻率頻率(rate),表示在一定范圍內(nèi)某現(xiàn)象的發(fā)生數(shù)與可能發(fā)生的總數(shù)之比,說明某現(xiàn)象出現(xiàn)的頻率或概率??傮w率用π來表示,樣本率用P來表示。需要注意的是,率在更多情況下是一個具有時間概念的指標,即用于說明在一段時間內(nèi)某現(xiàn)象發(fā)生的強度或頻率。構(gòu)成比構(gòu)成比,表示某事物內(nèi)部各組成部分在整體中所占的比重。構(gòu)成比之和應為 100%,某一構(gòu)成部分的增減會影響其他構(gòu)成部分相應的減少或增加;而某一部分率的變化并不影響其他部分率的變化,且其平均率不能簡單地將各率相加后平均求得。相對比相對比,是A、B兩個有關(guān)聯(lián)指標之比,用以描述兩者的對比水平。相對危險度(relativerisk,RR),用于流行病學中隊列研究資料。比數(shù)比(oddsratio,OR),用于流行病學中病例對照研究資料。小結(jié)指標計算公式適用場合頻率n/N估計總體中某一結(jié)局發(fā)生的概率或可能性構(gòu)成比n1/N,n2/N,?,nk/N估計總體中所有可能結(jié)局所占的比例或比重相對比A/B估計兩個指標的相對大小構(gòu)成比表示某事物內(nèi)部各部分所占的比例或比重,頻率是表明某現(xiàn)象發(fā)生的頻率或概率。精彩文檔構(gòu)成比的分子中的個體一定是分母中的一部分,而相對比則不一定;構(gòu)成比是同一類事物的數(shù)值之比,相對比可以是任意兩個數(shù)值之比。相對數(shù)的使用注意、區(qū)別構(gòu)成比和頻率★頻率,強度相對數(shù);構(gòu)成比,結(jié)構(gòu)相對數(shù)。、使用相對數(shù)時分母不宜過小★如分母太小,用絕對數(shù)表示,如“ 3例中死亡1例”。、注意相對數(shù)的可比性★研究對象要同質(zhì),方法要相同,觀察時期要一致等。、考慮存在抽樣誤差★對總體進行推斷應作統(tǒng)計學檢驗。率的標準化標準化率,是為了在比較兩個不同人群的患病率、發(fā)病率、死亡率等資料時,消除內(nèi)部構(gòu)成(如年齡、性別、工齡、病程長短等)不同而不能直接比較所產(chǎn)生的影響。標準化率僅用于相互比較,不代表實際水平;當標準構(gòu)成不同時,標準化率一般也不相同。標準構(gòu)成的選取★從外部取一個公認的標準構(gòu)成比,如全國范圍或全省范圍的數(shù)據(jù)、國際間比較時取世界通用標準?!飳讉€組的觀察例數(shù)合并,計算出合并的構(gòu)成比,以其作為標準構(gòu)成比?!锶∧骋粋€組的構(gòu)成比為標準構(gòu)成比。醫(yī)學中常用相對數(shù)指標實用標準文案死亡率,又稱粗死亡率, 表示某年某地每千人中的死亡人數(shù)。反映當?shù)鼐用窨傮w死亡水平。對不同地區(qū)的死亡率進行比較時,應注意不同地區(qū)人口年齡或性別構(gòu)成的影響。若年齡或性別構(gòu)成存在差異,需先將死亡率標化后再進行比較。年齡別死亡率, 表示某年某地某年齡組每千人口中的死亡數(shù)。死因別死亡率, 表示某年某地每 10 萬人中因某種疾病死亡的人數(shù)。反映各類病傷死亡對居民生命的危害程度。死亡(因)構(gòu)成,也稱相對死亡比, 表示全部死亡人數(shù)中,死于某死因者占總死亡數(shù)的百分比。反映各種死因的相對重要性。疾病統(tǒng)計指標發(fā)病率,表示在一定期間內(nèi),一定人群中某病新發(fā)生的病例出現(xiàn)的頻率。反映疾病對人群健康影響和描述疾病分布狀態(tài)的一項測量指標?;疾÷?,也稱現(xiàn)患率, 表示某一時點某人群中患某病的頻率。反映病程較長的慢性病的發(fā)生或流行情況。病死率,表示某期間內(nèi),某病患者中因某病死亡的頻率。反映該疾病的嚴重程度和醫(yī)療水平。治愈率,表示接受治療的病人中治愈的頻率。第五章 統(tǒng)計表與統(tǒng)計圖統(tǒng)計表,把反映某事物的數(shù)量特征以及相互關(guān)系的統(tǒng)計數(shù)字用表格的形式歸納起來。特點:精彩文檔①避免冗長的文字敘述、減少篇幅;②便于表達事物間的內(nèi)在聯(lián)系和區(qū)別;③便于分析、比較并易于發(fā)現(xiàn)和糾正錯誤。編制原則、重點突出,簡單明了★一張表表達一個中心內(nèi)容或主題。、主謂分明,層次清楚★定語在標題內(nèi),主語作為橫標目,謂語作為縱標目。、數(shù)據(jù)表達規(guī)范、文字和線條從簡結(jié)構(gòu)、標題★位于統(tǒng)計表的最上部,應包括表的編號。、標目★縱標目標示相應一列(或數(shù)列)的內(nèi)容;橫標目標示相應行的內(nèi)容。、線條★不宜太多,一般為三線表;★不允許使用豎線與斜線。、數(shù)字★一律使用阿拉伯數(shù)字;★同一指標的小數(shù)位數(shù)應一致,位次要對齊;★數(shù)值為零時應寫“0”,缺省用“?”表示,不存在或不需要用“—”表示。、備注實用標準文案★不是統(tǒng)計表的必須項目,需要時才用;★位于統(tǒng)計表的最下部,表格之外,用“

*”號標出。統(tǒng)計圖統(tǒng)計圖,是指用幾何圖形(點、線段、直條等)顯示統(tǒng)計指標的大小、對比關(guān)系或變化趨勢。特點:與統(tǒng)計表相比,統(tǒng)計圖更加直觀,更便于比較和分析。但它不能確切地顯示數(shù)字大小,因此常與統(tǒng)計表一并使用。常用的統(tǒng)計圖有:條圖、圓圖、百分條圖 、線圖、直方圖等。制作原則a、根據(jù)資料性質(zhì)、分析目的選用適當?shù)慕y(tǒng)計圖、一個圖表達一個中心內(nèi)容或主題。c、圖形應準確、美觀。結(jié)構(gòu)、標題★位于統(tǒng)計圖的下方,應包括圖的編號。、圖域★一般用直角坐標系第一象限的位置表示圖域。、標目★縱標目和橫標目,表示縱軸和橫軸數(shù)字刻度;★一般有度量衡單位。、圖例★對圖中不同顏色或圖案代表的指標進行注釋;精彩文檔★圖例放在橫標目與標題之間,或放在圖域中。、刻度★刻度數(shù)值從小到大,縱軸由下向上,橫軸由左向右。描述定量數(shù)據(jù)的統(tǒng)計圖直方圖,用于表示連續(xù)變量頻數(shù)分布情況。線圖,適用于描述一個變量隨另一個變量變化的趨勢。半對數(shù)線圖,用來比較事物之間相對的變化速度。箱圖,適用于比較多組資料的集中趨勢和離散趨勢。一般選用五個描述統(tǒng)計量( Min、P25、M、P75、Max)來繪制。誤差條圖,適用于比較多組資料的均值和可信區(qū)間。散點圖,用點的密集程度和變化趨勢來表示兩指標之間的直線或曲線關(guān)系。條圖,適用于各組資料之間指標的比較。圓圖,描述一組構(gòu)成比資料。百分條圖,描述多組構(gòu)成比資料小結(jié)圖形主要目的說明條圖比較各組之間的統(tǒng)計指標一個坐標軸為組名稱,另一個坐標軸為頻率;的差別多個指標變量可放在一個圖中圓圖描述變量的構(gòu)成比沒有坐標軸;用圖例區(qū)分各部分實用標準文案百分條圖比較多個指標變量的構(gòu)成一個坐標軸為各變量名稱,另一個坐標軸刻度比為0~100%;用圖例區(qū)分各部分線圖描述一個變量隨另一個變兩個變量的觀察值必須一一對應;橫軸為自變量變化的趨勢量,縱軸為因變量半對數(shù)線同上因變量的變異較大時使用;其他同上圖箱圖比較一個變量在多個組上一個坐標軸為組名稱,另一個坐標軸為該變量的分布的取值散點圖描述兩個指標變量之間的兩個變量的觀察值可以不一一對應;橫軸為自直線相關(guān)關(guān)系變量,縱軸為因變量第六章 參數(shù)估計抽樣誤差:由個體差異和抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差異。包括:樣本統(tǒng)計量與總體參數(shù)間的差異,樣本統(tǒng)計量間的差異。具有如下特點: 1、各樣本均數(shù)未必等于總體均數(shù);2、各樣本均數(shù)間存在差異;、樣本均數(shù)的分布圍繞著總體均數(shù)呈現(xiàn)中間多、兩邊少、左右基本對稱,近似服從正態(tài)分布;、樣本均數(shù)的變異范圍較之原變量的變異范圍??;、隨著樣本含量的增大,樣本均數(shù)的變異范圍逐漸縮小。均數(shù)的標準誤標準誤(standarderror ,SE),指樣本統(tǒng)計量的標準差。精彩文檔均數(shù)的標準誤 (standard error of mean,SEM),指樣本均數(shù)的標準誤。它反映樣本均數(shù)間的離散程度,反映樣本均數(shù)與相應總體均數(shù)間的差異,說明了均數(shù)抽樣誤差的大小。在n一定的情況下,標準誤與標準差呈正比,說明當總體中各觀測值變異較小時,抽到的X拔與μ可能相差較小,X拔用估計μ的可靠程度高;反之,當總體中各觀測值變異較大時,可靠程度較低。標準誤與樣本含量的平方根呈反比,說明在同一總體中隨機抽樣, n越大,標準誤越小。率的抽樣誤差率的標準誤(standarderror of rate,SER),指樣本率的標準誤。它反映樣本率間的離散程度,反映樣本率與相應總體率間的差異,說明了率抽樣誤差的大小??傮w率標準誤用 σp表示,樣本率標準誤用 Sp表示。總體均數(shù)的估計概述點估計(pointestimation ),是用樣本統(tǒng)計量直接作為其總體參數(shù)的估計值。區(qū)間估計(intervalestimation ),是按預先給定的概率 (1-α)所確定的包含未知總體參數(shù)的一個范圍。點估計:優(yōu)點:表達簡單 缺點:未考慮抽樣誤差,無法評價參數(shù)估計的準確程度可信區(qū)間在區(qū)間估計中,預先給定的概率 (1-α),稱為可信度(confidencelevel ),常取95% 或99% 。實用標準文案通過可信度,計算得到的區(qū)間范圍,稱為 可信區(qū)間(confidenceinterval ,CI )??尚艆^(qū)間由兩個數(shù)值界定的可信限( confidencelimit ,CL)構(gòu)成,較小的數(shù)值為下限(lowerlimit ,L ),較大的數(shù)值為上限( upperlimit ,U ),一般表示為L~U ??尚哦葹?5%可信區(qū)間的涵義: 若重復100次樣本含量相同的抽樣,每個樣本均按同一方法構(gòu)建95%可信區(qū)間,則理論上平均有 95個可信區(qū)間包含了總體均數(shù),只有 5個可信區(qū)間未包含。可信區(qū)間估計的優(yōu)劣: 準確性,反映可信度 1-α的大小,其值越接近 1越好。精確性,用可信區(qū)間的寬度 CU-CL衡量,寬度越小越好。t分布t分布:主要用于總體均數(shù)的區(qū)間估計和 t檢驗等。ν為自由度(degreeoffreedom ,df ),指能夠自由取值的變量個數(shù)。分布的特點:1、t分布圖是一簇曲線,曲線的形態(tài)變化與自由度有關(guān)。、隨ν的增大,曲線越來越接近標準正態(tài)分布曲線;、當ν→∞時,t分布的極限分布就是標準正態(tài)分布。、t分布的密度曲線下面積有一定的規(guī)律性。在t界值表中,橫標目為自由度,縱標目為尾部概率。一側(cè)尾部面積稱為單側(cè)概率(one-tailedprobability ),兩側(cè)尾部面積之和稱為雙側(cè)概率( two-tailedprobability )。精彩文檔從t界值表中看出:在相同自由度時,│t│值越大,概率P越小。小結(jié)區(qū)別 總體均數(shù)的可信區(qū)間 參考值范圍點含義 按預先給定的概率確定的 “正常人”的解剖,生理,未知參數(shù)μ的可能范圍。 生化等某項指標的波動范圍??傮w均數(shù)的波動范圍個體值的波動范圍計算σ未知:正態(tài)分布:±Szα/2公式σ已知或σ未知但n>60:(雙側(cè))偏態(tài)分布:Px~P100-x(雙側(cè))樣本n越大,CI越?。籲→∞,n越大,參考值范圍越穩(wěn)量CI→0定的作用兩總體均數(shù)差值的區(qū)間估計用途估計總體均數(shù)估計絕大多數(shù)觀察對象某在實際工作中,常常需要估計兩總體均數(shù)之差μ 1-μ2的大小,需估計兩總體均數(shù)差值的可項指標的分布范圍實用標準文案信區(qū)間??傮w率的區(qū)間估計小樣本率的區(qū)間估計:在樣本例數(shù)較小,且樣本率接近 1或0時,利用二項分布可估計其總體率的 (1-α)可信區(qū)間。當n≤50,樣本例數(shù)n和陽性例數(shù)X≤n/2時,直接查表得到 95%和99%可信區(qū)間。當陽性例數(shù)X>n/2時,用n-X查表,獲得總體陰性率可信區(qū)間,再用 1減去總體陰性率可信區(qū)間,既為總體陽性率可信區(qū)間。大樣本率的區(qū)間估計在樣本例數(shù)較大,且 p和1-p均不太小,如 np與n(1-p)均大于5時,樣本率 p的抽樣分布近似正態(tài)分布,可按正態(tài)分布近似法求總體率的 (1-α)可信區(qū)間。兩總體率差值的區(qū)間估計設兩樣本率分別為 p1和p2,當n1與n2均較大,且p1 ,1-p1及p2 ,1-p2均不太小,如n1p1 、n1(1-p1) 、n2p2 、n2(1-p2)均大于5時, 可采用正態(tài)近似法對兩總體率差值進行可信區(qū)間估計。第七章 假設檢驗假設檢驗(hypothesistesting )也稱顯著性檢驗( significancetest ),是用來判斷樣本與樣本,樣本與總體的差異是由抽樣誤差引起還是本質(zhì)差別造成的統(tǒng)計推斷方法。假設檢驗的基本思想反證法思想:先提出假設,再用適當?shù)慕y(tǒng)計方法確定假設成立的可能性大小,如可能性小,則認為假設不成立。小概率事件:是指在一次試驗中基本上不大會發(fā)生的事件。精彩文檔假設檢驗的基本步驟a、 建立假設無效假設(nullhypothesis ),記為 H0,指需要檢驗的假設,即μ 1=μ2。b、 確定檢驗水準檢驗水準( levelofatest )也稱為顯著性水準( significancelevel ),是預先規(guī)定的判斷小概率事件的概率尺度,記為 α。實際中一般取 α=0.05 或α=0.01 。c、選擇檢驗方法,計算統(tǒng)計量根據(jù)資料類型、研究設計方案和統(tǒng)計推斷的目的,選擇適當?shù)臋z驗方法和計算公式。如:t檢驗、u檢驗、F檢驗、χ2檢驗。c、 確定P值,作出統(tǒng)計推斷結(jié)論P值(probability value),指由 H0所規(guī)定的總體做重復隨機抽樣,獲得等于及大于當前檢驗統(tǒng)計量的概率。確定P值的方法:依據(jù)檢驗統(tǒng)計量的自由度、檢驗水準,查檢驗統(tǒng)計量對應的界值表,通過檢驗界值,得到與檢驗統(tǒng)計量相對應的 P值范圍。如:u0.05/2=1.96 對應的P值為0.05。d、 確定P值,作出統(tǒng)計推斷結(jié)論假設檢驗規(guī)定:如果一次試驗結(jié)果P≤α,拒絕H0,結(jié)論為“差別有統(tǒng)計學意義”。P≥α,不拒絕H0,結(jié)論為“差別沒有統(tǒng)計學意義”。值的習慣表述:實用標準文案P>0.05稱“不顯著”( notsignificant );P≤0.05稱“顯著”( significant );P≤0.01稱“非常顯著”( highlysignificant )。假設檢驗中兩類錯誤假設檢驗是利用小概率反證法思想,從問題的對立面 (H0)出發(fā)間接判斷要解決的問題 (H1)是否成立,然后在假定 H0成立的條件下計算檢驗統(tǒng)計量,最后根據(jù) P值判斷結(jié)果,此推斷結(jié)論具有概率性,因而無論拒絕還是不拒絕 H0,都可能犯錯誤。檢驗效能(poweroftest ),指當兩總體確有差別,按 α水準,假設檢驗能發(fā)現(xiàn)其差別的能力。記為 1- β。α愈小,β愈大;α愈大,β愈小。若要同時減?、裥湾e誤和Ⅱ型錯誤,唯一方法是增加樣本量。第七章單樣本t檢驗(onesamplet-test ),適用于樣本均 X拔與已知均數(shù)μ0的比較,目的是檢驗樣本均數(shù)μ0所代表的未知總體均數(shù)μ 是否與已知總體均數(shù)μ 0有差別。已知總體均數(shù)μ0一般指理論值、標準值或經(jīng)過大量觀察所得到的穩(wěn)定值。精彩文檔配對樣本均數(shù) t檢驗(paired t-test),適用于配對設計的計量資料兩相關(guān)樣本均數(shù)的比較,目的是檢驗兩相關(guān)樣本均數(shù)所代表的未知總體均數(shù)是否有差別。配對設計(paireddesign ),是將受試對象按某些重要特征相近的原則配成對子,每對中的兩個個體隨機地給予兩種處理。配對設計處理分配方式:?將同一受試對象處理前后的結(jié)果進行比較;?同一受試對象隨機分配接受不同處理;?同一標本的兩個部位測試同一指標;?兩個同質(zhì)受試對象分別接受兩種處理。兩獨立樣本均數(shù) t檢驗(two independent samples t-test ),適用于完全隨機設計兩獨立樣本均數(shù)的比較,目的是檢驗兩獨立樣本均數(shù)所代表的未知總體均數(shù)是否有差別。完全隨機設計( completelyrandomdesign ):從某研究總體隨機抽取一定數(shù)量的研究對象,將其隨機分配到兩組,接受不同的處理后,測量某指標后進行組間比較。兩獨立樣本均數(shù) t檢驗要求兩樣本所代表的總體方差相等 ,即方差齊性注意事項:、假設檢驗結(jié)論正確的前提★作假設檢驗用的樣本資料,必須能代表相應的總體,各對比組具有良好的組間均衡性。、檢驗方法的選用及其適用條件★根據(jù)分析目的、研究設計、資料類型、樣本量大小等選用適當?shù)臋z驗方法。、雙側(cè)檢驗與單側(cè)檢驗的選擇★根據(jù)研究目的和專業(yè)知識予以選擇,一般選用雙側(cè)檢驗。實用標準文案、假設檢驗的結(jié)論不能絕對化★列出概率的確切數(shù)值或給出范圍,注明采用單側(cè)檢驗還是雙側(cè)檢驗。、正確理解P值的統(tǒng)計意義第八章 方差分析方差分析,能用于兩個或兩個以上樣本均數(shù)的比較,還可分析兩個或多個研究因素的交互作用以及線性回歸方程的假設檢驗等?;舅枷胧牵悍治鲎儺悾簿褪欠纸庾儺?,即將數(shù)據(jù)總的變異分解為處理因素引起的變異和隨機誤差引起的變異,通過對兩者進行比較作出處理因素有無作用的統(tǒng)計推斷。應用條件?各組樣本是相互獨立的隨機樣本?各組樣本都來自正態(tài)總體。?各組總體方差相等,即方差齊性。完全隨機設計的方差分析完全隨機設計,是按一個處理因素隨機分組,統(tǒng)計分析處理因素各個水平組間均數(shù)差別有無統(tǒng)計學意義。a、變異的分解b、自由度分解c、估計方差(均方)d、F統(tǒng)計量的計算e、F分布及確定 P值隨機區(qū)組設計的方差分析隨機區(qū)組設計( randomized block design ),是先按對試驗結(jié)果有影響的非研究因素精彩文檔將受試對象配成若干個區(qū)組,再分別將各區(qū)組內(nèi)的受試對象隨機分配到處理水平不同的各個組。多個樣本均數(shù)的兩兩比較經(jīng)方差分析,若各組的均數(shù)差別無統(tǒng)計學意義,則不需要作進一步的統(tǒng)計處理,但是當方差分析結(jié)果為 P<α時,只說明各組總體均數(shù)不相同或不全相同,不能說明各組總體均數(shù)間有差別。如果要分析哪兩組間均數(shù)有差別,需進行多組均數(shù)間的多重比較。多個樣本均數(shù)兩兩比較方法選擇策略第九章 卡方檢驗方差齊性檢驗的作用 :Bartlett 檢驗法主要適用于正態(tài)分布資料的方差齊性檢驗問題??ǚ綑z驗常用于 推斷兩個總體率(或構(gòu)成比)之間有無差別。χ2值反映了實際頻數(shù)與理論頻數(shù)的吻合程度。若假設成立,實際頻數(shù)與理論頻數(shù)的差值較小, χ2值也較??;若假設不成立,實際頻數(shù)與理論頻數(shù)的差值較大, χ2值也較大。配對四格表資料的卡方檢驗計數(shù)資料的配對設計常用于兩種檢驗方法、培養(yǎng)方法、診斷方法的比較。特點是對樣本中各觀察單位分別用兩種方法處理,然后觀察兩種處理方法的某兩分類變量的計數(shù)結(jié)果R×C列聯(lián)表資料的卡方檢驗用于多個樣本率的比較、兩個或多個構(gòu)成比的比較?;緮?shù)據(jù)為:實用標準文案⑴多個樣本率比較時,有 R行2列;⑵兩個樣本構(gòu)成比比較時,有 2行C列;⑶多個樣本構(gòu)成比比較時,有 R行C列。采用 Bonferroni 法進行多個樣本率的兩兩比較,步驟如下:①對需要比較的行×列表資料進行χ2分割,變成多個四格表;②對每個四格表進行χ 2檢驗;③采用(α‘=α/比較次數(shù))計算調(diào)整的水準,其中α為事先確定的水準;④以α‘調(diào)整作為檢驗檢驗水準,作出結(jié)論。R×C列表表 χ2檢驗注意事項:① 若有1/5 以上的格子出現(xiàn) 1≤T<5,則② 增大樣本含量,以達到增大理論頻數(shù)的目的;③ 結(jié)合專業(yè),刪去理論頻數(shù)太小的格子對應的行或列;④ 結(jié)合專業(yè),將理論頻數(shù)太小的行或列與性質(zhì)相近的行或列合并;⑤ 用雙向無序R×C表資料的Fisher確切概率法。b、多個樣本率比較,若統(tǒng)計推斷為拒絕 H0 ,接受 H1 ,只能認為各總體率或構(gòu)成比之間總的來說有差別。若要進一步了解哪兩者之間有差別,可用卡方分割法,或者調(diào)整檢驗水準。c、對于單向有序的 R×C表資料,在比較各處理組的效應有無差別時,應該用秩和檢驗。第十章 非參數(shù)秩和檢驗參數(shù)檢驗,是基于隨機樣本來自某已知分布的總體,推斷兩個或兩個以上總體參數(shù)是否相同的方法。常用的方法有: t檢驗、方差分析。特點主要有:①對總體參數(shù)進行估計或檢驗是主要目的;精彩文檔②要求總體分布已知;③統(tǒng)計量有明確的理論依據(jù);④有嚴格的使用條件,要求總體分布符合正態(tài)分布、總體方差齊性、數(shù)據(jù)間相互獨立。非參數(shù)檢驗( nonparametric test),是在不考慮總體參數(shù)和分布類型的情況下,對總體的參數(shù)和分布位置進行檢驗的方法。常用的方法有:秩和檢驗、符號檢驗。特點主要有:①適用范圍廣,可應用于總體分布類型未知的計量資料、偏態(tài)分布的資料、等級資料、不滿足參數(shù)檢驗條件的資料等;②受限條件少,更適合一般情況;③具有較好的穩(wěn)健性;④方法簡便,易于理解和掌握。秩

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論