平均數(shù)與標(biāo)準(zhǔn)差衛(wèi)生統(tǒng)計學(xué),余金明.ppt_第1頁
平均數(shù)與標(biāo)準(zhǔn)差衛(wèi)生統(tǒng)計學(xué),余金明.ppt_第2頁
平均數(shù)與標(biāo)準(zhǔn)差衛(wèi)生統(tǒng)計學(xué),余金明.ppt_第3頁
平均數(shù)與標(biāo)準(zhǔn)差衛(wèi)生統(tǒng)計學(xué),余金明.ppt_第4頁
平均數(shù)與標(biāo)準(zhǔn)差衛(wèi)生統(tǒng)計學(xué),余金明.ppt_第5頁
已閱讀5頁,還剩20頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第三章 平均數(shù)與標(biāo)準(zhǔn)差,第一節(jié) 算術(shù)均數(shù)和幾何均數(shù),數(shù)值變量資料的統(tǒng)計描述:集中趨勢central tendency 和離散趨勢tendency of dispersion 平均數(shù)average:說明一組觀察值(變量值)的集中趨勢、中心位置或平均水平。(a measure of location, a measure of central tendency, a mean or an average) 平均數(shù)種類:算術(shù)均數(shù)arithmetic mean、幾何均數(shù)geometric mean、中位數(shù)median、眾數(shù)mode、調(diào)和均數(shù)harmonic mean, H,一、算術(shù)均數(shù),簡稱均數(shù)mean。 統(tǒng)計表示:總體的參數(shù)用希臘字母表示,樣本的統(tǒng)計量用拉丁字母表示 用表示總體均數(shù),用 表示樣本均數(shù) (一)不分組資料均數(shù)的計算法:直接計算 為避免過于復(fù)雜,在求和的范圍可看清時對sigma不記上下標(biāo)(dummy suffix),對x也不加下標(biāo) The mean is the sum of the observations divided by the number of observations.,(二)分組資料的均數(shù)計算法:頻數(shù)表法 P20例3-2,步驟: 1、分組和編制頻數(shù)分布表frequency distribution table 1)找出觀察值中最大值、最小值和極差range 2)按極差大小決定組段數(shù)、組段和組距class interval:815組,常用極差的1/10取整作組距,組段下限和上限low limit and upper limit應(yīng)界限分明,無交叉,從下限開始不包括上限,第一組段包括最小,最后組段包括最大觀察值 3)列表劃記tallying:見P20表3-2。頻數(shù)表可繪成直方圖histogram,2、加權(quán)法weighting method x為組中值class mid-value (midpoint)=本組下限與相鄰較大組段的下限相加除以2 k 為組數(shù) f 為各組的頻數(shù),又稱權(quán)數(shù)weight f 各組頻數(shù)之總和 fx 為各組組中值與頻數(shù)乘積之和 計算實例見P21,3、簡捷法short-cut method 1)在頻數(shù)表的基礎(chǔ)上,以與最大頻數(shù)相對應(yīng)的組中值為假定均數(shù)x0, assumed origin 2)列出簡捷法計算均數(shù)用表, d為各組組中值減去假定均數(shù)后除以組距i,假定均數(shù)對應(yīng)d為0,向上依次為-1,-2, 向下依次為1,2, 3)將各行f值與d值 相乘得df,再求df 4)求均數(shù) *: 可以任何一組組中值為假定均數(shù),結(jié)果一致,但設(shè)在頻數(shù)最大組或其附近時,計算較簡便。計算機(jī)更方便,二、幾何均數(shù)geometric mean,簡記為G 1)資料偏態(tài)分布,少數(shù)數(shù)據(jù)過分偏大,(各觀察值間呈等比關(guān)系 ),原始數(shù)據(jù)進(jìn)行對數(shù)變換后為對稱分布,如平均潛伏期、平均抗體滴度等資料 2)公式 P22例3-3,計算抗體滴度的幾何均數(shù);該方法計算出的G通常偏小,可在計算反對數(shù)前+(lgd)/2,3)幾何均數(shù)的應(yīng)用 幾何均數(shù)常用于等比資料 觀察值不能有0 觀察值不能同時有正值和負(fù)值,若全為負(fù)先把負(fù)號除掉,最后結(jié)果前加負(fù)號,第二節(jié) 中位數(shù)和百分位數(shù),一、median 用M表示: 把變量值按大小順序排列,居于中間位置的那個數(shù)值就是M 適用于:偏態(tài)或分布不明的資料 對稱分布時接近均數(shù),偏態(tài)分布時更合理 (一)未分組資料: P23例3-4,例3-5,(二)分組資料:按頻數(shù)表計算M 公式: L中位數(shù)所在組的下限 W中位數(shù)所在組的寬度 f中位數(shù)所在組的頻數(shù)(例數(shù)) n總頻數(shù) C中位數(shù)所在組的前一組的累計頻數(shù)cumulative frequency,用累計頻數(shù)百分?jǐn)?shù)法尋找中位數(shù)所在的組段:累計頻數(shù)剛大于n/2的組段 用內(nèi)插法linear interpolation求中位數(shù) 將W等分為f份,從C至n/2的數(shù)值長為(W/f)*(n/2 C),L值,累計頻數(shù)C,n/2,二、百分位數(shù)percentile:指將n個觀察值從小到大依次排列,再把它分成100等份,對應(yīng)于r%位的數(shù)值即為第r百分位數(shù)。通常用Pr 表示。中位數(shù)即第50百分位數(shù) (一)不分組資料的計算方法 Pr=x r%(n+1) 當(dāng)n為150時計算第5百分位數(shù)5%(150+1)= 7.55個變量值,如第7個變量為15,第8個變量為17,用內(nèi)插法求x7.55=15+0.55(17-15)=16.1,P5為16.1,(二)分組資料的計算方法 percentile is estimated by linear interpolation as (三)要計算多個百分位數(shù)時亦用圖解法:y axis is cumulative relative frequency, x axis is observation (incubation period). see Figure 3-2, P25,中位數(shù)和百分位數(shù)的應(yīng)用 1)中位數(shù)常用于描述偏態(tài)分布資料的集中位置,反映位次居中的觀察值的水平,只受居中變量值波動的影響,對稱分布時與均數(shù)相同 2)百分位數(shù)用于描述觀察值在某百分位位置時的水平,多個百分位數(shù)結(jié)合應(yīng)用可更全面描述分布特征 3)百分位數(shù)常用于確定醫(yī)學(xué)參考值范圍(reference ranges, 正常值范圍) 4)分布中部的百分位數(shù)相當(dāng)穩(wěn)定,具有較好的代表性,但靠近兩端的百分位數(shù)只有在樣本數(shù)足夠大時才較穩(wěn)定。,第三節(jié) 標(biāo)準(zhǔn)差 standard deviation,一、標(biāo)準(zhǔn)差的意義: SD是表示一套變量值離散程度的指標(biāo),均數(shù)與標(biāo)準(zhǔn)差結(jié)合,能全面反映一套變量值的分布情況。SD is a measure of variation, scatter, spread or dispersion. 離散程度 離均差x-x 考慮正負(fù)值變?yōu)殡x均差的平方 考慮觀察值的個數(shù)則除以n,為方差variance, 考慮到V是觀察單位的平方,故開方得SD,由公式可見,當(dāng)各變量值愈接近均數(shù)時,標(biāo)準(zhǔn)差越小,當(dāng)各觀察值遠(yuǎn)離均數(shù)時,標(biāo)準(zhǔn)差越大,所以標(biāo)準(zhǔn)差能說明變量值的離散程度。 二、不分組資料的標(biāo)準(zhǔn)差的計算 用代數(shù)的方法將上述公式簡化為 P27表3-8計算實例,三、離均差平方和的簡化計算 離均差平方和sum of squares about the mean 簡記為lxx,即 離均差平方和或離均差積和sum of products計算時,當(dāng)原始數(shù)據(jù)比較大時,計算可以減一個數(shù)可除一個數(shù),進(jìn)行簡化。,三條規(guī)則: 1、原始數(shù)據(jù)減一個數(shù)或加一個數(shù)時,離均差平方和或積和數(shù)值不變 2、原始數(shù)據(jù)除以一個數(shù)a,則簡化值算出的離均差平方和要乘上一個a2才是原有的離均差平方和 3、離均差積和在計算時如將兩變量之一(如x),除以一個數(shù)a時,則求得之離均差積和要乘以一個a,才是原始數(shù)據(jù)的離均差積和;如y也同時除以一個數(shù)字b,則求得的離均差積和要同時乘以ab,四、分組資料的標(biāo)準(zhǔn)差計算 公式: 計算實例見P29表3-11 五、標(biāo)準(zhǔn)差的應(yīng)用 1、表示變量值的離散程度 2、概括地估計變量值的頻數(shù)分布 3、應(yīng)用于求正常值范圍normal range 4、計算標(biāo)準(zhǔn)誤 5、質(zhì)量控制,1、表示變量值的離散程度 均數(shù)相近,單位相同時,標(biāo)準(zhǔn)差大表示變量值分布較分散,反之亦然。 比較度量衡單位不同或均數(shù)相差懸殊的多組資料的變異度時,需改用變異系數(shù)coefficient of variation,CV表示標(biāo)準(zhǔn)差與均數(shù)之比 P29-30例3-7,8,2、正態(tài)分布normal (Gaussian) distribution 直方圖histogram:橫軸表示變量值的大小,以各長方塊面積代表頻數(shù),P30圖3-3,當(dāng)觀察例數(shù)逐漸增多,組距細(xì)分時變一條光滑的曲線,形狀近似正態(tài)曲線 正態(tài)曲線:呈對稱的鐘型,在均數(shù)處最高,兩側(cè)逐漸低下,兩端在無窮遠(yuǎn)處與底線相靠 正態(tài)分布的兩個參數(shù):正態(tài)總體的均數(shù)和標(biāo)準(zhǔn)差(和)。通常用N(,)表示,正態(tài)曲線的函數(shù)式density function: 正態(tài)曲線下面積分布規(guī)律: :占全部曲線下面積的68.27% 1.64:占全部曲線下面積的90.90% 1.96:占全部曲線下面積的95.00% 2.58:占全部曲線下面積的99.00%,3、正常值(參考值reference value)范圍:醫(yī)學(xué)上常把絕大多數(shù)(90%,95%,99%)正常人的某指標(biāo)值范圍稱為該指標(biāo)的正常值范圍。資料近似正態(tài)或經(jīng)變量變換后符合正態(tài)分布時可用上述面積規(guī)律來估計95正常值范圍,偏態(tài)資料可用百分位數(shù)法。 正常人并非完全健康的人,而是指排除了影響所研究指標(biāo)的疾病和有關(guān)因素的同質(zhì)人群。 按實際需要確定上下限或僅上限或僅下限。雙側(cè):1.64,1.96,2.58;單側(cè):1.28, 1.64, 2.33,4、質(zhì)量控制:為了控制實驗中的檢測誤差,常以均數(shù)加減2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論