統(tǒng)計學 第二章 定量資料的統(tǒng)計描述_第1頁
統(tǒng)計學 第二章 定量資料的統(tǒng)計描述_第2頁
統(tǒng)計學 第二章 定量資料的統(tǒng)計描述_第3頁
統(tǒng)計學 第二章 定量資料的統(tǒng)計描述_第4頁
統(tǒng)計學 第二章 定量資料的統(tǒng)計描述_第5頁
已閱讀5頁,還剩64頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 第二章第二章 定量資料的統(tǒng)計描述定量資料的統(tǒng)計描述目 錄q 第二節(jié)第二節(jié) 集中趨勢的描述集中趨勢的描述q 第三節(jié)第三節(jié) 離散趨勢的描述離散趨勢的描述q 第四節(jié)第四節(jié) 正態(tài)分布正態(tài)分布q 第一節(jié)第一節(jié) 頻數(shù)分布表頻數(shù)分布表學習要求w1.掌握頻數(shù)分布表的編制步驟和方法w2.熟悉頻數(shù)分布表的用途w3.掌握集中趨勢、離散趨勢的概念,適用條件和計算方法w4.掌握正態(tài)分布的概念,意義和特點;正態(tài)曲線下面積的分布規(guī)律:是用統(tǒng)計圖表、統(tǒng)計指標來描述資料的分布規(guī)律及其數(shù)量特征。:主要由組段和頻數(shù)兩部分組成表格。第一節(jié) 頻數(shù)分布表頻數(shù)分布表的編制頻數(shù)分布表的編制 w1. 1. 計算全距計算全距 : 一組變量值最

2、大值和最小值一組變量值最大值和最小值之差稱為全距之差稱為全距(range)(range),亦稱極差,常用,亦稱極差,常用R R表示。表示。 w2. 2. 劃分組段,確定組距:劃分組段,確定組距:組距用組距用i i表示;表示; 每每個組段的起點稱組下限,終點稱組上限。一般個組段的起點稱組下限,終點稱組上限。一般分為分為8 81515組。組。 w3. 3. 統(tǒng)計頻數(shù):統(tǒng)計頻數(shù):將所有變量值通過劃記逐個歸將所有變量值通過劃記逐個歸入相應組段。入相應組段。w4. 4. 頻率與累計頻率:頻率與累計頻率:將各組的頻數(shù)除以將各組的頻數(shù)除以n n所得所得的比值被稱為頻率。累計頻率等于累計頻數(shù)除的比值被稱為頻率

3、。累計頻率等于累計頻數(shù)除以總例數(shù)。以總例數(shù)。 頻數(shù)分布表的用途 1.1.揭示資料的分布類型揭示資料的分布類型 2.2.觀察資料的集中趨勢和離散趨勢觀察資料的集中趨勢和離散趨勢 3.3.便于發(fā)現(xiàn)某些特大或特小的可疑值便于發(fā)現(xiàn)某些特大或特小的可疑值 4.4.便于進一步計算統(tǒng)計指標和作統(tǒng)計處理便于進一步計算統(tǒng)計指標和作統(tǒng)計處理 第二節(jié) 集中趨勢的描述 :代表一組同質(zhì)變量值的:代表一組同質(zhì)變量值的集中位置集中位置或或平均水平平均水平。v 常用的集中趨勢指標有常用的集中趨勢指標有:算術(shù)均數(shù)、幾何均數(shù)算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)等。和中位數(shù)等。一、算術(shù)均數(shù) 簡稱均數(shù)。簡稱均數(shù)。適用條件:對稱分布或近似對稱分

4、布的資料。適用條件:對稱分布或近似對稱分布的資料。 以希臘字母以希臘字母-總體均數(shù)總體均數(shù)(population mean)(population mean) 以英文字母以英文字母 -樣本均數(shù)樣本均數(shù)(sample mean)(sample mean)X1. 直接法:用于觀察值個數(shù)不多時 nXX計算方法計算方法2.加權(quán)法(weighting method):用于變量值個數(shù)較多時ffXffffffkkk212211XXXX注意:權(quán)數(shù)即頻數(shù)f,為權(quán)重權(quán)衡之意。 身高身高 (1) (1) 組中值組中值X X (2) (2) 頻數(shù)頻數(shù)f f (3) (3) fXfX(4)=(2)(3) (4)=(2)

5、(3) fX fX2 2(5)=(2)(4) (5)=(2)(4) 1251251271271 112712716129161291291291311314 45245246864468644133133135135101013501350182250182250合計合計 120 120 17168 17168 2460040 2460040 表表2-4 120名名12歲健康男孩身高歲健康男孩身高(cm)均數(shù)和標準差加權(quán)法計算表均數(shù)和標準差加權(quán)法計算表 w120名12歲健康男孩身高均數(shù)為143.07cm。 07計算結(jié)果計算結(jié)果:n個變量值的乘積開n次方。 適用條件:對

6、于變量值呈倍數(shù)關(guān)系或呈對數(shù)正態(tài)分布(正偏態(tài)分布),如抗體效價及抗體滴度,某些傳染病的潛伏期,細菌計數(shù)等。 計算公式:有直接法和加權(quán)法。 二、幾何均數(shù) 1.直接法:用于變量值的個數(shù)n較少時 nnXXXXG321nXnXXXGnlglglglglglg121131.116432168426G31.110536. 1lg664lg32lg16lg8lg4lg2lglg11G直接法計算實例直接法計算實例2.加權(quán)法:用于資料中相同變量值的個數(shù)f(即頻數(shù))較多時。 fXfGlglg1 抗體滴度抗體滴度 (1 1)頻數(shù)頻數(shù)f f (2 2)滴度倒數(shù)滴度倒數(shù)X X (3) (3) lglgX X (4) (4

7、) flgX flgX (5)=(2)(4) (5)=(2)(4) 1:41:42 24 40.60200.60201.20401.20401:81:86 68 80.90310.90315.41865.41861:161:167 716161.20411.20418.42878.4287合計合計 5050 89.1045 89.1045 表表2-5 50名兒童麻疹疫苗接種后血凝抑制抗體滴度幾何均數(shù)計算表名兒童麻疹疫苗接種后血凝抑制抗體滴度幾何均數(shù)計算表55.607821. 1lg501045.89lg11G50名兒童麻疹疫苗接種后平均血凝抑制抗體滴度為1:60.55。 計算結(jié)果:將有關(guān)已知數(shù)

8、據(jù)代入公式有變量值中若有0或者同時有正負值時,需加上常數(shù)K,計算結(jié)果后再還原;若全是負值,計算時可先把負號去掉,得出結(jié)果后再加上負號。 計算幾何均數(shù)注意事項:計算幾何均數(shù)注意事項:中位數(shù)v 定義:將一組變量值從小到大按順序排 列 , 位 次 居 中 的 變 量 值 稱 為。v適用條件:v變量值中出現(xiàn)個別特小或特大的數(shù)值;v資料的分布呈明顯偏態(tài),即大部分的變量值偏向一側(cè);v變量值分布一端或兩端無確定數(shù)值,只有小于或大于某個數(shù)值;v資料的分布不清。 三、中位數(shù)及百分位數(shù) )21(nXM2/ )12()2(nnXXMn為奇數(shù)時 n為偶數(shù)時 中位數(shù)計算(直接法):w定義:是一種位置指標,以Px表示。百

9、分位數(shù)是將頻數(shù)等分為一百的分位數(shù)。w一組觀察值從小到大按順序排列,理論上有x%的變量值小于或等于Px,有(100-x)%的變量值大于或等于Px。故P50分位數(shù)也就是中位數(shù),即P50=M 。 百分位數(shù) v描述一組資料在某百分位置上的水平;v用于確定正常值范圍;v計算四分位數(shù)間距。百分位數(shù)的應用條件:百分位數(shù)的應用條件:)%(LxxfxnfiLP 百分位數(shù)1.先找到包含Px的最小累計頻率所在的組段;2.該組段的變量值的下限值為L;3.該組段的頻數(shù)為fx,組距為i;4.該組段之前的累計頻數(shù)為fL;5.將x,n(已知)及上述各個值代入公式計算Px。計算百分位數(shù)的步驟:51. 8)17%25145(46

10、6625P45.19)101%75145(3261875P:用來說明變量值的離散程度或變異程度。w注意:僅用集中趨勢尚不能完全反映一組數(shù)據(jù)的特征。故應將集中趨勢和離散趨勢結(jié)合起來才能更好地反映一組數(shù)據(jù)的特征。w常用離散指標有:極差、四分位數(shù)間距、標準差、方差、變異系數(shù)。第三節(jié) 離散趨勢的描述 w甲組: 183 184 185 186 187w乙組: 175 180 185 190 195w兩組球員的平均身高都是185cm,但甲組球員身高比較集中,乙組球員身高比較分散。為了說明離散趨勢,就要用離散指標。 實例分析極差v 亦稱全距,即一組變量值中最大值與最小值之差 。v特點:計算簡單,不穩(wěn)定,不全

11、面,易變化;可用于各種分布的資料。一、極差和四分位數(shù)間距 四分位數(shù)間距 公式: Q Q = = P P7575- -P P2525 =Q=QU U-Q-QL L 特點:比極差穩(wěn)定,只反映中間兩端值的差異。 計算不太方便??捎糜诟鞣N分布的資料。二、方差和標準差 w方差(variance) NX22)(1)(22nXXS總體方差總體方差 樣本方差樣本方差 ,用希臘字母(nju:)或者df表示。v 定義:在合計值不變的情況下,n個變量中能夠自由變動的變量值的個數(shù)。v 通常df=n-k。其中n為樣本含量,k為被限制的條件數(shù)或變量個數(shù)。 v 例:ABC,共有n=3個元素,其中只能任選2個元素的值,故自由

12、度n-1=3-1=2。 方差的特點1.充分反映每個數(shù)據(jù)間的離散狀況,意義深刻;2.指標穩(wěn)定,應用廣泛,但計算較為復雜,不易理解;3.方差的單位與原數(shù)據(jù)不同,有時使用時不太方便;4.在方差分析中應用甚廣而極為重要。(二)標準差(standard deviation) NX2)(1)(2nXXS總體標準差總體標準差 樣本標準差樣本標準差 標準差的特點:1.意義同方差,是方差的開平方;2.標準差的單位與原數(shù)據(jù)相同,使用方便,意義深刻,應用廣泛;故一般已作為醫(yī)學生物學領(lǐng)域中反映變異的標準,故稱標準差。牢記:離均差平方和展開式: nxxxxlSS222)()(標準差的計算方法:直接法和加權(quán)法w1.直接法

13、 1)(22nnXXS 2.2.加權(quán)法加權(quán)法 1)(22fffXfXS直接法-標準差計算實例:例 7名正常男子紅細胞數(shù)(1012/L)如下:4.67, 4.74, 4.77, 4.88 , 4.76 , 4.72 , 4.92,計算其標準差。v x=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46 vx2=4.672+4.742+4.772+4.882+4.762+4.722+4.922=159.99 1)(22nnXXS計算結(jié)果:089. 0177/46.3399.159.2Sx=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46

14、 x=4.67+4.74+4.77+4.88+4.76+4.72+4.92=33.46 xx2 2=4.672+4.742+4.772+4.882+4.762+4.722+4.922=159.99=4.672+4.742+4.772+4.882+4.762+4.722+4.922=159.99w例 對表2-4資料用加權(quán)法計算120名12歲健康男孩身高值的標準差。加權(quán)法-標準差計算實例:)(70. 51120120/1716824600402cmS在表在表2-42-4中已算得中已算得fxfx=17168,fx=17168,fx2 2 =2460040, =2460040, 代入公式代入公式 簡記

15、為CV ;w 特征:變異系數(shù)為無量綱單位,可以比較不同單位指標間的變異度;變異系數(shù)消除了均數(shù)的大小對標準差的影響,所以可以比較兩均數(shù)相差較大時指標間的變異度。 三、變異系數(shù)%100XSCVw例 某地20歲男子160人,身高均數(shù)為166.06cm,標準差為4.95cm; 體重均數(shù)為53.72kg ,標準差為4.96kg。試比較身高與體重的變異程度。變異系數(shù) 計算實例身高 %98. 2%10006.16695. 4CV 體重%23. 9%10072.5396. 4CV變異系數(shù) 計算結(jié)果第四節(jié) 正態(tài)分布一、正態(tài)分布的概念和特征一、正態(tài)分布的概念和特征v 也也稱高斯分布,是醫(yī)學和生物學最常見的連續(xù)性稱

16、高斯分布,是醫(yī)學和生物學最常見的連續(xù)性分布。如身高、體重、紅細胞數(shù)、血紅蛋白等。分布。如身高、體重、紅細胞數(shù)、血紅蛋白等。 圖2-1 120名12歲健康男孩身高的頻數(shù)分布圖2-2 頻數(shù)分布逐漸接近正態(tài)分布示意 正態(tài)分布的函數(shù)和圖形22121Xe)X(f正態(tài)分布的密度函數(shù),即正態(tài)曲線的方程為:正態(tài)分布的密度函數(shù),即正態(tài)曲線的方程為:為了應用方便,常作變量變換: Xuu u值稱為值稱為標準正態(tài)變量標準正態(tài)變量或或標準正態(tài)離差標準正態(tài)離差,有的參,有的參考書也將考書也將u u值稱為值稱為z z值。值。 SXXu這樣將正態(tài)分布變換為(standard normal distribution) 2221

17、ue)u( 標準正態(tài)分布應用極為廣泛,一定大小的u值所對應的標準正態(tài)分布下的面積,可以查閱(u)值表獲得。圖2-3 正態(tài)分布的面積與縱高 a為一般的正態(tài)分布,縱軸為f(X) ,正態(tài)曲線下左側(cè)面積為F(X).b為標準正態(tài)分布,縱軸為 (u) ,正態(tài)曲線下左側(cè)面積為(u).序號序號 大寫大寫 小寫小寫 英文注音英文注音 國際音標注音國際音標注音 中文注音中文注音1alphaa:lf阿爾法阿爾法2betabet貝塔貝塔3gammaga:m伽馬伽馬4deltadelt德爾塔德爾塔5epsilonepsilon伊普西龍伊普西龍6zetazat截塔截塔7etaeit艾塔艾塔8thetit西塔西塔9iota

18、iot約塔約塔10kappakap卡帕卡帕11lambdalambd蘭布達蘭布達12mumju繆繆13nunju紐紐14xiksi克西克西15omicronomikron奧密克戎奧密克戎16pipai派派17rhorou肉肉18sigmasigma西格馬西格馬19tautau套套20upsilonjupsilon宇普西龍宇普西龍21phifai佛愛佛愛22chiphai西西24omegaomiga歐米伽歐米伽正態(tài)分布的特征 1. 1. 集中性集中性 正態(tài)曲線的高峰位于正中央,即均數(shù)所在正態(tài)曲線的高峰位于正中央,即均數(shù)所在的位置。的位置。2.2. 對稱性對稱性 正態(tài)曲線以均數(shù)為中心,左右對稱正態(tài)

19、曲線以均數(shù)為中心,左右對稱。 3. 3. 正態(tài)分布有正態(tài)分布有兩個參數(shù)兩個參數(shù),即均數(shù),即均數(shù)和標準差和標準差。是是位置參數(shù),位置參數(shù),是形狀參數(shù)。是形狀參數(shù)。4. 4. 正態(tài)曲線下面積有一定的正態(tài)曲線下面積有一定的分布規(guī)律分布規(guī)律。 圖2-4 不同標準差的正態(tài)分布示意圖 二、正態(tài)曲線下面積的分布規(guī)律 標準正態(tài)分布曲線下面積( (u)值表)應注意:應注意:表中曲線下面積為表中曲線下面積為-到到u u 的下側(cè)累計面積;的下側(cè)累計面積;當已知當已知、和、和X X時,先按公式求得時,先按公式求得u u值,再查表;值,再查表; 當當、未知時,并且未知時,并且樣本例數(shù)在樣本例數(shù)在100100例以上例以上,常用樣本,常用樣本均數(shù)均數(shù) 和標準差和標準差S S 分別代替分別代替和和,按公式,按公式 求得求得u u值;值;曲線下橫軸上的總面積為曲線下橫軸上的總面積為100%100%或或1 1。Xw應熟記:w標準正態(tài)分布時區(qū)間(-1,1)或正態(tài)分布時區(qū)間

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論