衛(wèi)生統(tǒng)計系統(tǒng)緒論和定量資料描述_第1頁
衛(wèi)生統(tǒng)計系統(tǒng)緒論和定量資料描述_第2頁
衛(wèi)生統(tǒng)計系統(tǒng)緒論和定量資料描述_第3頁
衛(wèi)生統(tǒng)計系統(tǒng)緒論和定量資料描述_第4頁
衛(wèi)生統(tǒng)計系統(tǒng)緒論和定量資料描述_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、衛(wèi)生統(tǒng)計學(xué)衛(wèi)生統(tǒng)計學(xué)方積乾方積乾中山大學(xué)公共衛(wèi)生學(xué)院中山大學(xué)公共衛(wèi)生學(xué)院醫(yī)學(xué)統(tǒng)計與流行病學(xué)系醫(yī)學(xué)統(tǒng)計與流行病學(xué)系2012.11第一章第一章 緒論緒論什么是統(tǒng)計學(xué)什么是統(tǒng)計學(xué) (statistics)? n“A branch of mathematics dealing with the collection, analysis, interpretation, and presentation of masses of numerical data.” (Websters International Dictionary)n“The science and art of collecting,

2、 summarizing, and analyzing data that are subject to random variation.” (A Dictionary of Epidemiology). 什么是統(tǒng)計學(xué)什么是統(tǒng)計學(xué)(statistics)?n內(nèi)容內(nèi)容:收集、分析、解釋和表達數(shù)據(jù)收集、分析、解釋和表達數(shù)據(jù)n統(tǒng)計學(xué)統(tǒng)計學(xué):處理數(shù)據(jù)中變異性的科學(xué)與藝術(shù)處理數(shù)據(jù)中變異性的科學(xué)與藝術(shù)n目的目的:求得可靠的結(jié)果求得可靠的結(jié)果n統(tǒng)計學(xué)的現(xiàn)實地位:合作、審稿、基金申統(tǒng)計學(xué)的現(xiàn)實地位:合作、審稿、基金申請(請(NIH)、藥物開發(fā)與申報()、藥物開發(fā)與申報(FDA)、)、衛(wèi)生決策衛(wèi)生決策 統(tǒng)計學(xué)

3、的若干概念統(tǒng)計學(xué)的若干概念1. 總體與樣本總體與樣本n總體總體(population): 大同小異的對象全體。大同小異的對象全體。n抽樣抽樣(sampling):從研究總體抽取部分個體:從研究總體抽取部分個體n樣本樣本(sample):抽取的部分個體:抽取的部分個體n數(shù)據(jù)數(shù)據(jù)(data):觀察所得資料:觀察所得資料 information data data knowledgen推斷推斷(inference) :分析樣本數(shù)據(jù),獲得關(guān)于總:分析樣本數(shù)據(jù),獲得關(guān)于總體的知識體的知識 統(tǒng)計推斷的工具統(tǒng)計推斷的工具:有關(guān)概率的理論。:有關(guān)概率的理論。 推斷的結(jié)論:不是完全肯定或完全否定。推斷的結(jié)論:不

4、是完全肯定或完全否定。 n關(guān)鍵與核心:抽樣方法、樣本的代表性和推斷關(guān)鍵與核心:抽樣方法、樣本的代表性和推斷的方法的方法 同質(zhì)與變異同質(zhì)與變異 同質(zhì)性同質(zhì)性(homogeneity)共性,大同小異共性,大同小異 變異變異(variation)個體間差異,多樣性個體間差異,多樣性 沒有同質(zhì)性就構(gòu)不成一個總體;沒有同質(zhì)性就構(gòu)不成一個總體; 總體內(nèi)沒有變異性就無需統(tǒng)計學(xué)??傮w內(nèi)沒有變異性就無需統(tǒng)計學(xué)。 統(tǒng)計學(xué)的任務(wù):統(tǒng)計學(xué)的任務(wù): 在變異的背景上,在變異的背景上, 描述同一總體的同質(zhì)性,描述同一總體的同質(zhì)性, 揭示不同總體的異質(zhì)性揭示不同總體的異質(zhì)性 (heterogeneity)。 . 變量的類型變

5、量的類型變量變量(variable):個體特性的數(shù)量描述:個體特性的數(shù)量描述(1) 定性變量定性變量 (i) 分類變量分類變量(categorical variable)或或 名義變量名義變量(nominative variable)。 分類變量的水平分類變量的水平(level): 用用1 1、2 2、3 3、4 4、5 5等代碼等代碼(code)(code)表示水平。表示水平。 二分類變量二分類變量( (binary variable), ), 也稱也稱0-10-1變量變量或假變量或假變量( (dummy variable) ) 分類變量與二分類變量相比分類變量與二分類變量相比, 信息較豐富

6、信息較豐富。 (ii) 有序變量有序變量(ordinal variable) 種種可能的種種可能的“取值取值”中自然地存在著次序。中自然地存在著次序。 有序變量與分類變量相比有序變量與分類變量相比, 信息較豐富。信息較豐富。 (2)定量變量定量變量 (i) 離散型變量離散型變量 只能取整數(shù)值。只能取整數(shù)值。 例如,手術(shù)病人數(shù)例如,手術(shù)病人數(shù); ; 新生兒數(shù)新生兒數(shù) (ii) 連續(xù)型變量連續(xù)型變量 可以取實數(shù)軸上的任何數(shù)值。可以取實數(shù)軸上的任何數(shù)值。 由測量而得到的大多屬于連續(xù)型變量由測量而得到的大多屬于連續(xù)型變量 例如,血壓、身高、體重等例如,血壓、身高、體重等 “連續(xù)連續(xù)”指該變量可在實數(shù)軸

7、上連續(xù)變動。指該變量可在實數(shù)軸上連續(xù)變動。 連續(xù)型變量信息最豐富連續(xù)型變量信息最豐富, 離散型變量次之離散型變量次之。 變通變通:紅細胞記數(shù)也視為連續(xù)型變量紅細胞記數(shù)也視為連續(xù)型變量。 (數(shù)值很大(數(shù)值很大, , 個位數(shù)之間的差別并不重要)個位數(shù)之間的差別并不重要)變量類型的轉(zhuǎn)化變量類型的轉(zhuǎn)化: 連續(xù)型連續(xù)型有序有序分類分類二值二值只能由信息豐富的只能由信息豐富的(高級高級)向信息不豐富的向信息不豐富的(低級低級)轉(zhuǎn)化轉(zhuǎn)化, 不能作相反方向的轉(zhuǎn)化不能作相反方向的轉(zhuǎn)化 n離散型變量常常通過適當?shù)淖儞Q或連續(xù)性校離散型變量常常通過適當?shù)淖儞Q或連續(xù)性校 正后正后, 借用連續(xù)型變量的統(tǒng)計方法來分析;借用

8、連續(xù)型變量的統(tǒng)計方法來分析;n連續(xù)型變量常常有意識地轉(zhuǎn)化為離散型變量,連續(xù)型變量常常有意識地轉(zhuǎn)化為離散型變量,以便于解釋和理解某些現(xiàn)象。以便于解釋和理解某些現(xiàn)象。4. 因果與聯(lián)系因果與聯(lián)系 公共衛(wèi)生領(lǐng)域常常要探究危險因素與疾病公共衛(wèi)生領(lǐng)域常常要探究危險因素與疾病之間的因果關(guān)系之間的因果關(guān)系(causation)。 首先應(yīng)當問首先應(yīng)當問存在不存在聯(lián)系存在不存在聯(lián)系 (association)然而,然而,存在聯(lián)系未必有因果關(guān)系存在聯(lián)系未必有因果關(guān)系n在解釋統(tǒng)計分析的結(jié)果以及下結(jié)論時在解釋統(tǒng)計分析的結(jié)果以及下結(jié)論時, 務(wù)必對務(wù)必對“因果因果”二字慎之又慎二字慎之又慎。5. 設(shè)計與分析設(shè)計與分析n統(tǒng)計

9、學(xué)方面的設(shè)計統(tǒng)計學(xué)方面的設(shè)計 (design)是醫(yī)藥衛(wèi)生科研設(shè)計是醫(yī)藥衛(wèi)生科研設(shè)計不可或缺的部分。不可或缺的部分。n設(shè)計不僅要符合統(tǒng)計學(xué)原則,運用統(tǒng)計學(xué)方法設(shè)計不僅要符合統(tǒng)計學(xué)原則,運用統(tǒng)計學(xué)方法和技術(shù),而且,在設(shè)計的時候要明確日后用什和技術(shù),而且,在設(shè)計的時候要明確日后用什么統(tǒng)計方法處理數(shù)據(jù)。么統(tǒng)計方法處理數(shù)據(jù)。n只有明確了設(shè)計的樣式和分析的方法才得以進只有明確了設(shè)計的樣式和分析的方法才得以進一步考慮數(shù)據(jù)應(yīng)當如何收集、樣本量應(yīng)當多大。一步考慮數(shù)據(jù)應(yīng)當如何收集、樣本量應(yīng)當多大。學(xué)習(xí)目的與方法學(xué)習(xí)目的與方法(1 1)統(tǒng)計思維享用一生)統(tǒng)計思維享用一生 事件的不確定性事件的不確定性 - 概率概率

10、由樣本推斷總體,結(jié)論的不確定性由樣本推斷總體,結(jié)論的不確定性 - 有可能犯錯誤有可能犯錯誤 統(tǒng)計學(xué)任務(wù)統(tǒng)計學(xué)任務(wù) - 限定犯錯誤概率的大小,限定犯錯誤概率的大小, 在此前提下,作決策在此前提下,作決策(2 2)理解概念是首位)理解概念是首位 研究設(shè)計的原則研究設(shè)計的原則 確定樣本量的依據(jù)確定樣本量的依據(jù) 參數(shù)估計的精度參數(shù)估計的精度 決策的兩類錯誤決策的兩類錯誤 案例辨析:在辨析中提高,從反面吸取教訓(xùn)案例辨析:在辨析中提高,從反面吸取教訓(xùn) - 平時爭論、課堂討論平時爭論、課堂討論(3 3)重在理解和解釋結(jié)果)重在理解和解釋結(jié)果 通過計算,體驗統(tǒng)計概念和思想通過計算,體驗統(tǒng)計概念和思想 正確理解

11、、解釋和表達計算結(jié)果正確理解、解釋和表達計算結(jié)果 中英文結(jié)果報告:內(nèi)容齊全,表達規(guī)范中英文結(jié)果報告:內(nèi)容齊全,表達規(guī)范 - 作業(yè)要按照規(guī)格撰寫作業(yè)要按照規(guī)格撰寫(4 4)電腦實驗)電腦實驗 用電腦模擬現(xiàn)實世界,從實驗中看隨機現(xiàn)象用電腦模擬現(xiàn)實世界,從實驗中看隨機現(xiàn)象 統(tǒng)計軟件:反復(fù)實踐,靈活運用統(tǒng)計軟件:反復(fù)實踐,靈活運用 -機房開放機房開放, 勤動手勤動手!(5 5)考試)考試 * 筆試:理論、方法筆試:理論、方法 不記公式,無數(shù)學(xué)推導(dǎo),無復(fù)雜計算不記公式,無數(shù)學(xué)推導(dǎo),無復(fù)雜計算 * 上機考試:已做過的電腦實驗;上機考試:已做過的電腦實驗; 不編程序不編程序第二章第二章 定量變量的統(tǒng)計描述定

12、量變量的統(tǒng)計描述 n 把握數(shù)據(jù)的基本特征把握數(shù)據(jù)的基本特征n 為統(tǒng)計分析打下基礎(chǔ)為統(tǒng)計分析打下基礎(chǔ) 統(tǒng)計表、統(tǒng)計圖統(tǒng)計表、統(tǒng)計圖 描述性統(tǒng)計量描述性統(tǒng)計量 統(tǒng)計描述統(tǒng)計描述 -從數(shù)據(jù)中獲取知識最直觀的方法從數(shù)據(jù)中獲取知識最直觀的方法第一節(jié)第一節(jié) 頻率分布表與頻率分布圖頻率分布表與頻率分布圖頻數(shù)分布表頻數(shù)分布表(frequency distribution table)又稱頻數(shù)表又稱頻數(shù)表 1. 離散型定量變量的頻數(shù)分布離散型定量變量的頻數(shù)分布 例例2-1 1998年某山區(qū)年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資名孕婦產(chǎn)前檢查次數(shù)資料如下:料如下: 0,3,2,0,1,5,6,3,2,4,1,0,6,5

13、,1,3,3,4,7表表 2-1 1998 年某地年某地 96 名婦女產(chǎn)前檢查次數(shù)分布名婦女產(chǎn)前檢查次數(shù)分布 檢查次數(shù)檢查次數(shù) 頻數(shù)頻數(shù) 頻率頻率(%) 累計人數(shù)累計人數(shù) 累計頻率累計頻率(%) (1) (2) (3) (4) (5) 0 4 4.2 4 4.2 1 7 7.3 11 11.5 2 11 11.5 22 22.9 3 13 13.5 35 36.5 4 26 27.1 61 63.5 5 23 24.0 84 87.5 5 12 12.5 96 100.0 合計合計 96 100 直條圖(直條圖(bar chart)橫坐標:產(chǎn)前檢查次數(shù);橫坐標:產(chǎn)前檢查次數(shù);縱坐標:縱坐標:頻

14、率頻率, 檢查檢查k次的婦女所占的比例(次的婦女所占的比例(%)等寬矩形長條:等寬矩形長條:高度高度相當于檢查次數(shù)的頻率相當于檢查次數(shù)的頻率圖2-1 某地96名婦女產(chǎn)前檢查次率分布0510152025300123455產(chǎn)前檢查次數(shù)頻率(%)2連續(xù)型定量變量的頻率分布連續(xù)型定量變量的頻率分布例例2-2 抽樣調(diào)查某地抽樣調(diào)查某地120名名18歲歲35歲健康男性歲健康男性居民血清鐵含量(居民血清鐵含量(mol/L),數(shù)據(jù)如下),數(shù)據(jù)如下:7.42 8.65 23.02 21.61 21.31 21.46 9.97 22.73 14.94 20.18 21.62 23.07 20.38 8.40 17

15、.32 29.64 19.69 21.69 23.90 17.45 19.08 20.52 24.14 23.77 18.36 23.04 24.22 24.13 21.53 11.09 18.89 18.26 23.29 17.67 15.38 18.61 14.27 17.40 22.55 17.55 16.10 17.98 20.13 21.00 14.56 19.89 19.82 17.48 14.89 18.37 19.50 17.08 18.12 26.02 11.34 13.81 10.25 15.94 15.83 18.54 24.52 19.26 26.13 16.99 18

16、.89 18.46 20.87 17.51 13.12 11.75 17.40 21.36 17.14 13.77 12.50 20.40 20.30 19.38 23.11 12.67 23.02 24.36 25.61 19.53 14.77 14.37 24.75 12.73 17.25 19.09 16.79 17.19 19.32 19.59 19.12 15.31 21.75 19.47 15.51 10.86 27.81 21.65 16.32 20.75 22.11 13.17 17.55 19.26 12.65 18.48 19.83 23.12 19.22 19.22 16

17、.72 27.90 11.74 24.66 14.18 16.52 表表 2-2 120 名正常成年男子血清鐵含量名正常成年男子血清鐵含量 (mol/L)頻數(shù)表頻數(shù)表 組段組段 頻數(shù)頻數(shù) 頻率頻率 累計頻數(shù)累計頻數(shù) 累計頻率累計頻率 (1) (2) (3) (4) (5) 6 1 0.83 1 0.83 8 3 2.50 4 3.33 10 6 5.00 10 8.33 12 8 6.67 18 15.00 14 12 10.00 30 25.00 16 20 16.67 50 41.67 18 27 22.50 77 64.17 20 18 15.00 95 79.17 22 12 10.0

18、0 107 89.17 24 8 6.67 115 95.83 26 4 3.33 119 99.17 2830 1 0.83 120 100.00 合計合計 120 100 直方圖直方圖(1) (1) 頻率直方圖頻率直方圖 橫軸:血清鐵含量橫軸:血清鐵含量 縱軸:頻率縱軸:頻率 矩形直條高度矩形直條高度 = 頻率頻率, 直條高度之和直條高度之和= 100%(2) 頻率密度直方圖頻率密度直方圖 橫軸:血清鐵含量橫軸:血清鐵含量 縱軸:縱軸:頻率密度頻率密度 = = 頻率頻率/ /組距組距 矩形直條的面積矩形直條的面積 = 頻率頻率, 直條面積之和直條面積之和= 100%注:組距相等時,兩種注:

19、組距相等時,兩種直方圖形狀相同直方圖形狀相同圖圖2-2 某年某地某年某地120名名1835歲健康男性居民歲健康男性居民 血清鐵含量頻率分布血清鐵含量頻率分布圖圖2-3 某地居民某地居民238人發(fā)汞含量(人發(fā)汞含量(mol/kg)分布)分布 正偏峰分布(正偏峰分布(positively skewed distribution)負偏峰分布(負偏峰分布(negatively skewed distribution)圖2-1 某地96名婦女產(chǎn)前檢查次率分布0510152025300123455產(chǎn)前檢查次數(shù)頻率(%)頻率密度頻率密度第二節(jié)第二節(jié) 描述平均水平的統(tǒng)計指標描述平均水平的統(tǒng)計指標 定量地描述集

20、中趨勢與離中趨勢是統(tǒng)計描述定量地描述集中趨勢與離中趨勢是統(tǒng)計描述的重要內(nèi)容的重要內(nèi)容 對于連續(xù)型定量變量,描述集中趨勢常用對于連續(xù)型定量變量,描述集中趨勢常用統(tǒng)計量為算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。統(tǒng)計量為算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。1. 算術(shù)均數(shù)算術(shù)均數(shù)簡稱均數(shù)(簡稱均數(shù)(mean),適合描述對稱分布資料的集中),適合描述對稱分布資料的集中位置(也稱為平均水平)。其計算公式為位置(也稱為平均水平)。其計算公式為nXXXXn.21nXnXnXiinii1 n:樣本含量:樣本含量 X1,X2,Xn:觀察值:觀察值 或或 :觀察值之和:觀察值之和iiXX例例2-3 測得測得8只正常大鼠血清總酸性磷酸酶

21、(只正常大鼠血清總酸性磷酸酶(TACP)含量(含量(U/L)為)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術(shù)均數(shù)。試求其算術(shù)均數(shù)。 按式(按式(2-1),算術(shù)均數(shù)為),算術(shù)均數(shù)為 91. 3)38. 342. 504. 426. 245. 308. 243. 620. 4(81X加權(quán)平均加權(quán)平均表表 2-3 1835歲健康男性居民血清鐵含量算術(shù)均數(shù)的近似計算歲健康男性居民血清鐵含量算術(shù)均數(shù)的近似計算 組段組段 組中值組中值(0X) 頻數(shù)(頻數(shù)(f) 0fX (1) (2) (3) (4)=(2)(3) 6 7 1 7 8 9 3 27 10 11

22、 6 66 12 13 8 104 14 15 12 180 16 17 20 340 18 19 27 513 20 21 18 378 22 23 12 276 24 25 8 200 26 27 4 108 2830 29 1 29 合計合計 120 2228 57.1812022281312919371X對于偏峰分布資料算術(shù)均數(shù)不能較好地反映分對于偏峰分布資料算術(shù)均數(shù)不能較好地反映分布的集中趨勢。布的集中趨勢。頻率密度頻率密度2. 幾何均數(shù)(幾何均數(shù)(geometric mean) 適用于觀察值變化范圍跨越多個數(shù)量級的資料適用于觀察值變化范圍跨越多個數(shù)量級的資料頻數(shù)圖一般呈正偏峰分布頻

23、數(shù)圖一般呈正偏峰分布nnXXXG.21)log(log1nXG例例2-5 7名慢性遷延性肝炎患者的名慢性遷延性肝炎患者的HBsAg滴度資料滴度資料為為1:16,1:32,1:32,1:64, 1:64,1:128,1:512。試。試計算其幾何均數(shù)。計算其幾何均數(shù)。6451212864643232167G)log(log1nXG.648062. 1lg7512lg128lg64lg64lg32lg32lg16lglg113. 中位數(shù)(中位數(shù)(median) 可用于各種分布的定量資料可用于各種分布的定量資料 總體中有一半個體的數(shù)值低于這個數(shù),一半個體的數(shù)總體中有一半個體的數(shù)值低于這個數(shù),一半個體的

24、數(shù)值高于這個數(shù)。值高于這個數(shù)。 基于樣本資料基于樣本資料 將將n例數(shù)據(jù)按升序排列,第例數(shù)據(jù)按升序排列,第i個數(shù)據(jù)記為個數(shù)據(jù)記為 n為奇數(shù)時為奇數(shù)時 n為偶數(shù)時為偶數(shù)時 例例2-7 某藥廠觀察某藥廠觀察9只小鼠口服高山紅景天醇提取物只小鼠口服高山紅景天醇提取物(RSAE)后在乏氧條件下的生存時間(分鐘)如下后在乏氧條件下的生存時間(分鐘)如下: 49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。試求其中位數(shù)。試求其中位數(shù)。*iX*21nXM)(21*12*2nnXXM6 .63*5*21XXMn百分位數(shù)(百分位數(shù)(percentile) 總體中總體中, ,

25、 數(shù)值小于它的個體恰有數(shù)值小于它的個體恰有X%,大于,大于它的個體恰有它的個體恰有1-X % 中位數(shù)中位數(shù) = = 樣本估計:按照升序排列的數(shù)列里樣本估計:按照升序排列的數(shù)列里, , 其左側(cè)其左側(cè)(即小于它)的個體數(shù)在整個樣本中所占百(即小于它)的個體數(shù)在整個樣本中所占百分比為分比為X%。XP50P第三節(jié)第三節(jié) 描述變異程度的統(tǒng)計指標描述變異程度的統(tǒng)計指標同一總體中不同個體之間的離散趨勢又稱為變異同一總體中不同個體之間的離散趨勢又稱為變異(variation)例例2-10 試觀察三組數(shù)據(jù)試觀察三組數(shù)據(jù)A組:組:24,27,30,33,36B組:組:26,28,30,32,34C組:組:26,2

26、9,30,31,34三組均數(shù)都是三組均數(shù)都是301. 極差(極差(range) R = 最大值最小值最大值最小值計算簡便,但僅利用了兩個數(shù)據(jù)的信息計算簡便,但僅利用了兩個數(shù)據(jù)的信息一般,樣本量一般,樣本量n越大越大R也往往會越大也往往會越大, 不夠穩(wěn)定不夠穩(wěn)定 例例2-12 計算上述三組數(shù)據(jù)的極差計算上述三組數(shù)據(jù)的極差A(yù)組組 R=36-24=12B組組 R=34-26=8C組組 R=34-26=82. 四分位數(shù)間距(四分位數(shù)間距(quartile range) Q= P75-P25 P25與與P75之間恰好包含之間恰好包含50%的個體的個體 四分位數(shù)間距四分位數(shù)間距Q是總體中數(shù)值居中的是總體中

27、數(shù)值居中的50%個體散布的范圍個體散布的范圍 Q越大意味著數(shù)據(jù)間變異越大越大意味著數(shù)據(jù)間變異越大 3. 方差(方差(variance) 與標準差(與標準差(standard deviation) 用于反映一組對稱分布的觀察值在數(shù)量上的用于反映一組對稱分布的觀察值在數(shù)量上的變異程度。變異程度??傮w中:總體中: 離均差離均差 (deviation from average) X:有正有負,總和為有正有負,總和為 0 離均差平方離均差平方:2)(X 總體方差總體方差(population variance)2:總體中總體中,離均差平方的離均差平方的 平均值平均值 總體標準差總體標準差(populat

28、ion standard deviation):總體方差:總體方差的的 平方根平方根 樣本中:樣本中:樣本均數(shù)樣本均數(shù)X代替代替 離均差平方和離均差平方和:2)(XX 比比 2)(X小小 離均差平方的平均離均差平方的平均: nXX2)(偏小偏小 樣本方差樣本方差(sample variance):英國統(tǒng)計學(xué)家英國統(tǒng)計學(xué)家 W.S. Gosset 提出用提出用 n-1 代替代替 n 來計算樣本中離均差平方的平均水平來計算樣本中離均差平方的平均水平 1)(22nXXS (2-9) 樣本標準差樣本標準差(sample standard deviation): 1)(2nXXS (2-12) 自由度自

29、由度(degree of freedom) : n-1 自由度自由度的的意義意義:隨機變量能“自由”取值的個數(shù)。隨機變量能“自由”取值的個數(shù)。 例例2-13 計算例計算例2-10中三組數(shù)據(jù)的標準差。中三組數(shù)據(jù)的標準差。A組:組:24,27,30,33,36B組:組:26,28,30,32,34 三組均數(shù)都是三組均數(shù)都是30C組:組:26,29,30,31,34 C組數(shù)據(jù)的變異最小,組數(shù)據(jù)的變異最小,A組的最大組的最大按照按照(2-12)式式, A 組:74. 415)3036(.)3027()3024(222S B 組:16. 315)3034(.)3028()3026(222S C 組:92

30、. 215)3034(.)3029()3026(222S 5. 變異系數(shù)(變異系數(shù)(coefficient of variation ,CV)例例2-15 1985年通過十省調(diào)查得知,農(nóng)村剛滿周歲的女年通過十省調(diào)查得知,農(nóng)村剛滿周歲的女童體重均數(shù)為童體重均數(shù)為8.42kg,標準差為,標準差為0.98kg;身高均數(shù)為;身高均數(shù)為72.4cm,標準差為,標準差為3.0cm。體重的變異大還是身高的變。體重的變異大還是身高的變異大?異大?%100XSCV體重的變異系數(shù)體重的變異系數(shù)身高的變異系數(shù)身高的變異系數(shù) %64.11%10042. 898. 0%100XSCV%14. 4%1004 .720 .

31、 3%100XSCV用于用于 量綱不同的變量間變異程度的比較量綱不同的變量間變異程度的比較或或 均數(shù)差別較大的變量間變異程度的比較均數(shù)差別較大的變量間變異程度的比較例如例如 12月嬰兒的身高月嬰兒的身高 cmX32.561, S12.15cm %82. 332.5615. 21CV 臨產(chǎn)母親臨產(chǎn)母親的身高的身高 cmX11.1592, S24.02cm %53. 202. 411.1592CV 第四節(jié)第四節(jié) 描述分布形態(tài)的統(tǒng)計指標描述分布形態(tài)的統(tǒng)計指標1. 偏度系數(shù)偏度系數(shù) (coefficient of skewness,SKEW) 3)2)(1(SXXnnnSKEW總體偏度系數(shù)為總體偏度系

32、數(shù)為0時,分布是對稱的;時,分布是對稱的;取正值時,分布為正偏峰;取正值時,分布為正偏峰;取負值時,分布為負偏峰。取負值時,分布為負偏峰。例例2-2中血清鐵含量(中血清鐵含量(mol/L)數(shù)據(jù))數(shù)據(jù) 偏度系數(shù)偏度系數(shù) SKEW= - 0.193892. 峰度系數(shù)峰度系數(shù)(coefficient of kurtosis,KURT) )3)(2() 1(3)3)(2)(1() 1(24nnnSXXnnnnnKURT正態(tài)分布的總體峰度系數(shù)為正態(tài)分布的總體峰度系數(shù)為0;取負值時,其分布較正態(tài)分布的峰平闊;取負值時,其分布較正態(tài)分布的峰平闊;取正值時,其分布較正態(tài)分布的峰尖峭。取正值時,其分布較正態(tài)分布的峰尖峭。例例2-2中血清鐵含量(中血清鐵含量(mol/L)數(shù)據(jù)的峰度系數(shù))數(shù)據(jù)的峰度系數(shù) KURT= - 0.01783第五節(jié)第五節(jié) 統(tǒng)計表和統(tǒng)計圖統(tǒng)計表和統(tǒng)計圖n統(tǒng)計表(統(tǒng)計表(sta

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論