




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、衛(wèi)生統(tǒng)計(jì)學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)方積乾方積乾中山大學(xué)公共衛(wèi)生學(xué)院中山大學(xué)公共衛(wèi)生學(xué)院醫(yī)學(xué)統(tǒng)計(jì)與流行病學(xué)系醫(yī)學(xué)統(tǒng)計(jì)與流行病學(xué)系2012.11第一章第一章 緒論緒論什么是統(tǒng)計(jì)學(xué)什么是統(tǒng)計(jì)學(xué) (statistics)? n“A branch of mathematics dealing with the collection, analysis, interpretation, and presentation of masses of numerical data.” (Websters International Dictionary)n“The science and art of collecting,
2、 summarizing, and analyzing data that are subject to random variation.” (A Dictionary of Epidemiology). 什么是統(tǒng)計(jì)學(xué)什么是統(tǒng)計(jì)學(xué)(statistics)?n內(nèi)容內(nèi)容:收集、分析、解釋和表達(dá)數(shù)據(jù)收集、分析、解釋和表達(dá)數(shù)據(jù)n統(tǒng)計(jì)學(xué)統(tǒng)計(jì)學(xué):處理數(shù)據(jù)中變異性的科學(xué)與藝術(shù)處理數(shù)據(jù)中變異性的科學(xué)與藝術(shù)n目的目的:求得可靠的結(jié)果求得可靠的結(jié)果n統(tǒng)計(jì)學(xué)的現(xiàn)實(shí)地位:合作、審稿、基金申統(tǒng)計(jì)學(xué)的現(xiàn)實(shí)地位:合作、審稿、基金申請(qǐng)(請(qǐng)(NIH)、藥物開發(fā)與申報(bào)()、藥物開發(fā)與申報(bào)(FDA)、)、衛(wèi)生決策衛(wèi)生決策 統(tǒng)計(jì)學(xué)
3、的若干概念統(tǒng)計(jì)學(xué)的若干概念1. 總體與樣本總體與樣本n總體總體(population): 大同小異的對(duì)象全體。大同小異的對(duì)象全體。n抽樣抽樣(sampling):從研究總體抽取部分個(gè)體:從研究總體抽取部分個(gè)體n樣本樣本(sample):抽取的部分個(gè)體:抽取的部分個(gè)體n數(shù)據(jù)數(shù)據(jù)(data):觀察所得資料:觀察所得資料 information data data knowledgen推斷推斷(inference) :分析樣本數(shù)據(jù),獲得關(guān)于總:分析樣本數(shù)據(jù),獲得關(guān)于總體的知識(shí)體的知識(shí) 統(tǒng)計(jì)推斷的工具統(tǒng)計(jì)推斷的工具:有關(guān)概率的理論。:有關(guān)概率的理論。 推斷的結(jié)論:不是完全肯定或完全否定。推斷的結(jié)論:不
4、是完全肯定或完全否定。 n關(guān)鍵與核心:抽樣方法、樣本的代表性和推斷關(guān)鍵與核心:抽樣方法、樣本的代表性和推斷的方法的方法 同質(zhì)與變異同質(zhì)與變異 同質(zhì)性同質(zhì)性(homogeneity)共性,大同小異共性,大同小異 變異變異(variation)個(gè)體間差異,多樣性個(gè)體間差異,多樣性 沒有同質(zhì)性就構(gòu)不成一個(gè)總體;沒有同質(zhì)性就構(gòu)不成一個(gè)總體; 總體內(nèi)沒有變異性就無需統(tǒng)計(jì)學(xué)??傮w內(nèi)沒有變異性就無需統(tǒng)計(jì)學(xué)。 統(tǒng)計(jì)學(xué)的任務(wù):統(tǒng)計(jì)學(xué)的任務(wù): 在變異的背景上,在變異的背景上, 描述同一總體的同質(zhì)性,描述同一總體的同質(zhì)性, 揭示不同總體的異質(zhì)性揭示不同總體的異質(zhì)性 (heterogeneity)。 . 變量的類型變
5、量的類型變量變量(variable):個(gè)體特性的數(shù)量描述:個(gè)體特性的數(shù)量描述(1) 定性變量定性變量 (i) 分類變量分類變量(categorical variable)或或 名義變量名義變量(nominative variable)。 分類變量的水平分類變量的水平(level): 用用1 1、2 2、3 3、4 4、5 5等代碼等代碼(code)(code)表示水平。表示水平。 二分類變量二分類變量( (binary variable), ), 也稱也稱0-10-1變量變量或假變量或假變量( (dummy variable) ) 分類變量與二分類變量相比分類變量與二分類變量相比, 信息較豐富
6、信息較豐富。 (ii) 有序變量有序變量(ordinal variable) 種種可能的種種可能的“取值取值”中自然地存在著次序。中自然地存在著次序。 有序變量與分類變量相比有序變量與分類變量相比, 信息較豐富。信息較豐富。 (2)定量變量定量變量 (i) 離散型變量離散型變量 只能取整數(shù)值。只能取整數(shù)值。 例如,手術(shù)病人數(shù)例如,手術(shù)病人數(shù); ; 新生兒數(shù)新生兒數(shù) (ii) 連續(xù)型變量連續(xù)型變量 可以取實(shí)數(shù)軸上的任何數(shù)值??梢匀?shí)數(shù)軸上的任何數(shù)值。 由測(cè)量而得到的大多屬于連續(xù)型變量由測(cè)量而得到的大多屬于連續(xù)型變量 例如,血壓、身高、體重等例如,血壓、身高、體重等 “連續(xù)連續(xù)”指該變量可在實(shí)數(shù)軸
7、上連續(xù)變動(dòng)。指該變量可在實(shí)數(shù)軸上連續(xù)變動(dòng)。 連續(xù)型變量信息最豐富連續(xù)型變量信息最豐富, 離散型變量次之離散型變量次之。 變通變通:紅細(xì)胞記數(shù)也視為連續(xù)型變量紅細(xì)胞記數(shù)也視為連續(xù)型變量。 (數(shù)值很大(數(shù)值很大, , 個(gè)位數(shù)之間的差別并不重要)個(gè)位數(shù)之間的差別并不重要)變量類型的轉(zhuǎn)化變量類型的轉(zhuǎn)化: 連續(xù)型連續(xù)型有序有序分類分類二值二值只能由信息豐富的只能由信息豐富的(高級(jí)高級(jí))向信息不豐富的向信息不豐富的(低級(jí)低級(jí))轉(zhuǎn)化轉(zhuǎn)化, 不能作相反方向的轉(zhuǎn)化不能作相反方向的轉(zhuǎn)化 n離散型變量常常通過適當(dāng)?shù)淖儞Q或連續(xù)性校離散型變量常常通過適當(dāng)?shù)淖儞Q或連續(xù)性校 正后正后, 借用連續(xù)型變量的統(tǒng)計(jì)方法來分析;借用
8、連續(xù)型變量的統(tǒng)計(jì)方法來分析;n連續(xù)型變量常常有意識(shí)地轉(zhuǎn)化為離散型變量,連續(xù)型變量常常有意識(shí)地轉(zhuǎn)化為離散型變量,以便于解釋和理解某些現(xiàn)象。以便于解釋和理解某些現(xiàn)象。4. 因果與聯(lián)系因果與聯(lián)系 公共衛(wèi)生領(lǐng)域常常要探究危險(xiǎn)因素與疾病公共衛(wèi)生領(lǐng)域常常要探究危險(xiǎn)因素與疾病之間的因果關(guān)系之間的因果關(guān)系(causation)。 首先應(yīng)當(dāng)問首先應(yīng)當(dāng)問存在不存在聯(lián)系存在不存在聯(lián)系 (association)然而,然而,存在聯(lián)系未必有因果關(guān)系存在聯(lián)系未必有因果關(guān)系n在解釋統(tǒng)計(jì)分析的結(jié)果以及下結(jié)論時(shí)在解釋統(tǒng)計(jì)分析的結(jié)果以及下結(jié)論時(shí), 務(wù)必對(duì)務(wù)必對(duì)“因果因果”二字慎之又慎二字慎之又慎。5. 設(shè)計(jì)與分析設(shè)計(jì)與分析n統(tǒng)計(jì)
9、學(xué)方面的設(shè)計(jì)統(tǒng)計(jì)學(xué)方面的設(shè)計(jì) (design)是醫(yī)藥衛(wèi)生科研設(shè)計(jì)是醫(yī)藥衛(wèi)生科研設(shè)計(jì)不可或缺的部分。不可或缺的部分。n設(shè)計(jì)不僅要符合統(tǒng)計(jì)學(xué)原則,運(yùn)用統(tǒng)計(jì)學(xué)方法設(shè)計(jì)不僅要符合統(tǒng)計(jì)學(xué)原則,運(yùn)用統(tǒng)計(jì)學(xué)方法和技術(shù),而且,在設(shè)計(jì)的時(shí)候要明確日后用什和技術(shù),而且,在設(shè)計(jì)的時(shí)候要明確日后用什么統(tǒng)計(jì)方法處理數(shù)據(jù)。么統(tǒng)計(jì)方法處理數(shù)據(jù)。n只有明確了設(shè)計(jì)的樣式和分析的方法才得以進(jìn)只有明確了設(shè)計(jì)的樣式和分析的方法才得以進(jìn)一步考慮數(shù)據(jù)應(yīng)當(dāng)如何收集、樣本量應(yīng)當(dāng)多大。一步考慮數(shù)據(jù)應(yīng)當(dāng)如何收集、樣本量應(yīng)當(dāng)多大。學(xué)習(xí)目的與方法學(xué)習(xí)目的與方法(1 1)統(tǒng)計(jì)思維享用一生)統(tǒng)計(jì)思維享用一生 事件的不確定性事件的不確定性 - 概率概率
10、由樣本推斷總體,結(jié)論的不確定性由樣本推斷總體,結(jié)論的不確定性 - 有可能犯錯(cuò)誤有可能犯錯(cuò)誤 統(tǒng)計(jì)學(xué)任務(wù)統(tǒng)計(jì)學(xué)任務(wù) - 限定犯錯(cuò)誤概率的大小,限定犯錯(cuò)誤概率的大小, 在此前提下,作決策在此前提下,作決策(2 2)理解概念是首位)理解概念是首位 研究設(shè)計(jì)的原則研究設(shè)計(jì)的原則 確定樣本量的依據(jù)確定樣本量的依據(jù) 參數(shù)估計(jì)的精度參數(shù)估計(jì)的精度 決策的兩類錯(cuò)誤決策的兩類錯(cuò)誤 案例辨析:在辨析中提高,從反面吸取教訓(xùn)案例辨析:在辨析中提高,從反面吸取教訓(xùn) - 平時(shí)爭(zhēng)論、課堂討論平時(shí)爭(zhēng)論、課堂討論(3 3)重在理解和解釋結(jié)果)重在理解和解釋結(jié)果 通過計(jì)算,體驗(yàn)統(tǒng)計(jì)概念和思想通過計(jì)算,體驗(yàn)統(tǒng)計(jì)概念和思想 正確理解
11、、解釋和表達(dá)計(jì)算結(jié)果正確理解、解釋和表達(dá)計(jì)算結(jié)果 中英文結(jié)果報(bào)告:內(nèi)容齊全,表達(dá)規(guī)范中英文結(jié)果報(bào)告:內(nèi)容齊全,表達(dá)規(guī)范 - 作業(yè)要按照規(guī)格撰寫作業(yè)要按照規(guī)格撰寫(4 4)電腦實(shí)驗(yàn))電腦實(shí)驗(yàn) 用電腦模擬現(xiàn)實(shí)世界,從實(shí)驗(yàn)中看隨機(jī)現(xiàn)象用電腦模擬現(xiàn)實(shí)世界,從實(shí)驗(yàn)中看隨機(jī)現(xiàn)象 統(tǒng)計(jì)軟件:反復(fù)實(shí)踐,靈活運(yùn)用統(tǒng)計(jì)軟件:反復(fù)實(shí)踐,靈活運(yùn)用 -機(jī)房開放機(jī)房開放, 勤動(dòng)手勤動(dòng)手!(5 5)考試)考試 * 筆試:理論、方法筆試:理論、方法 不記公式,無數(shù)學(xué)推導(dǎo),無復(fù)雜計(jì)算不記公式,無數(shù)學(xué)推導(dǎo),無復(fù)雜計(jì)算 * 上機(jī)考試:已做過的電腦實(shí)驗(yàn);上機(jī)考試:已做過的電腦實(shí)驗(yàn); 不編程序不編程序第二章第二章 定量變量的統(tǒng)計(jì)描述定
12、量變量的統(tǒng)計(jì)描述 n 把握數(shù)據(jù)的基本特征把握數(shù)據(jù)的基本特征n 為統(tǒng)計(jì)分析打下基礎(chǔ)為統(tǒng)計(jì)分析打下基礎(chǔ) 統(tǒng)計(jì)表、統(tǒng)計(jì)圖統(tǒng)計(jì)表、統(tǒng)計(jì)圖 描述性統(tǒng)計(jì)量描述性統(tǒng)計(jì)量 統(tǒng)計(jì)描述統(tǒng)計(jì)描述 -從數(shù)據(jù)中獲取知識(shí)最直觀的方法從數(shù)據(jù)中獲取知識(shí)最直觀的方法第一節(jié)第一節(jié) 頻率分布表與頻率分布圖頻率分布表與頻率分布圖頻數(shù)分布表頻數(shù)分布表(frequency distribution table)又稱頻數(shù)表又稱頻數(shù)表 1. 離散型定量變量的頻數(shù)分布離散型定量變量的頻數(shù)分布 例例2-1 1998年某山區(qū)年某山區(qū)96名孕婦產(chǎn)前檢查次數(shù)資名孕婦產(chǎn)前檢查次數(shù)資料如下:料如下: 0,3,2,0,1,5,6,3,2,4,1,0,6,5
13、,1,3,3,4,7表表 2-1 1998 年某地年某地 96 名婦女產(chǎn)前檢查次數(shù)分布名婦女產(chǎn)前檢查次數(shù)分布 檢查次數(shù)檢查次數(shù) 頻數(shù)頻數(shù) 頻率頻率(%) 累計(jì)人數(shù)累計(jì)人數(shù) 累計(jì)頻率累計(jì)頻率(%) (1) (2) (3) (4) (5) 0 4 4.2 4 4.2 1 7 7.3 11 11.5 2 11 11.5 22 22.9 3 13 13.5 35 36.5 4 26 27.1 61 63.5 5 23 24.0 84 87.5 5 12 12.5 96 100.0 合計(jì)合計(jì) 96 100 直條圖(直條圖(bar chart)橫坐標(biāo):產(chǎn)前檢查次數(shù);橫坐標(biāo):產(chǎn)前檢查次數(shù);縱坐標(biāo):縱坐標(biāo):頻
14、率頻率, 檢查檢查k次的婦女所占的比例(次的婦女所占的比例(%)等寬矩形長(zhǎng)條:等寬矩形長(zhǎng)條:高度高度相當(dāng)于檢查次數(shù)的頻率相當(dāng)于檢查次數(shù)的頻率圖2-1 某地96名婦女產(chǎn)前檢查次率分布0510152025300123455產(chǎn)前檢查次數(shù)頻率(%)2連續(xù)型定量變量的頻率分布連續(xù)型定量變量的頻率分布例例2-2 抽樣調(diào)查某地抽樣調(diào)查某地120名名18歲歲35歲健康男性歲健康男性居民血清鐵含量(居民血清鐵含量(mol/L),數(shù)據(jù)如下),數(shù)據(jù)如下:7.42 8.65 23.02 21.61 21.31 21.46 9.97 22.73 14.94 20.18 21.62 23.07 20.38 8.40 17
15、.32 29.64 19.69 21.69 23.90 17.45 19.08 20.52 24.14 23.77 18.36 23.04 24.22 24.13 21.53 11.09 18.89 18.26 23.29 17.67 15.38 18.61 14.27 17.40 22.55 17.55 16.10 17.98 20.13 21.00 14.56 19.89 19.82 17.48 14.89 18.37 19.50 17.08 18.12 26.02 11.34 13.81 10.25 15.94 15.83 18.54 24.52 19.26 26.13 16.99 18
16、.89 18.46 20.87 17.51 13.12 11.75 17.40 21.36 17.14 13.77 12.50 20.40 20.30 19.38 23.11 12.67 23.02 24.36 25.61 19.53 14.77 14.37 24.75 12.73 17.25 19.09 16.79 17.19 19.32 19.59 19.12 15.31 21.75 19.47 15.51 10.86 27.81 21.65 16.32 20.75 22.11 13.17 17.55 19.26 12.65 18.48 19.83 23.12 19.22 19.22 16
17、.72 27.90 11.74 24.66 14.18 16.52 表表 2-2 120 名正常成年男子血清鐵含量名正常成年男子血清鐵含量 (mol/L)頻數(shù)表頻數(shù)表 組段組段 頻數(shù)頻數(shù) 頻率頻率 累計(jì)頻數(shù)累計(jì)頻數(shù) 累計(jì)頻率累計(jì)頻率 (1) (2) (3) (4) (5) 6 1 0.83 1 0.83 8 3 2.50 4 3.33 10 6 5.00 10 8.33 12 8 6.67 18 15.00 14 12 10.00 30 25.00 16 20 16.67 50 41.67 18 27 22.50 77 64.17 20 18 15.00 95 79.17 22 12 10.0
18、0 107 89.17 24 8 6.67 115 95.83 26 4 3.33 119 99.17 2830 1 0.83 120 100.00 合計(jì)合計(jì) 120 100 直方圖直方圖(1) (1) 頻率直方圖頻率直方圖 橫軸:血清鐵含量橫軸:血清鐵含量 縱軸:頻率縱軸:頻率 矩形直條高度矩形直條高度 = 頻率頻率, 直條高度之和直條高度之和= 100%(2) 頻率密度直方圖頻率密度直方圖 橫軸:血清鐵含量橫軸:血清鐵含量 縱軸:縱軸:頻率密度頻率密度 = = 頻率頻率/ /組距組距 矩形直條的面積矩形直條的面積 = 頻率頻率, 直條面積之和直條面積之和= 100%注:組距相等時(shí),兩種注:
19、組距相等時(shí),兩種直方圖形狀相同直方圖形狀相同圖圖2-2 某年某地某年某地120名名1835歲健康男性居民歲健康男性居民 血清鐵含量頻率分布血清鐵含量頻率分布圖圖2-3 某地居民某地居民238人發(fā)汞含量(人發(fā)汞含量(mol/kg)分布)分布 正偏峰分布(正偏峰分布(positively skewed distribution)負(fù)偏峰分布(負(fù)偏峰分布(negatively skewed distribution)圖2-1 某地96名婦女產(chǎn)前檢查次率分布0510152025300123455產(chǎn)前檢查次數(shù)頻率(%)頻率密度頻率密度第二節(jié)第二節(jié) 描述平均水平的統(tǒng)計(jì)指標(biāo)描述平均水平的統(tǒng)計(jì)指標(biāo) 定量地描述集
20、中趨勢(shì)與離中趨勢(shì)是統(tǒng)計(jì)描述定量地描述集中趨勢(shì)與離中趨勢(shì)是統(tǒng)計(jì)描述的重要內(nèi)容的重要內(nèi)容 對(duì)于連續(xù)型定量變量,描述集中趨勢(shì)常用對(duì)于連續(xù)型定量變量,描述集中趨勢(shì)常用統(tǒng)計(jì)量為算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。統(tǒng)計(jì)量為算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。1. 算術(shù)均數(shù)算術(shù)均數(shù)簡(jiǎn)稱均數(shù)(簡(jiǎn)稱均數(shù)(mean),適合描述對(duì)稱分布資料的集中),適合描述對(duì)稱分布資料的集中位置(也稱為平均水平)。其計(jì)算公式為位置(也稱為平均水平)。其計(jì)算公式為nXXXXn.21nXnXnXiinii1 n:樣本含量:樣本含量 X1,X2,Xn:觀察值:觀察值 或或 :觀察值之和:觀察值之和iiXX例例2-3 測(cè)得測(cè)得8只正常大鼠血清總酸性磷酸酶
21、(只正常大鼠血清總酸性磷酸酶(TACP)含量(含量(U/L)為)為4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。試求其算術(shù)均數(shù)。試求其算術(shù)均數(shù)。 按式(按式(2-1),算術(shù)均數(shù)為),算術(shù)均數(shù)為 91. 3)38. 342. 504. 426. 245. 308. 243. 620. 4(81X加權(quán)平均加權(quán)平均表表 2-3 1835歲健康男性居民血清鐵含量算術(shù)均數(shù)的近似計(jì)算歲健康男性居民血清鐵含量算術(shù)均數(shù)的近似計(jì)算 組段組段 組中值組中值(0X) 頻數(shù)(頻數(shù)(f) 0fX (1) (2) (3) (4)=(2)(3) 6 7 1 7 8 9 3 27 10 11
22、 6 66 12 13 8 104 14 15 12 180 16 17 20 340 18 19 27 513 20 21 18 378 22 23 12 276 24 25 8 200 26 27 4 108 2830 29 1 29 合計(jì)合計(jì) 120 2228 57.1812022281312919371X對(duì)于偏峰分布資料算術(shù)均數(shù)不能較好地反映分對(duì)于偏峰分布資料算術(shù)均數(shù)不能較好地反映分布的集中趨勢(shì)。布的集中趨勢(shì)。頻率密度頻率密度2. 幾何均數(shù)(幾何均數(shù)(geometric mean) 適用于觀察值變化范圍跨越多個(gè)數(shù)量級(jí)的資料適用于觀察值變化范圍跨越多個(gè)數(shù)量級(jí)的資料頻數(shù)圖一般呈正偏峰分布頻
23、數(shù)圖一般呈正偏峰分布nnXXXG.21)log(log1nXG例例2-5 7名慢性遷延性肝炎患者的名慢性遷延性肝炎患者的HBsAg滴度資料滴度資料為為1:16,1:32,1:32,1:64, 1:64,1:128,1:512。試。試計(jì)算其幾何均數(shù)。計(jì)算其幾何均數(shù)。6451212864643232167G)log(log1nXG.648062. 1lg7512lg128lg64lg64lg32lg32lg16lglg113. 中位數(shù)(中位數(shù)(median) 可用于各種分布的定量資料可用于各種分布的定量資料 總體中有一半個(gè)體的數(shù)值低于這個(gè)數(shù),一半個(gè)體的數(shù)總體中有一半個(gè)體的數(shù)值低于這個(gè)數(shù),一半個(gè)體的
24、數(shù)值高于這個(gè)數(shù)。值高于這個(gè)數(shù)。 基于樣本資料基于樣本資料 將將n例數(shù)據(jù)按升序排列,第例數(shù)據(jù)按升序排列,第i個(gè)數(shù)據(jù)記為個(gè)數(shù)據(jù)記為 n為奇數(shù)時(shí)為奇數(shù)時(shí) n為偶數(shù)時(shí)為偶數(shù)時(shí) 例例2-7 某藥廠觀察某藥廠觀察9只小鼠口服高山紅景天醇提取物只小鼠口服高山紅景天醇提取物(RSAE)后在乏氧條件下的生存時(shí)間(分鐘)如下后在乏氧條件下的生存時(shí)間(分鐘)如下: 49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0。試求其中位數(shù)。試求其中位數(shù)。*iX*21nXM)(21*12*2nnXXM6 .63*5*21XXMn百分位數(shù)(百分位數(shù)(percentile) 總體中總體中, ,
25、 數(shù)值小于它的個(gè)體恰有數(shù)值小于它的個(gè)體恰有X%,大于,大于它的個(gè)體恰有它的個(gè)體恰有1-X % 中位數(shù)中位數(shù) = = 樣本估計(jì):按照升序排列的數(shù)列里樣本估計(jì):按照升序排列的數(shù)列里, , 其左側(cè)其左側(cè)(即小于它)的個(gè)體數(shù)在整個(gè)樣本中所占百(即小于它)的個(gè)體數(shù)在整個(gè)樣本中所占百分比為分比為X%。XP50P第三節(jié)第三節(jié) 描述變異程度的統(tǒng)計(jì)指標(biāo)描述變異程度的統(tǒng)計(jì)指標(biāo)同一總體中不同個(gè)體之間的離散趨勢(shì)又稱為變異同一總體中不同個(gè)體之間的離散趨勢(shì)又稱為變異(variation)例例2-10 試觀察三組數(shù)據(jù)試觀察三組數(shù)據(jù)A組:組:24,27,30,33,36B組:組:26,28,30,32,34C組:組:26,2
26、9,30,31,34三組均數(shù)都是三組均數(shù)都是301. 極差(極差(range) R = 最大值最小值最大值最小值計(jì)算簡(jiǎn)便,但僅利用了兩個(gè)數(shù)據(jù)的信息計(jì)算簡(jiǎn)便,但僅利用了兩個(gè)數(shù)據(jù)的信息一般,樣本量一般,樣本量n越大越大R也往往會(huì)越大也往往會(huì)越大, 不夠穩(wěn)定不夠穩(wěn)定 例例2-12 計(jì)算上述三組數(shù)據(jù)的極差計(jì)算上述三組數(shù)據(jù)的極差A(yù)組組 R=36-24=12B組組 R=34-26=8C組組 R=34-26=82. 四分位數(shù)間距(四分位數(shù)間距(quartile range) Q= P75-P25 P25與與P75之間恰好包含之間恰好包含50%的個(gè)體的個(gè)體 四分位數(shù)間距四分位數(shù)間距Q是總體中數(shù)值居中的是總體中
27、數(shù)值居中的50%個(gè)體散布的范圍個(gè)體散布的范圍 Q越大意味著數(shù)據(jù)間變異越大越大意味著數(shù)據(jù)間變異越大 3. 方差(方差(variance) 與標(biāo)準(zhǔn)差(與標(biāo)準(zhǔn)差(standard deviation) 用于反映一組對(duì)稱分布的觀察值在數(shù)量上的用于反映一組對(duì)稱分布的觀察值在數(shù)量上的變異程度。變異程度??傮w中:總體中: 離均差離均差 (deviation from average) X:有正有負(fù),總和為有正有負(fù),總和為 0 離均差平方離均差平方:2)(X 總體方差總體方差(population variance)2:總體中總體中,離均差平方的離均差平方的 平均值平均值 總體標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差(populat
28、ion standard deviation):總體方差:總體方差的的 平方根平方根 樣本中:樣本中:樣本均數(shù)樣本均數(shù)X代替代替 離均差平方和離均差平方和:2)(XX 比比 2)(X小小 離均差平方的平均離均差平方的平均: nXX2)(偏小偏小 樣本方差樣本方差(sample variance):英國統(tǒng)計(jì)學(xué)家英國統(tǒng)計(jì)學(xué)家 W.S. Gosset 提出用提出用 n-1 代替代替 n 來計(jì)算樣本中離均差平方的平均水平來計(jì)算樣本中離均差平方的平均水平 1)(22nXXS (2-9) 樣本標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差(sample standard deviation): 1)(2nXXS (2-12) 自由度自
29、由度(degree of freedom) : n-1 自由度自由度的的意義意義:隨機(jī)變量能“自由”取值的個(gè)數(shù)。隨機(jī)變量能“自由”取值的個(gè)數(shù)。 例例2-13 計(jì)算例計(jì)算例2-10中三組數(shù)據(jù)的標(biāo)準(zhǔn)差。中三組數(shù)據(jù)的標(biāo)準(zhǔn)差。A組:組:24,27,30,33,36B組:組:26,28,30,32,34 三組均數(shù)都是三組均數(shù)都是30C組:組:26,29,30,31,34 C組數(shù)據(jù)的變異最小,組數(shù)據(jù)的變異最小,A組的最大組的最大按照按照(2-12)式式, A 組:74. 415)3036(.)3027()3024(222S B 組:16. 315)3034(.)3028()3026(222S C 組:92
30、. 215)3034(.)3029()3026(222S 5. 變異系數(shù)(變異系數(shù)(coefficient of variation ,CV)例例2-15 1985年通過十省調(diào)查得知,農(nóng)村剛滿周歲的女年通過十省調(diào)查得知,農(nóng)村剛滿周歲的女童體重均數(shù)為童體重均數(shù)為8.42kg,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為0.98kg;身高均數(shù)為;身高均數(shù)為72.4cm,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為3.0cm。體重的變異大還是身高的變。體重的變異大還是身高的變異大?異大?%100XSCV體重的變異系數(shù)體重的變異系數(shù)身高的變異系數(shù)身高的變異系數(shù) %64.11%10042. 898. 0%100XSCV%14. 4%1004 .720 .
31、 3%100XSCV用于用于 量綱不同的變量間變異程度的比較量綱不同的變量間變異程度的比較或或 均數(shù)差別較大的變量間變異程度的比較均數(shù)差別較大的變量間變異程度的比較例如例如 12月嬰兒的身高月嬰兒的身高 cmX32.561, S12.15cm %82. 332.5615. 21CV 臨產(chǎn)母親臨產(chǎn)母親的身高的身高 cmX11.1592, S24.02cm %53. 202. 411.1592CV 第四節(jié)第四節(jié) 描述分布形態(tài)的統(tǒng)計(jì)指標(biāo)描述分布形態(tài)的統(tǒng)計(jì)指標(biāo)1. 偏度系數(shù)偏度系數(shù) (coefficient of skewness,SKEW) 3)2)(1(SXXnnnSKEW總體偏度系數(shù)為總體偏度系
32、數(shù)為0時(shí),分布是對(duì)稱的;時(shí),分布是對(duì)稱的;取正值時(shí),分布為正偏峰;取正值時(shí),分布為正偏峰;取負(fù)值時(shí),分布為負(fù)偏峰。取負(fù)值時(shí),分布為負(fù)偏峰。例例2-2中血清鐵含量(中血清鐵含量(mol/L)數(shù)據(jù))數(shù)據(jù) 偏度系數(shù)偏度系數(shù) SKEW= - 0.193892. 峰度系數(shù)峰度系數(shù)(coefficient of kurtosis,KURT) )3)(2() 1(3)3)(2)(1() 1(24nnnSXXnnnnnKURT正態(tài)分布的總體峰度系數(shù)為正態(tài)分布的總體峰度系數(shù)為0;取負(fù)值時(shí),其分布較正態(tài)分布的峰平闊;取負(fù)值時(shí),其分布較正態(tài)分布的峰平闊;取正值時(shí),其分布較正態(tài)分布的峰尖峭。取正值時(shí),其分布較正態(tài)分布的峰尖峭。例例2-2中血清鐵含量(中血清鐵含量(mol/L)數(shù)據(jù)的峰度系數(shù))數(shù)據(jù)的峰度系數(shù) KURT= - 0.01783第五節(jié)第五節(jié) 統(tǒng)計(jì)表和統(tǒng)計(jì)圖統(tǒng)計(jì)表和統(tǒng)計(jì)圖n統(tǒng)計(jì)表(統(tǒng)計(jì)表(sta
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- DB6523-T 350-2023 農(nóng)產(chǎn)品檢測(cè)實(shí)驗(yàn)室危險(xiǎn)化學(xué)品安全管理規(guī)范
- DB6523-T 377-2023 職工基本養(yǎng)老保險(xiǎn)待遇辦理規(guī)范
- 中國古代文學(xué)(三)知到課后答案智慧樹章節(jié)測(cè)試答案2025年春廣東外語外貿(mào)大學(xué)
- 2024年春九年級(jí)道德與法治下冊(cè) 第三單元 走向未來的少年 第六課 我的畢業(yè)季 第1框 學(xué)無止境教學(xué)實(shí)錄 新人教版
- 人教版《歷史與社會(huì)》九上第一單元綜合探究一《從“驅(qū)除韃虜”到“五族共和”》教學(xué)設(shè)計(jì)
- 2025年煤制合成氨合作協(xié)議書
- 2025年玩具加工設(shè)備項(xiàng)目建議書
- 電影膠片在線平臺(tái)行業(yè)跨境出海戰(zhàn)略研究報(bào)告
- 有機(jī)硅氮磷復(fù)合肥企業(yè)制定與實(shí)施新質(zhì)生產(chǎn)力戰(zhàn)略研究報(bào)告
- 短視頻創(chuàng)意挑戰(zhàn)社區(qū)行業(yè)深度調(diào)研及發(fā)展戰(zhàn)略咨詢報(bào)告
- DBJ04-T 303-2024 高性能混凝土應(yīng)用技術(shù)規(guī)程
- 2024年湖南公務(wù)員考試申論試題(省市卷)
- 2024年02月福建2024年中信銀行福州分行社會(huì)招考(210)筆試歷年參考題庫附帶答案詳解
- 影視短劇投資合作合同
- 高考語文專題復(fù)習(xí)圖文轉(zhuǎn)換之徽標(biāo)類 課件
- 眼科護(hù)理培訓(xùn)課件
- 2024-2030年中國醫(yī)院后勤服務(wù)市場(chǎng)運(yùn)行狀況及投資前景趨勢(shì)分析報(bào)告
- 湖北武漢市2025屆高三第一次調(diào)研測(cè)試數(shù)學(xué)試卷含解析
- 2024年中國汽車出口與投資國別指南-馬來西亞篇-中國汽車工業(yè)協(xié)會(huì)
- 骨科延續(xù)護(hù)理
- 有趣的雪花片
評(píng)論
0/150
提交評(píng)論