第1、2、3章緒論、計(jì)量統(tǒng)計(jì)描述_第1頁
第1、2、3章緒論、計(jì)量統(tǒng)計(jì)描述_第2頁
第1、2、3章緒論、計(jì)量統(tǒng)計(jì)描述_第3頁
第1、2、3章緒論、計(jì)量統(tǒng)計(jì)描述_第4頁
第1、2、3章緒論、計(jì)量統(tǒng)計(jì)描述_第5頁
已閱讀5頁,還剩111頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室第一章第一章醫(yī)學(xué)統(tǒng)計(jì)學(xué)中的基本概念醫(yī)學(xué)統(tǒng)計(jì)學(xué)中的基本概念葉孟良葉孟良2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 統(tǒng)計(jì)學(xué)(統(tǒng)計(jì)學(xué)(statistics):): 1.Statistics: A science dealing with the collection, analysis, interpretation, and presentation of numerical data. (Websters 國際大辭典國際大辭典) 2.Statistics:The

2、science and art of dealing with variation in data through collection, classification, analysis in such a way as to obtain reliable results. (John M. Last,流行病學(xué)詞典流行病學(xué)詞典) 總之,統(tǒng)計(jì)學(xué)是一門處理數(shù)據(jù)中總之,統(tǒng)計(jì)學(xué)是一門處理數(shù)據(jù)中變異性變異性的科學(xué)與藝術(shù),內(nèi)容的科學(xué)與藝術(shù),內(nèi)容包括包括收集收集、分析分析、解釋解釋和和表達(dá)數(shù)據(jù)表達(dá)數(shù)據(jù),目的是求得可靠的結(jié)論,目的是求得可靠的結(jié)論一、緒論一、緒論 統(tǒng)計(jì)學(xué)思維和方法已經(jīng)滲透到醫(yī)學(xué)研究和衛(wèi)生統(tǒng)

3、計(jì)學(xué)思維和方法已經(jīng)滲透到醫(yī)學(xué)研究和衛(wèi)生決策之中,在科研的總體設(shè)計(jì)、資料的收集、整決策之中,在科研的總體設(shè)計(jì)、資料的收集、整理、分析直到最后得出結(jié)論都與之密切相關(guān)。理、分析直到最后得出結(jié)論都與之密切相關(guān)。 例:例: 1.北京某醫(yī)院某大夫使用北京某醫(yī)院某大夫使用“烏貝散烏貝散”治療胃治療胃潰瘍出血潰瘍出血107例,有效例,有效101例,有效率例,有效率94.4%,那么,那么別的醫(yī)生也一定是別的醫(yī)生也一定是94.4%嗎?那么是嗎?那么是多少多少?高還是?高還是低?(低?(求置信區(qū)間求置信區(qū)間)2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 2.重慶某醫(yī)院有位

4、老大夫,用重慶某醫(yī)院有位老大夫,用“冠心靈冠心靈”治療治療冠心病,其對(duì)照組用西藥,觀察結(jié)果如表冠心病,其對(duì)照組用西藥,觀察結(jié)果如表 表 冠心靈與單存西藥療效對(duì)比顯效有效無效合計(jì)單純西藥925640冠心靈1918542請(qǐng)問:冠心靈是否比單純西藥有效?(涉及統(tǒng)計(jì)學(xué)中假設(shè)檢冠心靈是否比單純西藥有效?(涉及統(tǒng)計(jì)學(xué)中假設(shè)檢驗(yàn)的問題)驗(yàn)的問題)2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室二、醫(yī)學(xué)統(tǒng)計(jì)工作的內(nèi)容和資料的類型二、醫(yī)學(xué)統(tǒng)計(jì)工作的內(nèi)容和資料的類型1、醫(yī)學(xué)統(tǒng)計(jì)工作的內(nèi)容:、醫(yī)學(xué)統(tǒng)計(jì)工作的內(nèi)容: design (設(shè)計(jì))collection data(收集)s

5、orting data(整理資料)analyzing data (分析資料)2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 design (設(shè)計(jì))(設(shè)計(jì)) 根據(jù)研究目的制定研究方案 專業(yè)設(shè)計(jì): 統(tǒng)計(jì)設(shè)計(jì): 研究對(duì)象的選擇(納入與排除標(biāo)準(zhǔn)),樣本量和樣本取得的方法, 實(shí)驗(yàn)組與對(duì)照組的分組原則, 觀察指標(biāo)及其精度, 試驗(yàn)過程中的質(zhì)量控制, 擬采用的統(tǒng)計(jì)分析方法等。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室collection data(收集)(收集) 收集準(zhǔn)確、完整、充滿信息的原始資料 資料的來源: 專題試驗(yàn)(

6、實(shí)驗(yàn))研究、流行病學(xué)調(diào)查等 常規(guī)登記資料:例如門診病例、住院登記資料等 衛(wèi)生工作報(bào)表2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室sorting data(整理資料)(整理資料) 把收集到的原始資料,有目的地進(jìn)行加工,使資料系統(tǒng)化、條理化,以便進(jìn)一步統(tǒng)計(jì)分析 歸類 核查資料的完整性、可靠性(例如:漏項(xiàng)、邏輯性檢查、專業(yè)合理性、專業(yè)一致性檢查)2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室analyzing data (分析資料)(分析資料) 統(tǒng)計(jì)描述 統(tǒng)計(jì)分析 統(tǒng)計(jì)推斷參數(shù)估計(jì)假設(shè)檢驗(yàn) 把經(jīng)過整理的資料做一系列

7、的把經(jīng)過整理的資料做一系列的統(tǒng)計(jì)描述統(tǒng)計(jì)描述和和統(tǒng)計(jì)推統(tǒng)計(jì)推斷斷,闡明事物的特征和規(guī)律。,闡明事物的特征和規(guī)律。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室2、type of data(資料的類型資料的類型) 兩類: 定量(計(jì)量、數(shù)值變量定量(計(jì)量、數(shù)值變量)資料資料 定性(計(jì)數(shù)、分類變量)資料定性(計(jì)數(shù)、分類變量)資料2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室定量(計(jì)量、數(shù)值變量定量(計(jì)量、數(shù)值變量)資料資料 每個(gè)觀察對(duì)象通過定量測定的方法都有一個(gè)確切的值,通常有單位,但也有例外(例如 淋巴細(xì)胞轉(zhuǎn)化率)

8、。醫(yī)學(xué)中:身高、體重、血壓、血紅蛋白值等 定性(計(jì)數(shù)、分類變量)資料定性(計(jì)數(shù)、分類變量)資料 按照研究對(duì)象的某個(gè)特征進(jìn)行分組,然后分組計(jì)數(shù)所獲得的資料。 例如:男 25 女352022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 無序分類資料:分組時(shí)表現(xiàn)為互不相容的類別 二分類:性別(男25 女35 有效 無效) 多分類:血型(A 10 B 5 AB 7 O 3)、職業(yè) 有序分類資料(等級(jí)資料):按照程度遞增或遞減 例: 癌癥分期:早、中、晚。 藥物療效:治愈、好轉(zhuǎn)、無效、死亡。 幽門螺旋桿菌感染程度 (- + + +)2022-3-152022-3-15

9、重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 判斷資料類型的標(biāo)準(zhǔn): 看每個(gè)觀察對(duì)象是否有一個(gè)確切的值,有:計(jì)量 無:計(jì)數(shù) 資料可以由高級(jí)向低級(jí)轉(zhuǎn)化(高精度向低精度),如 血壓值 (正常、異常)住院號(hào)住院號(hào)年齡年齡身高身高體重體重住院天數(shù)住院天數(shù)職業(yè)職業(yè)文化程度文化程度分娩方式分娩方式妊娠結(jié)局妊娠結(jié)局20256552025655272716516571.571.55 5無無中學(xué)中學(xué)順產(chǎn)順產(chǎn)足月足月20256532025653222216016074.074.05 5無無小學(xué)小學(xué)助產(chǎn)助產(chǎn)足月足月20258302025830252515815868.068.06 6管理員管理員大學(xué)大學(xué)順產(chǎn)順

10、產(chǎn)足月足月20225432022543232316116169.069.05 5無無中學(xué)中學(xué)剖宮產(chǎn)剖宮產(chǎn)足月足月20224662022466252515915962.062.01111商業(yè)商業(yè)中學(xué)中學(xué)剖宮產(chǎn)剖宮產(chǎn)足月足月20245352024535272715715768.068.02 2無無小學(xué)小學(xué)順產(chǎn)順產(chǎn)早產(chǎn)早產(chǎn)20258342025834202015815866.066.04 4無無中學(xué)中學(xué)助產(chǎn)助產(chǎn)早產(chǎn)早產(chǎn)20194642019464242415815870.570.53 3無無中學(xué)中學(xué)助產(chǎn)助產(chǎn)足月足月20257832025783292915415457.057.07 7干部干部中學(xué)中學(xué)

11、剖宮產(chǎn)剖宮產(chǎn)足月足月觀察單位observations個(gè)體individuals變量variablesQuantitative data Quantitative data 計(jì)量資料計(jì)量資料Qualitative data Qualitative data 計(jì)數(shù)資料計(jì)數(shù)資料Units;elements2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室三、統(tǒng)計(jì)學(xué)中的幾個(gè)基本概念 (一)同質(zhì)與變異(一)同質(zhì)與變異 (二)總體與樣本(二)總體與樣本 (三)參數(shù)與統(tǒng)計(jì)量(三)參數(shù)與統(tǒng)計(jì)量 (四)誤差(四)誤差 (五)頻率與概率(五)頻率與概率 2022-3-1520

12、22-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室(一)同質(zhì)與變異 homogeneity and variation 1 1、同質(zhì):同質(zhì):是指觀察單位間被是指觀察單位間被研究指標(biāo)的影響因素相同研究指標(biāo)的影響因素相同。如:。如:研究兒童的生長發(fā)育,規(guī)定的同性別、同年齡、同地區(qū)、研究兒童的生長發(fā)育,規(guī)定的同性別、同年齡、同地區(qū)、同民族、健康的兒童即為同質(zhì)的兒童。同民族、健康的兒童即為同質(zhì)的兒童。 研究目的條件下的性質(zhì)相同研究目的條件下的性質(zhì)相同 觀察單位的研究特征為觀察單位的研究特征為變量變量。 變量的觀察結(jié)果為變量的觀察結(jié)果為變量值變量值。2 2、變異:變異:性質(zhì)相同的同質(zhì)對(duì)象

13、的某個(gè)或某幾個(gè)特征值不同。性質(zhì)相同的同質(zhì)對(duì)象的某個(gè)或某幾個(gè)特征值不同。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 同質(zhì)與變異的例子 例例1 調(diào)查調(diào)查2006年重慶年重慶7歲男童的身高和體重歲男童的身高和體重同質(zhì)同質(zhì):2006年、重慶市、年、重慶市、7歲男童歲男童變異變異:身高和體重各不相同:身高和體重各不相同 例例2 研究某降壓藥的療效研究某降壓藥的療效同質(zhì)同質(zhì):高血壓患者、用某藥治療:高血壓患者、用某藥治療變異變異:療效各不相同:療效各不相同2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室(二) 總體與樣本

14、 population and sample總體總體:根據(jù)研究目的:根據(jù)研究目的確定的確定的同質(zhì)同質(zhì)研究對(duì)象研究對(duì)象的的全體全體(集合)。分(集合)。分有限總體有限總體與與無限總體無限總體樣本樣本:從總體中隨機(jī):從總體中隨機(jī)抽取的部分觀察單位抽取的部分觀察單位 2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室代表性的條件代表性的條件 隨機(jī)抽樣 足夠數(shù)量(樣本含量) 樣本的分布與總體的分布一致(構(gòu)成)2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科

15、大學(xué)衛(wèi)生統(tǒng)計(jì)教研室隨機(jī)抽樣 random sampling為了保證樣本的為了保證樣本的可可靠性靠性和和代表性代表性,需,需要采用隨機(jī)的抽樣要采用隨機(jī)的抽樣方法(在總體中每方法(在總體中每個(gè)個(gè)體具有個(gè)個(gè)體具有相同的相同的機(jī)會(huì)機(jī)會(huì)被抽到)。被抽到)。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室足夠數(shù)量:樣本含量樣本的結(jié)構(gòu)分布與總體的分布特征一致 例如:欲研究重慶市7歲兒童的生長發(fā)育情況 總體:男107:女100 樣本:應(yīng)該接近或近似男107:女1002022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室(三) 參數(shù)與統(tǒng)計(jì)

16、量 parameter and statistic參數(shù)參數(shù):總體總體的統(tǒng)計(jì)指標(biāo),的統(tǒng)計(jì)指標(biāo),如總體均數(shù)、標(biāo)準(zhǔn)差,采如總體均數(shù)、標(biāo)準(zhǔn)差,采用希臘字母分別記為用希臘字母分別記為、。固定的常數(shù)固定的常數(shù) 樣本樣本抽取部分觀察單位抽取部分觀察單位 推斷推斷inference統(tǒng)計(jì)量統(tǒng)計(jì)量:樣本樣本的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差,采用拉的統(tǒng)計(jì)指標(biāo),如樣本均數(shù)、標(biāo)準(zhǔn)差,采用拉丁字母分別記為丁字母分別記為 。 參數(shù)附近波動(dòng)的隨機(jī)變量參數(shù)附近波動(dòng)的隨機(jī)變量 。SX、2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室(四) 誤差 error誤差誤差:實(shí)際:實(shí)際觀察值觀察值與客

17、觀與客觀真實(shí)值真實(shí)值之差,之差,以及以及統(tǒng)計(jì)量統(tǒng)計(jì)量與與參數(shù)參數(shù)之差。之差。(1)系統(tǒng)誤差)系統(tǒng)誤差(2)隨機(jī)誤差)隨機(jī)誤差2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室(1)系統(tǒng)誤差 systematic error 在實(shí)際觀測過程中,由受試對(duì)象、研究者、儀在實(shí)際觀測過程中,由受試對(duì)象、研究者、儀器設(shè)備、研究方法、非實(shí)驗(yàn)因素影響等原因造成的器設(shè)備、研究方法、非實(shí)驗(yàn)因素影響等原因造成的有有一定傾向性或規(guī)律性一定傾向性或規(guī)律性的誤差。流行病學(xué)稱之為的誤差。流行病學(xué)稱之為偏偏倚倚(bias)。)。 特點(diǎn):觀察值有特點(diǎn):觀察值有系統(tǒng)性系統(tǒng)性、方向性方向性、周

18、期性周期性的偏的偏離真值。離真值。 可以通過嚴(yán)格的可以通過嚴(yán)格的實(shí)驗(yàn)設(shè)計(jì)實(shí)驗(yàn)設(shè)計(jì)和和技術(shù)措施技術(shù)措施消除消除。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室(2)隨機(jī)誤差random error 排除上述誤差后尚存的誤差,受多種無法控制排除上述誤差后尚存的誤差,受多種無法控制的因素的影響。的因素的影響。 特點(diǎn):大小方向不一的隨機(jī)變化。特點(diǎn):大小方向不一的隨機(jī)變化。隨機(jī)測量誤差隨機(jī)測量誤差(random measurement error) 提高操作者熟練程度可以減少這種誤差提高操作者熟練程度可以減少這種誤差 隨機(jī)抽樣誤差隨機(jī)抽樣誤差( random s

19、ampling error):):由抽樣造成的樣本統(tǒng)計(jì)量和總體參數(shù)間的差異。由抽樣造成的樣本統(tǒng)計(jì)量和總體參數(shù)間的差異。不可避免,但有一定的分布規(guī)律,可估計(jì)。不可避免,但有一定的分布規(guī)律,可估計(jì)。(五)(五) 概率概率與與頻率頻率 probability and frequencyfrequency 確定性現(xiàn)象確定性現(xiàn)象:在一定條件下,在一定條件下,一定一定會(huì)發(fā)生或一定不會(huì)會(huì)發(fā)生或一定不會(huì)發(fā)生的現(xiàn)象。其表現(xiàn)結(jié)果為兩種事件:肯定發(fā)生某種結(jié)果發(fā)生的現(xiàn)象。其表現(xiàn)結(jié)果為兩種事件:肯定發(fā)生某種結(jié)果的叫的叫必然事件必然事件;肯定不發(fā)生某種結(jié)果的叫;肯定不發(fā)生某種結(jié)果的叫不可能事件不可能事件。 隨機(jī)現(xiàn)象隨機(jī)現(xiàn)

20、象:在同樣條件下在同樣條件下可能可能會(huì)出現(xiàn)兩種或多種結(jié)果,會(huì)出現(xiàn)兩種或多種結(jié)果,究竟會(huì)發(fā)生哪種結(jié)果,事先不能確定。其表現(xiàn)結(jié)果稱為究竟會(huì)發(fā)生哪種結(jié)果,事先不能確定。其表現(xiàn)結(jié)果稱為隨隨機(jī)事件機(jī)事件。 隨機(jī)事件的特征:隨機(jī)事件的特征:隨機(jī)性隨機(jī)性;規(guī)律性規(guī)律性:每次發(fā):每次發(fā)生的可能性的大小是確定的。生的可能性的大小是確定的。概率概率:隨機(jī)事件發(fā)生的可能性大小,用大寫隨機(jī)事件發(fā)生的可能性大小,用大寫的的 P P 表示,是一個(gè)穩(wěn)定的值;取值表示,是一個(gè)穩(wěn)定的值;取值00,11。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室必然事件必然事件 P P = 1 =

21、1 不可能事件不可能事件 P P =0 =0 隨機(jī)事件隨機(jī)事件 0 0 P P 1 1 P P 0.05 0.05(5 5)或)或P P 0.01 0.01(1 1)稱為稱為小概率事件小概率事件( (習(xí)慣習(xí)慣) ),統(tǒng)計(jì)學(xué)上認(rèn)為不大可能發(fā)生。,統(tǒng)計(jì)學(xué)上認(rèn)為不大可能發(fā)生。小概率事件小概率事件2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 樣本的實(shí)際發(fā)生率稱為樣本的實(shí)際發(fā)生率稱為頻率,頻率,具有波動(dòng)具有波動(dòng)性性。設(shè)在相同條件下,獨(dú)立重復(fù)進(jìn)行。設(shè)在相同條件下,獨(dú)立重復(fù)進(jìn)行n次試次試驗(yàn),事件驗(yàn),事件A出現(xiàn)出現(xiàn)f 次,則事件次,則事件A出現(xiàn)的頻率出現(xiàn)的頻率為為f

22、 / n。 頻率與概率間的關(guān)系:頻率與概率間的關(guān)系: 樣本頻率總是圍繞概率上下波動(dòng)樣本頻率總是圍繞概率上下波動(dòng)樣本含量樣本含量n n越大,波動(dòng)幅度越小,頻率越接近概越大,波動(dòng)幅度越小,頻率越接近概率。率。頻率 frequency2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 復(fù)習(xí):復(fù)習(xí): 總體與樣本、統(tǒng)計(jì)量與參數(shù)、系統(tǒng)誤差與抽樣總體與樣本、統(tǒng)計(jì)量與參數(shù)、系統(tǒng)誤差與抽樣誤差誤差1 1、 調(diào)查某地某年調(diào)查某地某年7 7歲正常男童的身高歲正常男童的身高2 2、 觀察某人群脈搏數(shù)(次觀察某人群脈搏數(shù)(次/ /分)分)3 3、 觀察某人群脈搏數(shù),定義脈搏數(shù)在觀察

23、某人群脈搏數(shù),定義脈搏數(shù)在6060次次/ /分分-100-100次次/ /分為正常,分為正常,60100100次次/ /分為分為異常,按異常,按“正常正常”與與“異常異?!狈謩e清點(diǎn)人數(shù)得分別清點(diǎn)人數(shù)得到的資料到的資料2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室4 4、某單位職工體檢、某單位職工體檢101101名正常成年女子的血名正常成年女子的血清總膽固醇(清總膽固醇(mmol/Lmmol/L)5 5、某醫(yī)院、某醫(yī)院19981998年在某城區(qū)隨機(jī)調(diào)查了年在某城區(qū)隨機(jī)調(diào)查了85898589例例6060歲以上老人,體檢發(fā)現(xiàn)高血壓患者為歲以上老人,體檢發(fā)現(xiàn)高

24、血壓患者為28232823例,高血壓患病率為例,高血壓患病率為2823/85892823/8589* *100/%=32.87%100/%=32.87%2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室資料的統(tǒng)計(jì)描述資料的統(tǒng)計(jì)描述葉孟良2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室統(tǒng)計(jì)描述的意義統(tǒng)計(jì)描述的意義 社會(huì)活動(dòng)看似雜亂無章,對(duì)個(gè)體來說社會(huì)活動(dòng)看似雜亂無章,對(duì)個(gè)體來說有很多不確定性,但總體上都是服從一些有很多不確定性,但總體上都是服從一些統(tǒng)計(jì)規(guī)律的。統(tǒng)計(jì)規(guī)律的。 醫(yī)學(xué)工作有很多數(shù)據(jù),統(tǒng)計(jì)學(xué)描述就醫(yī)學(xué)工作有很多

25、數(shù)據(jù),統(tǒng)計(jì)學(xué)描述就是對(duì)這些數(shù)據(jù)進(jìn)行加工和提煉,找出規(guī)律、是對(duì)這些數(shù)據(jù)進(jìn)行加工和提煉,找出規(guī)律、預(yù)測未知。預(yù)測未知。 統(tǒng)計(jì)描述是最簡潔有力的語言。統(tǒng)計(jì)描述是最簡潔有力的語言。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室概念:即用少量幾個(gè)統(tǒng)計(jì)指標(biāo)刻畫出原始數(shù)概念:即用少量幾個(gè)統(tǒng)計(jì)指標(biāo)刻畫出原始數(shù)據(jù)的特征稱為統(tǒng)計(jì)描述。據(jù)的特征稱為統(tǒng)計(jì)描述。計(jì)量資料的統(tǒng)計(jì)描述方法:計(jì)量資料的統(tǒng)計(jì)描述方法: (單變量單變量) 1. 通過頻數(shù)表描述數(shù)據(jù)特征通過頻數(shù)表描述數(shù)據(jù)特征 2.用統(tǒng)計(jì)指標(biāo)用統(tǒng)計(jì)指標(biāo) 定量描述數(shù)據(jù)的特征。定量描述數(shù)據(jù)的特征。 2022-3-152022-3-

26、15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室描述計(jì)量資料的統(tǒng)計(jì)方法有兩類:描述計(jì)量資料的統(tǒng)計(jì)方法有兩類: 統(tǒng)計(jì)圖表:統(tǒng)計(jì)圖表:主要是頻數(shù)分布表(圖主要是頻數(shù)分布表(圖) 統(tǒng)計(jì)指標(biāo):統(tǒng)計(jì)指標(biāo):定量描述數(shù)據(jù)的特征定量描述數(shù)據(jù)的特征2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室一、數(shù)值變量的頻數(shù)分布(一)、頻數(shù)分布表(一)、頻數(shù)分布表頻數(shù)分布表:將變量值分為不同數(shù)量的組段,清點(diǎn)頻數(shù)分布表:將變量值分為不同數(shù)量的組段,清點(diǎn)各組段的例數(shù)。各組段的例數(shù)。意義:概括了解變量值在各組段的意義:概括了解變量值在各組段的分布和規(guī)律分布和規(guī)律。頻數(shù)表的編制頻數(shù)表

27、的編制 例:某年某市例:某年某市120120名名1212歲男童的身高(歲男童的身高(cmcm)資料如下,作)資料如下,作統(tǒng)計(jì)描述統(tǒng)計(jì)描述。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 142.3 156.6 142.7 145.7 138.2 141.6 142.5 130.5 132.1 135.5 134.5 148.8 134.4 148.8 137.9 151.3 140.8 149.8 143.6 149.0 145.2 141.8 146.8 135.1 150.3 133.1 142.7 143.9 142.4 139.6 151.1

28、144.0 145.4 146.2 143.3 156.3 141.9 140.7 145.9 144.4 141.2 141.5 148.8 140.1 150.6 139.5 146.4 143.8 150.0 142.1 143.5 139.2 144.7 139.3 141.9 147.8 140.5 138.9 148.9 142.4 134.7 147.3 138.1 140.2 137.4 145.1 145.8 147.9 146.7 143.4 150.8 144.5 137.1 147.1 142.9 134.9 143.6 142.3 143.3 140.2 125.9

29、132.7 152.9 147.9 141.8 141.4 140.9 141.4 146.7 138.7 160.9 154.2 137.9 139.9 149.7 147.5 136.9 148.1 144.0 137.4 134.7 138.5 138.9 137.7 138.5 139.6 143.5 142.9 146.5 145.4 129.4 142.5 141.2 148.9 154.0 147.7 152.3 146.6 139.2 139.92022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 1、求數(shù)據(jù)的、求數(shù)據(jù)的極差極差(range)

30、:): 極差是全部數(shù)據(jù)中的最大值與最小值極差是全部數(shù)據(jù)中的最大值與最小值之差,它描述了數(shù)據(jù)變異的幅度。之差,它描述了數(shù)據(jù)變異的幅度。本例本例極差極差: R=160.9-125.9=35cm2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 2、劃分組段、劃分組段(1)確定)確定組數(shù)組數(shù): 制作頻數(shù)表是為了簡化資料,顯示數(shù)據(jù)制作頻數(shù)表是為了簡化資料,顯示數(shù)據(jù)的分布規(guī)律,因此組數(shù)不能太多。也不能太的分布規(guī)律,因此組數(shù)不能太多。也不能太少,太少會(huì)掩蓋數(shù)據(jù)分布的規(guī)律。少,太少會(huì)掩蓋數(shù)據(jù)分布的規(guī)律。 適宜的分組數(shù)與觀察值的個(gè)數(shù)適宜的分組數(shù)與觀察值的個(gè)數(shù)n的多少的多少

31、有關(guān)。有關(guān)。n為為30時(shí),可分時(shí),可分5到到6組,隨著組,隨著n的增加,的增加,分組適當(dāng)增加,較大樣本時(shí),一般取分組適當(dāng)增加,較大樣本時(shí),一般取10組左組左右。右。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室(2)確定)確定組距組距 一般采取等距分組。一般采取等距分組。 組距組距=極差極差/組數(shù)組數(shù) 本例組距本例組距=35/10=3.542022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室(3)確定各組段的上下限:)確定各組段的上下限: 下限下限(low limit):每個(gè)組段的起點(diǎn)):每個(gè)組段的起點(diǎn) 上限上限(u

32、pper limit):每個(gè)組段的終點(diǎn)):每個(gè)組段的終點(diǎn) 上限上限=下限下限+組距組距 第一組段必須包含最小值,其下限一般取包含最第一組段必須包含最小值,其下限一般取包含最小值的較為整齊的數(shù)值。本例最小值為小值的較為整齊的數(shù)值。本例最小值為125.9,取,取125為第一組段的下限。其為第一組段的下限。其上限上限=125+4=129。 各組段不能重疊,每一組段均為各組段不能重疊,每一組段均為半開半閉區(qū)間半開半閉區(qū)間。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 3、用手工或電腦編制畫記表、用手工或電腦編制畫記表2022-3-152022-3-15重慶醫(yī)

33、科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 3、統(tǒng)計(jì)各組段內(nèi)的數(shù)據(jù)頻數(shù)得到頻數(shù)表組段組段 劃記劃記 頻數(shù)頻數(shù) f 頻率(頻率(%) 累計(jì)頻數(shù)累計(jì)頻數(shù)(1) (2) (3) (4) (5)125 一一 1 0.8 1 129 正正 4 3.3 5133 正正 正正 9 7.5 14137 正正正正正正正正正正正正 28 23.3 42141 正正正正正正正正正正正正正正 35 29.2 77145 正正正正正正正正正正正正 27 22.5 104149 正正一正正一 11 9.2 115153 正正 4 3.3 119157161 一一 1 0.8 120合計(jì)合計(jì) 120 1002022-3

34、-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 身高是一個(gè)連續(xù)變化的量身高是一個(gè)連續(xù)變化的量,被稱為被稱為連續(xù)連續(xù)性變量性變量。 已婚育齡婦女的現(xiàn)有子女?dāng)?shù)、幼兒的已婚育齡婦女的現(xiàn)有子女?dāng)?shù)、幼兒的牙齒數(shù)等,其取值是牙齒數(shù)等,其取值是0、1、2等不連續(xù)的量,等不連續(xù)的量,這種變量被稱為這種變量被稱為離散型變量離散型變量。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 4、頻率頻率與與累計(jì)頻率累計(jì)頻率頻率:頻率:頻數(shù)表中的各組頻數(shù)之和等于總例數(shù)頻數(shù)表中的各組頻數(shù)之和等于總例數(shù)n,將各組的頻數(shù)除以將各組的頻數(shù)除以n所得的比值被稱為

35、所得的比值被稱為頻率頻率。累計(jì)頻數(shù)累計(jì)頻數(shù):某組段及前面各組段的頻數(shù)之和。:某組段及前面各組段的頻數(shù)之和。累計(jì)頻率累計(jì)頻率:累計(jì)頻數(shù)除以總例數(shù)。:累計(jì)頻數(shù)除以總例數(shù)。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室(二)頻數(shù)分布圖(二)頻數(shù)分布圖 125 129 133 137 141 145 149 153 1572022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 (三)頻數(shù)分布特征(三)頻數(shù)分布特征 從頻數(shù)表,特別是頻數(shù)分布圖可以看到頻從頻數(shù)表,特別是頻數(shù)分布圖可以看到頻數(shù)分布有兩個(gè)特征:數(shù)分布有兩個(gè)特征: 、大

36、多數(shù)歲男童的身高向中央集中,、大多數(shù)歲男童的身高向中央集中,為集中趨勢;為集中趨勢; 、少部分男童的身高較低和較高,向兩、少部分男童的身高較低和較高,向兩端離散,為離散趨勢。端離散,為離散趨勢。(四)、頻數(shù)分布的類型(四)、頻數(shù)分布的類型1、對(duì)稱分布對(duì)稱分布: 指集中位置在中間,左右兩側(cè)對(duì)稱。指集中位置在中間,左右兩側(cè)對(duì)稱。2、偏態(tài)分布偏態(tài)分布: 指集中位置偏向一側(cè),頻數(shù)分布不對(duì)指集中位置偏向一側(cè),頻數(shù)分布不對(duì)稱。稱。 正偏態(tài)正偏態(tài) 負(fù)偏態(tài)負(fù)偏態(tài)2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室(五)頻數(shù)分布表的用途(五)頻數(shù)分布表的用途1、揭示資料的分布

37、類型及特征、揭示資料的分布類型及特征2 2、便于發(fā)現(xiàn)某些特大或特小的可疑值、便于發(fā)現(xiàn)某些特大或特小的可疑值3 3、便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和作統(tǒng)計(jì)處理、便于進(jìn)一步計(jì)算統(tǒng)計(jì)指標(biāo)和作統(tǒng)計(jì)處理4 4、 組段的頻率作為概率的估計(jì)。組段的頻率作為概率的估計(jì)。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 125 129 133 137 141 145 149 153 157對(duì)稱分布對(duì)稱分布2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室05101520252.3 2.6 2.9 3.2 3.5 3.8 4.1 4.4 4.7

38、 5.0 5.3 5.6 5.9圖圖2-1 101名正常成年女性血清總膽固醇頻數(shù)分名正常成年女性血清總膽固醇頻數(shù)分布布頻數(shù)頻數(shù)血清總血清總膽固醇膽固醇正態(tài)分布正態(tài)分布對(duì)稱分布對(duì)稱分布2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室051015201224364860728496108潛伏期/h病例數(shù)圖圖2-2 59名鏈球菌咽喉炎患者潛伏期名鏈球菌咽喉炎患者潛伏期正偏態(tài)分布正偏態(tài)分布101例正常人的血清肌紅蛋白含量051015202505101520 2530354045頻數(shù) 負(fù)偏態(tài)分布負(fù)偏態(tài)分布2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研

39、室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室集中趨勢的描述集中趨勢的描述平均數(shù)指標(biāo)的概念和作用平均數(shù)指標(biāo)的概念和作用 平均數(shù)表示一組同質(zhì)計(jì)量數(shù)據(jù)平均數(shù)表示一組同質(zhì)計(jì)量數(shù)據(jù)集中趨勢的位置集中趨勢的位置和和平均水平平均水平。作用:是一組計(jì)量數(shù)據(jù)平均水平的作用:是一組計(jì)量數(shù)據(jù)平均水平的代表值代表值;可作為;可作為不同組間的不同組間的比較值比較值。 常用的三種平均數(shù)指標(biāo)有常用的三種平均數(shù)指標(biāo)有:算術(shù)均數(shù)算術(shù)均數(shù)、幾何均幾何均數(shù)數(shù)、中位數(shù)中位數(shù)2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室(一)算術(shù)均數(shù)(一)算術(shù)均數(shù) 簡稱均數(shù)均數(shù) 總體均數(shù)總體均數(shù)用用 表示表示 樣本均數(shù)樣本均

40、數(shù)用用 表示表示X公式適用頻數(shù)公式適用頻數(shù)為正態(tài)或近似為正態(tài)或近似正態(tài)分布的計(jì)正態(tài)分布的計(jì)量資料量資料.適用條件適用條件2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 1、直接法、直接法(樣本例數(shù)較少樣本例數(shù)較少) 將所有數(shù)據(jù)直接相加,再除以總例數(shù)將所有數(shù)據(jù)直接相加,再除以總例數(shù)n:nXnXXXXXXn21N21XNNX2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 例如:例如: 測定了名健康人第一小時(shí)末血沉,分別是、測定了名健康人第一小時(shí)末血沉,分別是、10mm,求均數(shù)求均數(shù))mm(65305109236x2

41、022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 2、加權(quán)法(、加權(quán)法( 樣本例數(shù)較多,近似計(jì)算樣本例數(shù)較多,近似計(jì)算) 用各組段的用各組段的組中值組中值代替該組段中的任代替該組段中的任一觀察值,該組段的頻數(shù)是一觀察值,該組段的頻數(shù)是f f,即有,即有f f個(gè)組中個(gè)組中值,則有組中值與頻數(shù)的乘積代替該組段的值,則有組中值與頻數(shù)的乘積代替該組段的各個(gè)值相加各個(gè)值相加. . 計(jì)算公式:計(jì)算公式:nfxnxfxfxfxkk 22112022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 利用頻數(shù)表,將每組段的組中值即組中值即(下

42、限(下限+上限)上限)/2代替該組段觀察值的實(shí)際取值,用加權(quán)法求算術(shù)平均數(shù)。 在樣本例數(shù)較多的情況下,加權(quán)法與直接法算得的結(jié)果相差不大。 見P102022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 當(dāng)數(shù)據(jù)呈單峰對(duì)稱分布數(shù)據(jù)呈單峰對(duì)稱分布時(shí), 位于分布的中心,它是頻數(shù)分布最集中的位置。若數(shù)據(jù)分布不對(duì)稱,則 不位于分布的中心,也不在分布的集中趨勢位置,它不反映數(shù)據(jù)的一般水平。XX2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室二、幾何均數(shù)(,geometric mean) 適用于原始數(shù)據(jù)分布不對(duì)稱,數(shù)據(jù)分布不對(duì)稱,但經(jīng)對(duì)

43、數(shù)轉(zhuǎn)換后呈對(duì)稱分布對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的資料;滴度資料(等比資料)。 如血清滴度資料。公式:)lg(lg121nXGXXXGnn2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 例例2.2 測得測得1010個(gè)人的血清滴度的倒數(shù)分別為個(gè)人的血清滴度的倒數(shù)分別為2 2,2 2,4 4,4 4,8 8,8 8,8 8,8 8,3232,3232,求平均滴度。,求平均滴度。 71032lg32lg8lg8lg8lg8lg4lg4lg2lg2lglg1G2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 幾何均數(shù)是對(duì)數(shù)轉(zhuǎn)換后的

44、數(shù)據(jù)的算術(shù)均數(shù)的反對(duì)數(shù)。 當(dāng)資料中出現(xiàn)相同觀察值時(shí),也可用加權(quán)法計(jì)算幾何均數(shù): 例例2.3 (頻數(shù)表資料)(頻數(shù)表資料) 應(yīng)用:主要用于血清學(xué)和微生物學(xué)中。應(yīng)用:主要用于血清學(xué)和微生物學(xué)中。 )lg(lg1fXfG2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室三、三、中位數(shù)中位數(shù)(median) 中位數(shù)中位數(shù)是指將一組觀察值從小到大排序是指將一組觀察值從小到大排序后居于中間位置的那個(gè)數(shù)值,全部觀察值后居于中間位置的那個(gè)數(shù)值,全部觀察值中,大于和小于中位數(shù)的觀察值個(gè)數(shù)相等。中,大于和小于中位數(shù)的觀察值個(gè)數(shù)相等。 任何分布的定量數(shù)據(jù)均可用中位數(shù)描述任何分布

45、的定量數(shù)據(jù)均可用中位數(shù)描述其分布的集中趨勢。其分布的集中趨勢。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 直接法公式: 當(dāng)n為偶數(shù)時(shí) 當(dāng)n為奇數(shù)時(shí))21() 12()2()(21nnnXMXXM2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室1.1.原始資料原始資料 如測得如測得5 5個(gè)人的個(gè)人的VLDLVLDL中的中的apo_Bapo_B的含量的含量(mg/dl)(mg/dl)為為0.840.84、 2.852.85、 5.465.46、 8.588.58、 9.609.60,則,則 M=5.46=5.46

46、(mg/dlmg/dl) 若測量結(jié)果:若測量結(jié)果:0.840.84、 2.852.85、 8.588.58、 9.69.6,則,則 M=(2.85+8.58)/2=5.72=(2.85+8.58)/2=5.72(mg/dlmg/dl) 2.2.頻數(shù)表資料頻數(shù)表資料 表表2-4 2-4 某地某地630630名正常女性血清甘油三脂含量名正常女性血清甘油三脂含量(mg/dl)(mg/dl)甘油三脂甘油三脂頻數(shù)頻數(shù) 累積頻數(shù)累積頻數(shù)累積頻率累積頻率(%) 0.10 27 27 4.30.40169196 31.10.70167363 57.6 M1.00 94457 72.51.30 81538 85

47、.41.60 42580 92.11.90 28608 96.52.20 14622 98.72.50 4626 99.42.80 3629 99.83.10 1630100.0 合計(jì)合計(jì)630 - -2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室03060901201501801頻頻數(shù)數(shù)甘油三脂甘油三脂(mg/dL)0.10.4 0.7 1.01.31.6 1.92.2 2.5 2.83.16300.5196ML L、i iM M、f fM M分別為分別為M所在組段的下限、組距和頻數(shù),所在組段的下限、組距和頻數(shù), f fL L為為M所在組段之前各組段

48、的累積頻數(shù)所在組段之前各組段的累積頻數(shù)。914. 030. 01671965 . 063070. 0MMMLiffnLM5.02022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 連續(xù)型變量中位數(shù)的的計(jì)算可用公式: 組距 中位數(shù)所在組前 一組的累計(jì)頻數(shù) 中位數(shù)所在組下限 中位數(shù)所在組的頻數(shù))2(LMMfnfiLM2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室四、百分位數(shù)(percentile) 是一種位置位置指標(biāo),樣本的第X百分位數(shù)常記為Px,它是指把數(shù)據(jù)從小到大排列后處于第X百分位置的數(shù)值。它將全部數(shù)據(jù)分成兩部分,

49、在不包括Px的全部數(shù)據(jù)中有X%的數(shù)據(jù)小于Px,有(100-X)%的數(shù)據(jù)大于Px。2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 中位數(shù)是特殊的百分位數(shù),第50百分位數(shù),M=P50 。 連續(xù)性變量頻數(shù)表資料百分位數(shù)計(jì)算公式:)%(LXXXXfXnfiLP的累計(jì)頻數(shù)百分位數(shù)所在組前一組第百分位數(shù)所在組的頻數(shù)第百分位數(shù)所在組的組距第百分位數(shù)所在組下限第XfXfXiXLLXXX:2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室百分位數(shù)的應(yīng)用百分位數(shù)的應(yīng)用 、中位數(shù)是百分位數(shù)的特例。其特點(diǎn)是不易受、中位數(shù)是百分位數(shù)的特例。

50、其特點(diǎn)是不易受異常值的影響,適用于描述明顯偏態(tài)分布、或兩異常值的影響,適用于描述明顯偏態(tài)分布、或兩端無確定數(shù)值數(shù)據(jù)的平均水平。端無確定數(shù)值數(shù)據(jù)的平均水平。 、多個(gè)百分位數(shù)相結(jié)合可以用來說明一特定的、多個(gè)百分位數(shù)相結(jié)合可以用來說明一特定的問題:離散程度、參考值范圍、把資料劃分等級(jí)問題:離散程度、參考值范圍、把資料劃分等級(jí)2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室第三章第三章變異程度的統(tǒng)計(jì)描述變異程度的統(tǒng)計(jì)描述2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 前面一節(jié)講述了一組觀察值的集中趨勢,但平均前面一節(jié)講述

51、了一組觀察值的集中趨勢,但平均數(shù)并不能使我們?nèi)娴卣J(rèn)識(shí)事物,試看下例:數(shù)并不能使我們?nèi)娴卣J(rèn)識(shí)事物,試看下例: 例:例: 對(duì)甲、乙兩名高血壓患者連續(xù)觀察對(duì)甲、乙兩名高血壓患者連續(xù)觀察5天,測天,測得的收縮壓分別為(得的收縮壓分別為(mmHg): 甲患者甲患者 162 145 178 142 186 ( =162.6) 乙患者乙患者 164 160 163 159 166 ( =162.4) 甲x乙x平均水平差不多,但甲患者的血液波動(dòng)較大平均水平差不多,但甲患者的血液波動(dòng)較大第一節(jié)衡量變異程度的指標(biāo)第一節(jié)衡量變異程度的指標(biāo)2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)

52、衛(wèi)生統(tǒng)計(jì)教研室 分為兩類: 1、間距計(jì)算間距計(jì)算:極差:極差(R)、四分位數(shù)間距、四分位數(shù)間距 (Q) 2、平均差距計(jì)算平均差距計(jì)算: 平均偏差、離均差平方和平均偏差、離均差平方和 、均方差、均方差(2 、s2) 、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)差( 、s)和變異系數(shù)和變異系數(shù)(cv)等等)(ssl、2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室一、極差和四分位數(shù)間距一、極差和四分位數(shù)間距1、全距(、全距(range)極差)極差R=max-min優(yōu)點(diǎn)優(yōu)點(diǎn): 該法簡單明了、容易使用,如用于說明傳該法簡單明了、容易使用,如用于說明傳染病、食物中毒等的最短、最長潛伏期等染病、

53、食物中毒等的最短、最長潛伏期等缺點(diǎn)缺點(diǎn):只用到最大、最小值,樣本信息沒能充分利用。只用到最大、最小值,樣本信息沒能充分利用。當(dāng)資料呈明顯偏態(tài)時(shí),最大、最小值不穩(wěn)當(dāng)資料呈明顯偏態(tài)時(shí),最大、最小值不穩(wěn)樣本例數(shù)越多,樣本例數(shù)越多,R可能越大,兩組觀察值例數(shù)懸可能越大,兩組觀察值例數(shù)懸殊時(shí)不用殊時(shí)不用R比較。比較。(mmHg)44142186甲R(shí)(mmHg) 7159166乙R2、 四分位間距(四分位間距(inter-quartile range)Q 極差不穩(wěn)定,主要是受兩端的數(shù)據(jù)的影響,所以有極差不穩(wěn)定,主要是受兩端的數(shù)據(jù)的影響,所以有人建議將兩端數(shù)據(jù)截去一定比例,如各去掉人建議將兩端數(shù)據(jù)截去一定比

54、例,如各去掉25% Q=p75-p25=Qu-QL 例如例如:50歲歲60歲正常女性血清甘油三脂含量的百歲正常女性血清甘油三脂含量的百分位數(shù)分位數(shù)P75和和P25的位置分別為的位置分別為63.2 mg/dl和和135.7 mg/dl,則則 四分位間距比四分位間距比R穩(wěn)定,但仍未考慮每個(gè)觀察值穩(wěn)定,但仍未考慮每個(gè)觀察值,在統(tǒng)計(jì)在統(tǒng)計(jì)分析應(yīng)用得不普遍。分析應(yīng)用得不普遍。(mg/dl)5 .722 .637 .135Q2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室二 、離均差平方和、方差、標(biāo)準(zhǔn)差和變異系數(shù)2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)

55、計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室1 1、平均偏差、平均偏差( (M Mean ean D Differenceifference) ) 如對(duì)于例如對(duì)于例3.1:甲患者:甲患者: 乙患者:乙患者: 特點(diǎn)特點(diǎn):直觀直觀 , 易理解;但由于用了絕對(duì)值,不便于易理解;但由于用了絕對(duì)值,不便于數(shù)學(xué)處理,實(shí)際中很少使用。數(shù)學(xué)處理,實(shí)際中很少使用。 nXX平均偏差)15.52(mmHg56 .1621866 .1621456 .162162平均偏差2.32(mmHg)54 .1621664 .1621604 .162164平均偏差2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)

56、生統(tǒng)計(jì)教研室2、離均差平方和離均差平方和( sum of square,簡寫為簡寫為SS ) 公式為: 通過計(jì)算可轉(zhuǎn)化為下式:2)(SSxxnxxxx222)()(2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室總體方差總體方差 2=在在樣本樣本中,中,未知,常用下式替代,未知,常用下式替代, S2=Nx2)(3 3、方差、方差將離均差平方和再取平均,其結(jié)果稱作均方差,簡稱將離均差平方和再取平均,其結(jié)果稱作均方差,簡稱方差。方差。 注意:注意: 樣本方差的分母樣本方差的分母 n-1 稱為自由度,稱為自由度,意在所有的意在所有的n個(gè)離均差平方和中個(gè)離均差平

57、方和中,只只有有n-1個(gè)是獨(dú)立的,由于樣本均數(shù)個(gè)是獨(dú)立的,由于樣本均數(shù) 的限制,在所有離均差平方項(xiàng)中的限制,在所有離均差平方項(xiàng)中只要有只要有n-1個(gè)已知個(gè)已知,剩下的一項(xiàng)便自剩下的一項(xiàng)便自動(dòng)確定動(dòng)確定. n-12022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室4、 標(biāo)準(zhǔn)差(standard deviation)表示每一個(gè)數(shù)對(duì)均值的離散程度,是絕對(duì)變異指標(biāo)總體標(biāo)準(zhǔn)差總體標(biāo)準(zhǔn)差=未知,樣本標(biāo)準(zhǔn)差未知,樣本標(biāo)準(zhǔn)差 Nx )(21/)(1222)(nnxxnsxx2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室例如對(duì)于例例如

58、對(duì)于例3.13.1經(jīng)計(jì)算經(jīng)計(jì)算有有 甲患者:甲患者: 同理乙患者:同理乙患者:813X1337132X5n(mmHg)49.19155/8131337132S(mmHg)88. 2S2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 如果是頻數(shù)表資料,公式如下:如果是頻數(shù)表資料,公式如下: 1/)(22nnfxfxs例例140正常成年男子的紅細(xì)胞的標(biāo)準(zhǔn)差正常成年男子的紅細(xì)胞的標(biāo)準(zhǔn)差:(見見P18 例例3.2)38. 0104104180.66920.32242s2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 標(biāo)準(zhǔn)差

59、的優(yōu)點(diǎn):標(biāo)準(zhǔn)差的優(yōu)點(diǎn): 1、可以求合并標(biāo)準(zhǔn)差、可以求合并標(biāo)準(zhǔn)差 2、與均數(shù)結(jié)合能完整的概括一個(gè)正態(tài)分布、與均數(shù)結(jié)合能完整的概括一個(gè)正態(tài)分布l標(biāo)準(zhǔn)差的應(yīng)用標(biāo)準(zhǔn)差的應(yīng)用:描述變異程度、計(jì)算標(biāo)準(zhǔn)誤、:描述變異程度、計(jì)算標(biāo)準(zhǔn)誤、計(jì)算變異系數(shù)、描述正態(tài)分布、估計(jì)正常值范計(jì)算變異系數(shù)、描述正態(tài)分布、估計(jì)正常值范圍圍2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室5. 變異系數(shù)(coefficient of variation)C.V. 適用于各組觀察值適用于各組觀察值單位不同單位不同或單位雖同而或單位雖同而平均數(shù)相差很大平均數(shù)相差很大的情況。是相對(duì)變異指標(biāo)的情況。是

60、相對(duì)變異指標(biāo)例如例如1、同年齡同性別學(xué)生的、同年齡同性別學(xué)生的身高身高和和體重體重兩組觀察值。兩組觀察值。2、同年齡同性別學(xué)生的、同年齡同性別學(xué)生的身高身高和和胸圍胸圍兩組觀察值。兩組觀察值。3、不同年齡不同年齡兒童的兒童的身高身高的幾組觀察值。的幾組觀察值。%100 xscv2022-3-152022-3-15重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室重慶醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)教研室 例例3.3 測得某地成年人舒張壓的均數(shù)為測得某地成年人舒張壓的均數(shù)為77.5mmHg,標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為10.7mmHg;收縮壓的均數(shù)收縮壓的均數(shù)為為122.9mmHg,標(biāo)準(zhǔn)差為,標(biāo)準(zhǔn)差為17.1mmHg.試比較舒試比較舒張壓和收縮壓

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論