統(tǒng)計學緒論(初)課件_第1頁
統(tǒng)計學緒論(初)課件_第2頁
統(tǒng)計學緒論(初)課件_第3頁
統(tǒng)計學緒論(初)課件_第4頁
統(tǒng)計學緒論(初)課件_第5頁
已閱讀5頁,還剩47頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、醫(yī)學統(tǒng)計學Medical Statistics2022/10/1第一章 緒論Introduction2022/10/1主要內容第一節(jié) 醫(yī)學統(tǒng)計學的地位和作用第二節(jié) 統(tǒng)計學中幾個基本概念第三節(jié) 計量資料的統(tǒng)計描述第四節(jié) 醫(yī)學統(tǒng)計工作的基本步驟第一節(jié) 醫(yī)學統(tǒng)計學的地位和作用當研發(fā)了一種治療高血壓病的新藥,應該怎樣評價該新藥的療效?患者 一組服用對照藥一組服用新藥觀察療效 然后分析該新藥的有效性和安全性 統(tǒng)計學扮演什么角色? 在這個“臨床試驗”中有諸多問題需要回答:需要多少名患者參加試驗?如何將患者分為兩個組? 哪些措施可以保證兩組患者除了接受不同藥物治療外,其他影響療效的因素在兩組的分布是一致的?

2、如果分布不一致,如何在諸多的影響因素中,分離出藥物因素的效應? 據調查,柳葉刀(The Lancet)、新英格蘭醫(yī)學雜志(New England J. Medical)、美國醫(yī)學雜志(JAMA) 、英國醫(yī)學雜志(BritishJ.Medical)等著名醫(yī)學雜志發(fā)表的文章中,有70%應用了統(tǒng)計學,而且雜志有統(tǒng)計學的常務編審。統(tǒng)計學能使數據變成信息“統(tǒng)計學是現代醫(yī)學大廈的一個重要支柱”。 -美國醫(yī)學會雜志(JAMA)主編數據 信息datainformation對統(tǒng)計學的一知半解常常造成不很必要的上當受騙對統(tǒng)計學的一概排斥往往造成不必要的愚昧無知-統(tǒng)計與真理 統(tǒng)計學是處理復雜問題的工具Francis

3、 Galton(1822.2.161911.1.17) “當人類科學探索者在問題的叢林中遇到難以逾越的障礙時,唯有統(tǒng)計工具可為其開辟一條前進的通道”。 -英國著名遺傳學家Galton 變異(variation):由于個體結構和功能千差萬別,機體反應受到各種自然和社會環(huán)境因素的影響和制約,對內外環(huán)境刺激的反應同樣千差萬別。個體差異是自然界普遍存在的現象。統(tǒng)計學將這種差異稱為變異。 變異同樣條件下對同一個體進行重復觀測結果具有不確定性醫(yī)學中充滿了個體變異和不確定性。醫(yī)學統(tǒng)計學:運用數理統(tǒng)計學的基本原理和方法來研究醫(yī)學問題的一門學科,它包括了研究設計、數據收集、整理、分析以及分析結果的解釋和表達。第

4、二節(jié) 統(tǒng)計學中幾個基本概念(1)總體與樣本(Population and sample)總體(population):所有同質觀察單位某種觀察值(即變量值)的全體。 樣本(sample):總體中抽取部分觀察單位的觀測值的集合。 注意觀察單位間的同質性是構成總體的必備條件,也是進行研究的基本前提。個體樣本總體總體樣本populationsampleindividual隨機抽樣樣本中的個體總數稱為樣本量(sample size)。在抽樣研究中,隨機抽出一部分個體(每個個體都有同等的機會被抽?。┻M行觀察或測量的過程稱為隨機抽樣(random sampling)??傮w隨機隨便(2)資料的類型(Type

5、 of data)根據是否定量化分為三種:(1)定量資料(quantitative data) 由定量變量組成的資料,如體重、身高。(2) 定性資料(qualitative data) 由分類變量組成的資料,如血型、職業(yè)。(3) 等級資料(ranked data) 由等級變量組成的資料,如療效、心功能分級。1.計量資料(或定量變量) measurment data ,quantitative data,定義:測定每個觀察單位的某項指標量的大小,所得的資料稱為計量資料。其變量值是定量的,一般帶有度量衡或其它單位。 特點:每個觀察單位的觀察值之間有量的區(qū)別。 某市110名健康男性工人的血紅蛋白量(

6、g/L)11814815816313815613414015213214916516011917413715215414012213814813916816012015112114613515614913514813813315013215314014813514615813715314215511414713312713215513413813913114213514513414312814713714211913913114514115015212514714413116213814612114313014115012814215010712314314014014713014112615

7、1149140139140125147129149142154151 定義:將觀察單位按某種屬性或類別分組計數,分組匯總得到各組觀察單位數稱為計數資料。特點:計數排列是無序分組,同組各觀察單位之間沒有量的差別,但各組間有質的不同,各組互不相容。 二項分類和多項分類2.計數資料(或無序分類變量) enumeration data, unordered category data戰(zhàn)期死亡人數存活人數合計第一戰(zhàn)期281442第二戰(zhàn)期71623第三戰(zhàn)期121022合計474087各戰(zhàn)期戰(zhàn)士破傷風病死率比較 3.等級資料(或有序分類變量) ranked data, ordinal category da

8、ta 定義:將觀察單位按某個指標量的大小分成等級或某種屬性的不同程度分成等級后分組計數,分類匯總各組的觀察單位數稱為等級資料。 特點:等級是有序分組。同計數資料的區(qū)別是:屬性的分組有程度的差別,各組按一定順序排列;與計量資料的區(qū)別是:每個觀察單位未確切定量,所以又稱為半定量資料。資料的轉化 根據分析的需要,計量資料、計數資料、等級資料可以進行轉化。 血紅蛋白(g/dl) 貧血程度 血紅蛋白 6 重度貧血 異常 6 中度貧血 異常 9 輕度貧血 異常 1216 血紅蛋白正常 正常 16 血紅蛋白增高 異常 計量資料等級資料計數資料 但必須明確,凡能計量的,應盡可能采用計量資料;因為計量資料可以得

9、到較多的信息。計量計量計量計數計數計數等級等級某市110名健康男性工人的血紅蛋白量(g/L)11814815816313815613414015213214916516011917413715215414012213814813916816012015112114613515614913514813813315013215314014813514615813715314215511414713312713215513413813913114213514513414312814713714211913913114514115015212514714413116213814612114313014

10、1150128142150107123143140140147130141126151149140139140125147129149142154151圖2-1 110例健康男性工人血紅蛋白量分布圖2-2 某地192名健康人血鉛值分布平均數指標平均數(average) 是描述一群同質變量值集中位置的特征值,用以說明同類現象或事物數量的中等水平(集中趨勢)。常用指標:算術均數、中位數、眾數等。 1. 定義:簡稱均數,符號為 (相應的總體均數記為)。定義公式為(一)算術均數(mean)算術均數適合于對稱分布的資料,如分布均勻的小樣本數據或近似正態(tài)分布的大樣本數據;算術均數容易受極端值的影響。 2.

11、均數的應用與特點眾數是指在一群觀察值中,出現頻率最高(即次數最多)的數據,用符號 Mo 表示。(二)眾數(mode) 眾數主要應用在對小樣本的探索性數據進行分析將一組變量值按大小順序排列,位次居中的變量值即為中位數。中位數將變量值一分為二,一半比它小,一半比它大。符號為M、Md。1. 中位數的計算(三)中位數(median) 2. 中位數的應用與特點中位數將頻數等分為二,所以中位數適合各種類型的資料,尤其適合于大樣本偏態(tài)分布的資料。由于中位數總處在居中的位置上,因而它不受特大或特小值的影響。 正 態(tài) 分 布 時:均數中位數眾數正偏態(tài)分布時:均數 中位數 眾數負偏態(tài)分布時:均數 中位數 眾數百分

12、位數是一種位置指標, 它將一組變量值排列后劃分為若干相等部分的分割點數值。符號為Px,常用的有四分位數。 分割點1 分割點2 分割點3四分位值1(Q1)四分位值2(Q2)四分位值3(Q3)(四)百分位數(percentile)例如:含量為n的樣本,取第5百分位數P5,理論上有n5%的觀察值比P5小,有n (100-5)%個觀察值比P5大,由此可知百分位數是一個界值。2. 百分位數的應用與特點 百分位數不論資料分布類型均可計算,在實際工作中常用于確定醫(yī)學參考值范圍;在假設檢驗中用作拒絕或不拒絕檢驗假設的界值。 百分位數并非由全部觀察值綜合計算得來,因此,它不如均數和標準差精確;然而中間部分的百分

13、位數因不受資料中個別極端數據的影響,具有較好的穩(wěn)定性。 同質事物或現象才能求平均數;要根據數據分布類型正確選用平均數; 在計算和應用平均數指標時的注意事項 變異指標又稱離散指標,用以描述一組計量資料各觀察值之間參差不齊的程度。變異指標越大,觀察值之間差異愈大,說明平均數的代表性就越差;反之亦然。 變異指標 三組同性別、同年齡兒童體重甲組2628303234 乙組2427303336丙組2629303124丙組乙組甲組三組均數均為30一.極差極差(Range)是一批數據中最大值與最小值之差,反映了數據散布范圍。二.四分位數間距 四分位數間距(Q)包括了全部變量值中居于中間水平的一半數據的分布范圍

14、。 Q = P75 P25 缺點:比較穩(wěn)定,但不能反映其余數據的變異情況,沒有充分利用每個變量值的信息。 四分位數間距僅用來描述大樣本偏態(tài)資料的變異情況。 Q三.方差與標準差方差(Variance)分為樣本方差和總體方差。樣本方差符號為 ,相應的總體方差符號為 。(一)方差的定義(二)標準差的定義標準差即為方差的平方根,樣本標準差符號為s,相應的總體標準差符號為。 丙組乙組甲組 三組同性別、同年齡兒童體重甲組2628303234 乙組2427303336丙組2629303124 方差或標準差屬同類變異指標,它們多用來描述均勻分布或近似正態(tài)分布的資料,大、小樣本均可,其中以標準差的應用最廣,通常與均數結合使用。比如在許多醫(yī)學研究報告中常用 的形式表達資料。(三)方差與標準差的應用四. 平均數指標與變異指標的聯系 與區(qū)別以及使用范圍 均數與標準差:適用是均勻分布的小樣本數據或近似正態(tài)分布數據,對樣本含量沒有要求。中位數與四分位數間距:適用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論