醫(yī)學(xué)統(tǒng)計(jì)學(xué)(CLW).doc_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)(CLW).doc_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)(CLW).doc_第3頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、優(yōu)質(zhì)參考文檔醫(yī)學(xué)統(tǒng)計(jì)學(xué)緒論醫(yī)學(xué)統(tǒng)計(jì)學(xué)(MedicalStatistics)根底:概率論和數(shù)理統(tǒng)計(jì)等數(shù)學(xué)的原理、方法研究對象:醫(yī)學(xué)資料研究任務(wù):搜集、整理、分析和推斷性質(zhì):一門應(yīng)用學(xué)科根本概念(1) 同質(zhì)與異質(zhì)同質(zhì)(homoge neitP):性質(zhì)相同異質(zhì)(heteroge neitP):性質(zhì)不同例如,調(diào)查某地20GG年12歲男童身高,那么它的觀察單位是每一個兒童,它的 同質(zhì)根底是同一地區(qū)、同一年份、同一年齡、同為男性。個體的同質(zhì)性是構(gòu)成研究總體的必備條件研究內(nèi)容(指標(biāo)/變量)不同,對同質(zhì)性的要求不同同質(zhì)和異質(zhì)是相對的概念(2) 變異同質(zhì)事物之間的差異稱為變異(variation)亦稱個體變異。

2、變異的兩個方面:?個體與個體間的差異?同一個體重復(fù)測量值間的差異個體變異(individualvariation)同質(zhì)個體間的差異。一種或多種不可控因素(的或未知的)作用下所產(chǎn)生的反映的綜合表 現(xiàn)。結(jié)果是隨機(jī)的(無法絕對正確地預(yù)測)。個體變異是普遍存在的。個體變異是有規(guī)律的。沒有個體變異,就沒有統(tǒng)計(jì)學(xué)!(3) 總體(populatio n)按研究目的所確定的同質(zhì)研究對象某項(xiàng)觀察指標(biāo)的全體,即全體觀察單位。-有限總體(finite)無限總體(infinite)個體(individual)組成總體的根本單位。樣本(ran domsample)從研究總體中隨機(jī)抽取具有代表性的局部觀察單 位。-代表性

3、,包含了總體的特性-樣本含量(samplesize)樣本中包含個體的數(shù)量(4) 參數(shù)和統(tǒng)計(jì)量總體參數(shù)(populationparameter)總體的特征值稱為參數(shù)。-未知的,固有的,不變的,需要研究的!樣本統(tǒng)計(jì)量(samplestatistic)由樣本所算出的統(tǒng)計(jì)指標(biāo)或特征值稱為統(tǒng) 計(jì)量。-的,變化的,有誤差的!在總體被確定之后,總體參數(shù)就是一個常數(shù),是不會變化的,不管你是否 確切知其大小;而統(tǒng)計(jì)量是幾乎總是隨著樣本而變的。參數(shù)一般用希臘字母表示,如:總體均數(shù)J總體標(biāo)準(zhǔn)差-總體率p總體相關(guān)系數(shù)r統(tǒng)計(jì)量一般用拉丁字母表示如:樣本均數(shù)樣本標(biāo)準(zhǔn)差s樣本率p樣本相關(guān)系數(shù)r(5) 隨機(jī)(random)時

4、機(jī)均等,無主觀影響-抽樣隨機(jī)(randomsampling)有相同的時機(jī)被抽到-分組隨機(jī)(randomallocation)有相同的時機(jī)被分到不同的組中-順序隨機(jī)(randomorder)有相同的時機(jī)先后接受處理(6) 頻率和概率1) 頻率(relativefrequencP):在n次隨機(jī)試驗(yàn)中,事件 A發(fā)生了 m次, 那么比值f _ m _ A發(fā)生的試驗(yàn)次數(shù)n試驗(yàn)總次數(shù)稱為事件A在這n次試驗(yàn)中出現(xiàn)的頻率。2) 概率:數(shù)理統(tǒng)計(jì)學(xué)中的大數(shù)定理說明:當(dāng)觀察次數(shù) n越來越大,頻率 f的隨機(jī)波動幅度越來越小,并最終趨向于一個常數(shù) p :隨機(jī)事件A發(fā)生 的概率(probabilitP)。概率描述了隨機(jī)事

5、件發(fā)生的可能性的大小。是一種參數(shù)。常用P來表示。0 P1(7) 小概率事件(rareevent)當(dāng)某事件發(fā)生的概率很小(可能性很小),統(tǒng)計(jì)學(xué)上 稱該事件為小概率事件。醫(yī)學(xué)上:小于或等于0.05小概率原理:小概率事件在一次試驗(yàn)中認(rèn)為是不會發(fā)生的。(8) 變量醫(yī)學(xué)研究中,根據(jù)研究目的的要求對一些觀察工程或研究指標(biāo)在一些研究 對象中進(jìn)行觀察或測量,由于這些指標(biāo)存在著變異,故把這些觀察工程 或研究指標(biāo)稱為隨機(jī)變量,簡稱變量variable。觀察結(jié)果對應(yīng)的取值稱為變量值或觀察值。變量的分類數(shù)值變量numericalVariable定量變量可認(rèn)為是連續(xù)的,往往有單位,取值間的差異是可度量的。分類變量 ca

6、tegoricalVariable取值是是分散、定性的,表現(xiàn)為互不相容的類別和屬性。無序分類定性變量:無順序,無間隔,僅有分類二項(xiàng)分類多項(xiàng)分類有序分類等級變量:僅有順序,無單位,取值間的差異是不可度量 的不同分類的互相轉(zhuǎn)化數(shù)值變量無序分類變量數(shù)值變量有序分類變量有序分類變量無序分類變量信息量只有減少,不可增加9 三個步驟研究設(shè)計(jì)運(yùn)用醫(yī)學(xué)統(tǒng)計(jì)學(xué)的起點(diǎn),也是高質(zhì)量地完成整個研究的重要根底。資料分析在研究設(shè)計(jì)根底上,通過實(shí)驗(yàn)試驗(yàn)或調(diào)查,將所得數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)處理的過程。 結(jié)論在數(shù)據(jù)分析的根底上,應(yīng)用統(tǒng)計(jì)學(xué)處理的結(jié)果,進(jìn)行統(tǒng)計(jì)學(xué)推斷;同時,依據(jù)相 應(yīng)的專業(yè)知識,作出專業(yè)性的結(jié)論。統(tǒng)計(jì)資料的整理與描述,數(shù)

7、值變量資料1個體變異individualvariation是同質(zhì)觀察對象間表現(xiàn)出的差異。變異是生物體在一種或多種、或未知的不可控因素作用下所產(chǎn)生的綜合 反映。就個體而言:變異是隨機(jī)的random。就總體而言:個體變異是有規(guī)律的。2頻數(shù)分布表和頻數(shù)分布圖原因:由于個體變異的存在,醫(yī)學(xué)研究中某指標(biāo)在各個體上的觀察結(jié)果不是 恒定不變的,但也不是雜亂無章的,而是有一定規(guī)律的,呈一定的分布 distributio n。解決:頻數(shù)分布表的根本思想:將原始數(shù)據(jù)按照一定的標(biāo)準(zhǔn)劃分為假設(shè)干各組, 合計(jì)各組的頻數(shù),得到頻數(shù)分布表;在將頻數(shù)表繪制成頻數(shù)分布圖。頻數(shù)表編制步驟求極差選定適當(dāng)?shù)慕M段數(shù)后估計(jì)組距列出組段劃

8、記歸組獲得頻數(shù)求頻率,完成頻數(shù)表例 2.1 P9頻數(shù)分布表的編制求極差或全距Range :R=GmaG-Gmin-R=6.18-3.29=2.89選定適當(dāng)?shù)慕M段數(shù)后估計(jì)組距i-組段數(shù)的選取以能反映資料的分布特征為宜-一般取815組-i=2.89/10=0.289 0.3列出組段-組段的含義:包括組段的下限而不含組段的上限。女口: 3.20等價于3.20 , 3.50-第一個組段應(yīng)包含最小值-最后一個組段應(yīng)包含最大值劃記歸組獲得頻數(shù)-常用的劃記方法:“正;“ |求頻率,完成頻數(shù)表-相應(yīng)的頻數(shù)除以總數(shù)即為頻率-各組段的頻率總和為1或者100%頻數(shù)分布類型對稱分布:以正態(tài)分布較為常見非對稱分布:偏態(tài)

9、分布-正偏態(tài):右側(cè) 左側(cè)向右側(cè)拖尾-負(fù)偏態(tài):左側(cè) 右側(cè)向左側(cè)拖尾頻數(shù)分布特征數(shù)據(jù)分布的范圍:3.296.18集中位置:中等大小人數(shù)居多,向中間集中數(shù)據(jù)最集中的區(qū)間:4.705.00離散趨勢:以中等大小的區(qū)間為中心,向兩側(cè)逐漸減少 分布形態(tài):根本對稱(3) 數(shù)值變量資料的統(tǒng)計(jì)指標(biāo)集中位置的描述離散趨勢的描述集中位置的描述-平均數(shù)(average)均數(shù)1) 均數(shù)(arithmeticmean,mean)總體均數(shù)= Xi_X2 屮)Xn-N樣本均數(shù)X =Xi_X2|) Xn優(yōu)質(zhì)參考文檔2)加權(quán)均數(shù)(weightedmea飛兒均數(shù)是加權(quán)均數(shù)的一個特例3 )幾何均數(shù)(geometricmean)G =

10、n XXXn1w =nX=Xi 訐 X2Xn-lnX1 +ln X2+lnXnX ln X :n幾何均數(shù)例XpXmX1:10,1:20,1:40,1:80,1:160(例 2.3)中位數(shù)(median)將一組數(shù)據(jù)按從小到大的順序排列,位置居中的數(shù)即是 中位數(shù)。仙:X(n4i)/2當(dāng)n為奇數(shù)Xn/2+Xn/2十)/2當(dāng)n為偶數(shù)百分位數(shù)(percentile)排序數(shù)據(jù):按從小到大順序排列D =(x(nX %) + X(nx%十)當(dāng)nX%為整數(shù)px _ i 2X(nX%1)當(dāng)nX%為非整數(shù)平均數(shù)應(yīng)用的考前須知同質(zhì)的資料計(jì)算平均數(shù)才有意義根據(jù)資料分布的特征選用適當(dāng)?shù)钠骄鶖?shù)-均數(shù):單峰對稱分布的資料-幾

11、何均數(shù):各變量值之間成倍數(shù)關(guān)系,分布呈偏態(tài),經(jīng)對數(shù)變換后 呈單峰對稱分布資料-中位數(shù):理論上可用于任何分布資料,但當(dāng)資料適合計(jì)算均數(shù)或幾 何均數(shù)時,不宜用中位數(shù)。(偏態(tài)分布、不規(guī)那么分布資料、有不確 定值的資料)計(jì)算幾何均數(shù)時:-變量值中不能有0-同一組變量值不能同時存在正、負(fù)值-假設(shè)變量值全為負(fù)值,可先將負(fù)號除去,算出結(jié)果后再冠以負(fù)號-樣本含量較少時不宜計(jì)算靠近兩端的百分位數(shù)平均數(shù)要與變異指標(biāo)結(jié)合使用離散趨勢的描述1. 全距(Ra nge)亦稱極差,記為R,是一組變量值中最大值與最小值之差。優(yōu)點(diǎn):簡單明了缺點(diǎn):不靈敏、不穩(wěn)定2. 四分位數(shù)間距(interquartilerange)定義為:Q

12、lQu,即中間一半觀察值的極差。四分位數(shù)(quartile)是兩個特定的百分位數(shù):第 25%分位數(shù)P25,和第75% 分位數(shù)P75,分別記為Ql和Quo四分位數(shù)間距較全距穩(wěn)定,常與中位數(shù)一起,描述不對稱分布資料的特征排序數(shù)據(jù):按從小到大順序排列3. 方差(Varianee)和標(biāo)準(zhǔn)差(StandadDeviat2on)NX -BMM,用樣本均數(shù)估計(jì)x_x:標(biāo)準(zhǔn)差“離均差平方之和平均后的方根1“均方根n-1稱為標(biāo)準(zhǔn)差的自由度,即“可以自由變異的程度送X _ Xo分子有n項(xiàng)離均差,但只有n-1項(xiàng)獨(dú)立,根據(jù)任一離均差均可以用另外 n-1個離均差表示,所以“只有n-1個獨(dú)立的離均差?標(biāo)準(zhǔn)差大:分布分散、

13、不整齊、波動大;?標(biāo)準(zhǔn)差小:分布集中、整齊、波動較小。4. 變 異系數(shù)coeficie ntofvariatio n亦稱離 散系數(shù)eoeffieientofdispersion,是標(biāo)準(zhǔn)差 s與均數(shù)之比,即:C= 100 %X變異系數(shù)的兩個特點(diǎn)及相應(yīng)的用途?沒有單位-反映標(biāo)準(zhǔn)差占均數(shù)的百分比或標(biāo)準(zhǔn)差是均數(shù)的幾倍-可用來比擬度量衡單位不同的資料的變異度?不受平均水平的影響-反映的是以均數(shù)為基數(shù)的相對變異的大小-比擬均數(shù)相差懸殊的資料的變異度例 2.75. 平均數(shù)與變異度的關(guān)系?平均數(shù)表示的集中性與變異度表示的離散性,是從兩個不同的角度說明計(jì)量資料的特征-變異度越小,平均數(shù)對各變量值的代表性越好-變異度越大,平均數(shù)對各變量值的代表性越差?通常,平均數(shù)與變異指標(biāo)一起描述資料的分布特征。-用均數(shù)和標(biāo)準(zhǔn)差描述正態(tài)分布資料的特征;-用中位數(shù)和四分位數(shù)間距描述偏態(tài)分布資料的特征。資料的指標(biāo)描述統(tǒng)計(jì)描述的一個重要的組成局部數(shù)值變量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論