(完整版)醫(yī)學(xué)統(tǒng)計學(xué)復(fù)習(xí)要點_第1頁
(完整版)醫(yī)學(xué)統(tǒng)計學(xué)復(fù)習(xí)要點_第2頁
(完整版)醫(yī)學(xué)統(tǒng)計學(xué)復(fù)習(xí)要點_第3頁
(完整版)醫(yī)學(xué)統(tǒng)計學(xué)復(fù)習(xí)要點_第4頁
(完整版)醫(yī)學(xué)統(tǒng)計學(xué)復(fù)習(xí)要點_第5頁
已閱讀5頁,還剩46頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一章緒論1、數(shù)據(jù)/資料的分類:①、計量資料,又稱定量資料或者數(shù)值變量;為觀測每個觀察單位某項治療的大小而獲得的資料。②、計數(shù)資料,又稱定性資料或者無序分類變量;為將觀察單位按照某種屬性或者類別分組計數(shù),分組匯總各組觀察單位數(shù)后而得到的資料。③、等級資料,又稱半定量資料或者有序分類變量。為將觀察單位按某種屬性的不同程度分成等級后分組計數(shù), 分類匯總各組觀察單位數(shù)后而得到的資料。2、統(tǒng)計學(xué)常用基本概念:①、統(tǒng)計學(xué)(statistics)是關(guān)于數(shù)據(jù)的科學(xué)與藝術(shù),包括設(shè)計、搜集、整理、分析和表達等步驟,從數(shù)據(jù)中提煉新的有科學(xué)價值的信息。②、總體(population)指的是根據(jù)研究目的而確定的同質(zhì)觀察單位的全體。③、醫(yī)學(xué)統(tǒng)計學(xué)(medicalstatistics):用統(tǒng)計學(xué)的原理和方法處理醫(yī)學(xué)資料中的同質(zhì)性和變異性的科學(xué)和藝術(shù), 通過一定數(shù)量的觀察、對比、分析,揭示那些困惑費解的醫(yī)學(xué)問題背后的規(guī)律性。④、樣本(sample):指的是從總體中隨機抽取的部分觀察單位。⑤、變量(variable):對觀察單位某項特征進行測量或者觀察,這種特征稱為變量。⑥、頻率(frequency):指的是樣本的實際發(fā)生率。⑦、概率(probability):指的是隨機事件發(fā)生的可能性大小。用大寫的P表示。3、統(tǒng)計工作的基本步驟:①、統(tǒng)計設(shè)計:包括對資料的收集、整理和分析全過程的設(shè)想與安排;②、收集資料:采取措施取得準確可靠的原始數(shù)據(jù);③、整理資料:將原始數(shù)據(jù)凈化、系統(tǒng)化和條理化;④、分析資料:包括統(tǒng)計描述和統(tǒng)計推斷兩個方面。第二章計量資料的統(tǒng)計描述1.頻數(shù)表的編制方法,頻數(shù)分布的類型及頻數(shù)表的用途①、求極差(range):也稱全距,即最大值和最小值之差,記作R;②、確定組段數(shù)和組距,組段數(shù)通常取10-15組;③、根據(jù)組距寫出組段,每個組段的下限為 L,上限為U,變量X值得歸組統(tǒng)一定為LWX<U,最后一組包括下限。④、分組劃記并統(tǒng)計頻數(shù)。頻數(shù)分布的類型包括對稱分布和偏態(tài)分布;偏態(tài)分布主要分為右偏態(tài)分布(也稱正偏態(tài)分布)和左偏態(tài)分布(也稱負偏態(tài)分布)。頻數(shù)表的用途包括以下幾個方面:①、描述頻數(shù)分布的類型;②、描述頻數(shù)分布的特征;③、便于發(fā)現(xiàn)一些特大或特小的離群值;④、便于進一步做統(tǒng)計分析和處理。2,集中趨勢指標(biāo)的適用條件、計算方法和意義。統(tǒng)計學(xué)用平均數(shù)(average)這一指標(biāo)體系來描述一組變量值的幾種位置或者平均水平。常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。①、算數(shù)均數(shù),簡稱均數(shù)(meat),可用于反映一組呈對稱分布的變量值在數(shù)量上的平均水平。計算方法包括直接計算法和頻數(shù)表法(公式見2-2)。②、幾何均數(shù)(geometricmean),可用于反映一組經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的變量值在數(shù)量上的平均水平,在醫(yī)學(xué)研究中常用于免疫學(xué)的指標(biāo)。(計算公式見于2-3)③、中位數(shù)(median),適用于各種分布類型的資料,尤其是偏態(tài)分布資料和一端或者兩端無確切數(shù)值的資料。④、百分位數(shù)(percentile)是一種位置指標(biāo),是一個界值,其重要用途是確定醫(yī)學(xué)參考值范圍(referencerange)。直接計算法(公式見于2-7、2-8)

頻數(shù)表法(2-9、2-10)3、離散趨勢指標(biāo)的適用條件、計算方法和意義 。描述數(shù)據(jù)變異大小的常用統(tǒng)計指標(biāo)有極差、四分位數(shù)間距、五差、標(biāo)準差和變異系數(shù)。①、極差,一組變量值的最大值與最小值之差。②、四分位數(shù)間距(quartilerange,QR是把全部變量值分為四部分的分位數(shù)后,由第3四分位數(shù)和第1四分位數(shù)相減而得。它一般和中位數(shù)一起描述偏態(tài)分布資料的分布特征。QR=P-P25。③、方差(variance)也稱均方差(meansquaredeviation)離均差平方和與樣本含量的比值。計算公式為 2-11④、標(biāo)準差(standarddeviation)是方差的正平方根,其單位與原變量值得單位相同。計算公式為2-13、2-14⑤、變異系數(shù)(coefficientofvariation )記作CY多用于觀察指標(biāo)單位不同時,或者均數(shù)相差較大時兩者變異程度的比較。計算公式為2-16.正態(tài)分布的圖形,正態(tài)分布的特征,正態(tài)曲線下面積的分布規(guī)律。正態(tài)分布的特征:①、在直角坐標(biāo)的橫軸上方呈鐘形曲線,兩端與X軸永不相交,且以X二區(qū)為對稱軸,左右完全對稱。②、在X=w處,f(X)取最大值,遠離其值越小。③、正態(tài)分布有兩個參數(shù),位置參數(shù)W和形態(tài)參數(shù)*W決定正態(tài)分布的曲線在坐標(biāo)軸上的左右移動,越大越右移;(T決定曲線的弓背程度,越小峰值越高。④正態(tài)分布曲線下的面積分布有一定的規(guī)律。 X軸與正態(tài)曲線所夾面積恒等于1或者100%區(qū)間±(T的面積為為區(qū)間±(T的面積為%區(qū)間±(T的面積為%.醫(yī)學(xué)參考值范圍的意義和估計方法。醫(yī)學(xué)參考值(referencevalue)是指包括絕大多數(shù)正常人的人體形態(tài)、機能和代謝產(chǎn)物等各種生理及生化指標(biāo)常數(shù),也稱正常值。由于存在個體差異,生物醫(yī)學(xué)數(shù)據(jù)并非常數(shù),而是在一定范圍內(nèi)波動,故采用醫(yī)學(xué)參考值范圍(medicalreferencerange)作為判定正常和異常的參考標(biāo)準。通常使用的醫(yī)學(xué)參考值范圍單側(cè):有90%95%99%單側(cè):①、正態(tài)分布法:數(shù)據(jù)服從或者近似服從正態(tài)分布,或者通過適當(dāng)?shù)淖儞Q轉(zhuǎn)換為正態(tài)分布,采用此方法之前一般要對資料進第三章總體均數(shù)的估計與假設(shè)檢驗行正態(tài)性檢驗且要求樣本含量足夠大(如nA100)1、基本概念:計算公式為2-23、2-24:雙側(cè):①抽樣誤差(samplingerror):指的是由于個體變異產(chǎn)生、雙側(cè):隨機抽樣造成的樣本統(tǒng)計量與總體參數(shù)的差異。②標(biāo)準誤(standarderror,SE):指的是樣本統(tǒng)計量的標(biāo)準單側(cè):差。②、百分位數(shù)法:適用于偏態(tài)分布資料醫(yī)學(xué)參考值范圍的制定,所要求的樣本含量比正態(tài)分布要多(不低于 100)。計算公式為2-25、2-26:③均數(shù)的標(biāo)準誤(standarderrorofmean,SEM:指的是樣本均數(shù)的標(biāo)準差。※$£板映樣本均數(shù)之間的離散程度,也反映樣本均數(shù)與相應(yīng)總體均數(shù)間的差異。雙側(cè):均數(shù)的標(biāo)準誤的計算公式為3-1、3-2t分布:隨機變量X服從總體均數(shù)為s總體標(biāo)準差為b的正④統(tǒng)計推斷(statisticalinference):通過抽樣研究的方法從總體中隨機抽取一個樣本,用樣本的信息來推斷總體的特征的統(tǒng)計學(xué)方法,包括參數(shù)估計和假設(shè)檢驗。2、標(biāo)準差的用途:①、反映資料的離散趨勢。標(biāo)準差越小,說明變異程度越小,均數(shù)的代表性越好;②用于計算變異系數(shù);③用于計算標(biāo)準誤;④結(jié)合均數(shù)和正態(tài)分布規(guī)律估計參考值范圍。3、u分布與t分布:u分布(也稱Z分布):指的是總體均數(shù)為0,總體標(biāo)準差為1的標(biāo)準正態(tài)分布N(0,12)。態(tài)分布N(H,02),則可以通過u變換將一般的正態(tài)分布轉(zhuǎn)化為標(biāo)準正態(tài)分布。※但是通常獲得的資料為樣本的均數(shù)標(biāo)準誤,因此經(jīng)過轉(zhuǎn)換后并不是完全意義上的標(biāo)準正態(tài)分布,而是服從t分布。(計算公式為3-3)t分布主要用于總體均數(shù)的區(qū)間估計和t檢驗。4、可信區(qū)間:從固定樣本含量的已知總體總進行重復(fù)隨機抽樣試驗,根據(jù)每個樣本可算得一個可信區(qū)間,則平均有1-%(如95%的可信區(qū)間包含了總體參數(shù)、而不是總體參數(shù)落在該范圍的可能性為1-%。5、參考值范圍和總體均數(shù)可信區(qū)間的區(qū)別見課本表3-26、標(biāo)準差與標(biāo)準誤的區(qū)別和聯(lián)系:b、0已知或者未知,但n足夠大(如>60)時:按u分布均數(shù)的標(biāo)準誤標(biāo)準差意反映X-的抽樣誤 反映一組數(shù)據(jù)的離散情義 差大小 況X(SX)(S)2(X)NSX S..n(XX)21控制

方法增力口n不能通過統(tǒng)計方法來控

制7、總體均數(shù)可信區(qū)間的計算:雙側(cè)和單側(cè)公式見3、8、3-9、3-10R兩總體均數(shù)之差的可信區(qū)間:※前提:兩總體方差相等,但均數(shù)不等計算公式見于3-12、3-13、3-14※根據(jù)總體標(biāo)準差"是否已知以及樣本含量n的大小而異,通常有t分布和u分布兩類方法。A、A、單一總體均數(shù)的可信區(qū)間:a、總體標(biāo)準差(T已未知:按t分布雙側(cè)和單側(cè)公式見3-5、3-6、3-78、t分布圖的特征:①、單峰分布,以0為中心,左右對稱;②、t分布的曲線形態(tài)取決于自由度v的大小,自由度越小,則t值越分散,曲線的峰部越矮而尾部翹得越高;③、當(dāng)自由度逼近無窮的時候,樣本標(biāo)準誤接近總體標(biāo)準誤,t分布逼近標(biāo)準正態(tài)分布。(標(biāo)準正態(tài)分布是t分布的特例)9、t檢驗的適用條件t檢驗(ttest/Studentt-test)當(dāng)6未知且樣本含量較小時(如n<60),理論上要求t檢驗的樣本隨機地取自正態(tài)分布的總體,兩小樣本均數(shù)比較式還要求兩樣本所對應(yīng)的兩總體方差相等,即方差齊性。在實際應(yīng)用中,如與上述條件略有偏離,對結(jié)果影響也不大。10、假設(shè)檢驗A、假設(shè)檢驗的基本思想:利用小概率反證法的思想,從問題的對立面(H)出發(fā)簡介判斷要解決的問題(H)是否成立。即在假設(shè)H成立的條件下計算檢驗統(tǒng)計量,然后根據(jù)獲得的 P值來判斷。R假設(shè)檢驗的基本步驟:①建立檢驗假設(shè),確定檢驗水準;②計算檢驗統(tǒng)計量;③確定P值,做出推斷結(jié)論。C假設(shè)檢驗的錯誤I型錯誤:拒絕了實際上成立的H0,這類“棄真”的錯誤;(%)II型錯誤:“接受”了實際上不成立的HQ這類“取偽”的錯誤。(B)注意:①口越小,B越大;反之口越大,B越??;②若重點是減少I型錯誤,一般取%=;若重點是減少II型錯誤,一般取B二或者甚至更高;③若要同時減小I型和II型錯誤,唯一的方法就是增加樣本含量n;④拒絕HQ只可能犯I型錯誤;接受H0,只可能犯H型錯誤資料或計資(量料已兩樣本(樣本含量單樣本t檢驗配對樣本t檢驗數(shù)知均較據(jù)數(shù)和/小,兩樣本t或標(biāo)<檢驗/成組準差)60)t檢驗適用于已知樣本均數(shù)和已知總體均數(shù)的比較t分布(v=n-1)對方差齊與否無要求止態(tài)分布t值適用于配對設(shè)計的的資料t分布(v=n-1)對方差齊與否無要求止態(tài)分布t值、A 、、-適用于任意兩計量資料的比較t分布(v=n1+n2-2)、* 、乙、、t值力麥:六止態(tài)分布方差不Cochran&Cox近似t分布方差不齊t'值(校正t齊t檢驗止態(tài)分布值)Satterthwaite近似t檢驗t分布方差不齊止態(tài)分布t'值(校正自由度)※兩樣本的方差比較時,可以使用F檢驗,分子為較大的樣本方差(自由度為n1-1);分母為較小的樣本方差(自由度為n2-1)。F值滿足F分布,統(tǒng)計值為F值。多樣本完全隨機設(shè)計資料的方差分析完全隨機化分組方法將試驗對象分配到g個處理組中去,試驗后比較各組均數(shù)之間的差別F分布方差齊止態(tài)分布F值與成組t檢驗意義相同隨機區(qū)組設(shè)計資料隨機分配的次數(shù)要重復(fù)多次,且各個處理組實驗對象F分布方差齊F值與配對t檢驗意

的方差分析數(shù)量相同,區(qū)組內(nèi)均衡止態(tài)分布義相同拉丁方設(shè)計資料的方差分析可多安排一個已知的對實驗結(jié)果有影響的非處理因素,增加了均衡性,減少了誤差,提高了效率F分布方差齊止態(tài)分布F值兩階段交叉設(shè)計資料的方差分析兩種處理在全部實驗過程中交叉進行F分布方差齊止態(tài)分布F值兩個階段之間一定要經(jīng)過一段洗脫階段以消除殘留效應(yīng)※多樣本的多重比較LSD-t檢驗/最小顯著差異t檢驗,適用于一對或者幾對在專業(yè)上有特殊意義的樣本均數(shù)間的比較,統(tǒng)計量為t值

Dunnett-tSNK-q※多樣本的方差比較檢驗適用于g-1個實驗組與一個對照組均數(shù)差別的多重比較,統(tǒng)計量為Dunnett-t值Dunnett-tSNK-q※多樣本的方差比較檢驗適用于多個樣本均數(shù)兩兩之間的全面比較,統(tǒng)計量為q值Bartlett檢驗,要求資料具有正態(tài)性,統(tǒng)計量為卡方;其分類資料四格表資料通過兩個樣本的樣本率來反映總體率有無差異卡方分布無方差齊性要求無正態(tài)分布要求卡方值※與兩樣本的u檢驗等價:u2=卡方值配對四格表資料強調(diào)配對:即針對同一樣本采取不同的試驗或者處理方法??ǚ椒植紵o方差齊性要求無正於分布卡方值Levene檢驗,比Bartlett檢驗要求低,不需要資料具有正態(tài)性,統(tǒng)計量為 F值。

他類型資料要求行X列表資料用于多個樣本率的比較、兩個或多個構(gòu)成比的比較以及雙向無序分類資料的關(guān)聯(lián)性檢驗卡方分布無方差齊性要求無正態(tài)分布要求卡方值※可用來分析兩個分類變量之間有無關(guān)系或者關(guān)聯(lián)多樣本率的多重比較適用于多樣本率兩兩之間的多重比較(基本思想:對卡方值進行校正)卡方分布無方差齊性要求無正態(tài)分布要求卡方值H0:H1頻數(shù)分布的擬合優(yōu)度推斷頻數(shù)分布的擬合優(yōu)度適用于止態(tài)分布、二項分布、poisson分布和負二項卡方分布無方差齊性要求無TF態(tài)分布卡方值推斷某現(xiàn)象的頻數(shù)分布是否符合某T!論分布

分布要求不滿足上述統(tǒng)計方法的資料、等級資料秩檢驗配對樣本的檢驗適用于配對樣本差值的中位數(shù)和0比較;還口」用于單個樣本中位數(shù)和總體中位數(shù)比較無方差齊性要求無正態(tài)分布要求秩和(正秩和或負秩和)T值樣本量n>50時可用止態(tài)分布近似法兩獨立樣本比較適用于推斷的資料或等級資料的兩個獨立樣本所來自的兩個總體分布是否有差別方差不齊止態(tài)分布秩和(正秩和或負秩和)T值n1>10或n2-n1>10可用正態(tài)分布近似法作u檢驗完全隨機多樣本比較用于推斷的資料或者等級資料的多個獨立樣本所來自的多個總體分布是否有差別無方差齊性要求無TF態(tài)分布H檢驗H值g=3且最小樣本的例數(shù)大于5或g>3,H近似服從g-1的止態(tài)分布,

要求可用卡方分布法多變量資料的處理一一回歸與相關(guān)雙變量直線回歸用于對兩變量總體間線性關(guān)系的估計線性、獨立、方差齊性、誤差服從均數(shù)為0的正態(tài)分布回歸方程(回歸系數(shù))雙變量直線相關(guān)用于判斷兩個數(shù)值變量之間有無線性關(guān)系,雙變量正態(tài)分布資料止態(tài)分布相關(guān)系數(shù)r相關(guān)系數(shù)求出后應(yīng)做假設(shè)檢驗多元線性回歸用于分析一個應(yīng)受量與多個自變量之間的線性關(guān)系止態(tài)分布多元回歸方程回歸方程求出后應(yīng)做整體假設(shè)檢驗以及各自變量的假設(shè)檢驗第四章多樣本均數(shù)比較的方差分析4、方差分析的變異分析:1、概念:①離均差平方和(sumofsquaresofdeviationfrommean,SS)指的是各個觀測值與總均數(shù)差值的平方。②均方差,簡稱均方(meansquare,MS指的是離均差平方和與自由度之間的比值。2、方差分析的基本思想:設(shè)處理因素有g(shù)(g>2)個不同的水平,實驗對象隨機分為g組,分別接受不同水平的干預(yù)。方差分析的目的就是在H0:w1=w2=……=pg成立的條件下,通過分析各處理均數(shù)之間的差別大小,推斷g各總體均數(shù)間有無差別。3、方差分析的應(yīng)用條件為:各個樣本是相互獨立的隨機樣本,均來自于正態(tài)分布總體;相互比較的各個樣本的總體方差相等,即具有方差齊性。總變異的大小一一SS總:各個觀測值與總均數(shù)差值的平方和;組間變異的大小一一SS組間:各組均數(shù)與總均數(shù)的離均差平方和;組內(nèi)變異的大小一一SS組內(nèi):組內(nèi)個觀測值與其所在組的均數(shù)的差值的平方和。并有SS^=SSia間+SS組內(nèi)由于組間與組內(nèi)的離均差平方和的自由度不同, 因此單純的比較并無實際意義。MS且間=SS組間/v組間;MS且內(nèi)=$$組內(nèi)/v組內(nèi)5、完全隨機設(shè)計資料的方差分析:變異來源自由度MSF

總變異N-1組間g-1MS且間MS且間/MS組內(nèi)組內(nèi)N-gMS且內(nèi)完全隨機設(shè)計資料:正態(tài)分布且方差齊:單因素方差分析成組t檢驗(意義相同t2=F)非正態(tài)分布或/和方差不齊:變量轉(zhuǎn)換一單因素方差分析秩和檢驗6、隨機區(qū)組設(shè)計資料的方差分析:變異來源自由度MSF總變異N-1處理間g-1MSb理MSl理/MS誤差區(qū)組間n-1MSk組MSk組/MS誤差誤差(n-1)(g-1)MS吳差隨機區(qū)組設(shè)計資料:正態(tài)分布且方差齊:雙向分類的方差分析配對t檢驗(意義相同t2=F)非正態(tài)分布或/和方差不齊:變量轉(zhuǎn)換—雙向分類的方差分析FriedmanM 檢驗7、拉丁方設(shè)計資料的方差分析:7、拉丁方設(shè)計資料的方差分析:可多安排一個已知的對實驗結(jié)果有影響的非處理因素, 增加了均衡性,減少了誤差,提高了效率。完全隨機設(shè)計只涉及一個處理因素;隨機區(qū)組設(shè)計涉及一個處理因素、一個區(qū)組因素;如果實驗研究涉及一個處理因素和兩個控制因素, 每個因素的類別數(shù)或水平數(shù)相等,此時可采用拉丁方設(shè)計。變異來源自由度MSF總變異N-1處理組g-1MSl理MSmi/MS誤差行區(qū)組g-1MS亍MSyMS誤差列區(qū)組g-1MSuMS油MS誤差誤差 (g-1)(gMS吳差-2)8、兩階段交叉設(shè)計資料的方差分析該設(shè)計不僅平衡了處理順序的影響, 而且能把處理方法間的差別、時間先后之間的差別和實驗對象之間的差別分開來分析。9、多樣本均數(shù)間的多重比較方法:LSD-t檢驗、Dunnett-t檢驗、SNK-q檢驗三種。10、多樣本方差比較:Bartlett檢驗、Levene檢驗第五章計數(shù)資料的統(tǒng)計描述1、基本概念:①、相對數(shù)(Relativenumber):是兩個有關(guān)聯(lián)的數(shù)據(jù)之比,用以說明事物的相對關(guān)系,便于對比分析。常用的相對數(shù)指標(biāo)很多,按聯(lián)系的性質(zhì)和說明的問題不同,主要分為:率、構(gòu)成、相對比三類。②、強度相對數(shù)-頻率(frequency):是最常見的一種相對數(shù),頻率在實踐中又稱為比率(proportion)。它表示事物內(nèi)部某個組成部分所占的相對多少。③、結(jié)構(gòu)相對數(shù)一構(gòu)成比(const讓uentratio):說明某事物內(nèi)部各組成部分所占的比重或分布,又稱構(gòu)成比。 構(gòu)成比可相加,和等于100%④、優(yōu)勢相對數(shù)--比(ratio):是指兩個有關(guān)聯(lián)的指標(biāo)A和B之比,簡稱比。A和B可以是性質(zhì)相同,也可以是性質(zhì)不相同。通常以倍數(shù)或百分數(shù)(%表示。⑤、率的標(biāo)準化法:指的是消除內(nèi)部構(gòu)成差別,使總體率能夠直接進行比較的方法。采用統(tǒng)一標(biāo)準調(diào)整后的率為標(biāo)準化率,簡稱為標(biāo)化率(standardizedrate)。標(biāo)準化的基本思想:采用統(tǒng)一的“標(biāo)準人口構(gòu)成”,以消除人口構(gòu)成不同對各組總率的影響,使算得的標(biāo)準化率具有可比性。⑥、動態(tài)數(shù)列(dynamicseries):是按時間順序排列的統(tǒng)計指標(biāo)(可以為絕對數(shù),相對數(shù)或平均數(shù)),用以觀察和比較該事物在時間上的變化和發(fā)展趨勢。分析動態(tài)數(shù)列常用的指標(biāo)有:絕對增長量、發(fā)展速度與增長速度、平均發(fā)展速度與平均增長速度。⑦、發(fā)展速度:表示報告期指標(biāo)的水平相當(dāng)于基線期(或前一期)指標(biāo)的百分之多少或若干倍。⑧、增長速度:表示的是凈增加速度,增長速度=發(fā)展速度-1(100%。2、率的標(biāo)準化的注意事項:①.標(biāo)準化后的標(biāo)準化率,已經(jīng)不再反映當(dāng)時當(dāng)?shù)氐膶嶋H水平,它只是表示相互比較的資料間的相對水平。②.兩樣本標(biāo)準化率是樣本值,存在抽樣誤差。當(dāng)樣本含量較小時,比較兩樣本的標(biāo)準化率,需要作假設(shè)檢驗。 (但如果比較的兩者是總體的參數(shù),則可進行直接比較,無需進行t、F檢驗)第六章幾種離散型變量的分布及其應(yīng)用連續(xù)型分布舉例:u分布、t分布和F分布;常用離散型分布:二項分布、Poisson分布、負二項分布。1、基本概念①、二項分布(binomialdistribution):是指在只會產(chǎn)生兩種可能結(jié)果之一的n次獨立重復(fù)試驗中,當(dāng)每次實驗的“陽性”的概率兀保持不變時,出現(xiàn)“陽性”次數(shù)X=0,1,2……n的一種概率分布。②、Poisson分布(Poissondistribution):是二項分布的一種極端形式,指的是每次實驗的“陽性”概率比較低的時候,出現(xiàn)陽性次數(shù)的相應(yīng)概率滿足以人為參數(shù)的X~P(入)。2、二項分布的適用條件:①、每次試驗只會發(fā)生兩種隊里的額可能結(jié)果之一,即分別發(fā)生兩種結(jié)果的概率之和很等于1;②、每次試驗產(chǎn)生某種結(jié)果的概率固定不變;③、重復(fù)試驗是相互獨立的,不相互影響。3、二項分布的性質(zhì)①、樣本率的標(biāo)準差也稱為率的標(biāo)準誤,可以用來描述樣本率的抽樣誤差,率的標(biāo)準誤越小,則率的抽樣誤差就越小。②、當(dāng)兀二時,二項分布圖形是對稱的,當(dāng)兀?時,圖形是偏態(tài)的,隨著n增大,圖形趨于對稱。當(dāng)n-無窮時,只要兀不太靠近。或1,二項分布則近似正態(tài)分布。③、利用二項分布的性質(zhì),可進行總體率的區(qū)間估計和差異推斷。(當(dāng)nW50時可查表得到可信區(qū)間,>50是可采用近似正態(tài)分布法)4、Poisson分布的適用條件:普通性:才充分小的觀測單位上X的取值最多為1;獨立增量性:重復(fù)實驗室相互獨立的,不相互影響;平穩(wěn)性:每次試驗陽性時間發(fā)生的概率都應(yīng)相同。5、Poisson分布的性質(zhì):①、總體均數(shù)入與總體方差(T2相等時Poisson分布的重要特征;②、當(dāng)n很大,而兀很小時,且n兀=人為常數(shù)時,二項分布近似Poisson分布;③、當(dāng)入增大時,Poisson分布逐漸近似正態(tài)分布。一般而言,入n20時,Poisson分布資料可作為正態(tài)分布處理。④、Poisson分布具備可加性。6、Poisson分布的圖形特點:當(dāng)入越小,分布就越偏態(tài);當(dāng)入越大時,Poisson分布則越漸近正態(tài)分布。當(dāng)入w1時,隨X取值的變大,P(X)值反而會變??;當(dāng)入>1時,隨X取值的變大,P(X)值先增大后變小。第七章卡方檢驗x21、%2分布曲線的特點:x2分布曲線的形狀依賴于自由度的大?、佼?dāng)自由度w2時,曲線呈L形;隨著自由度的增加,曲線逐漸趨于對稱;當(dāng)自由度一無窮時,x2分布趨近正態(tài)分布。2、%2分布的基本性質(zhì):可加性;3、x2檢驗的原理:通過實際頻數(shù)和理論頻數(shù)滿足f(%2),來推斷實際頻數(shù)與理論頻數(shù)的差異大小及有無統(tǒng)計學(xué)意義。4、幾種常見的資料類型:①、普通四格表:自由度二(行數(shù)-1)(列數(shù)-1)X2可使用四格表專用公式;X:nA40且所有的TA57使用基本公式;時,改用Fisher確切概率法;nA40但有1<T<5—四格表校正公式或者Fisher確切概率法n<40或T<1Fisher確切概率法②配對四格表資料:b+c<40且1WTW5要校正;5、Fisher確切概率法思想:四格表資料周邊合計數(shù)不變的條件下,計算表內(nèi)4個實際頻數(shù)變動時的各種組合之概率;再按照假設(shè)檢驗用單側(cè)或雙側(cè)的累計概率依據(jù)所取得檢驗水準%做出推斷。6、行X列表資料使用范圍:多個樣本率的比較;樣本構(gòu)成比的比較;雙向無序分類資料的關(guān)聯(lián)性檢驗;7、多個樣本率的多重比較:多個實驗組間的兩兩比較與實驗組與同一對照組的比較均應(yīng)對口進行校準,且方法相同。8、擬合優(yōu)度檢驗:適用范圍:推斷某一現(xiàn)象的頻數(shù)分布是否符合某一理論分布;比較實際頻數(shù)與理論頻數(shù)的差異大小。第八章非參數(shù)檢驗1、非參數(shù)檢驗的適用范圍:①不滿足正態(tài)分布和方差齊性條件的計量資料;②對于分布不知道是否正態(tài)的小樣本資料;③對于一端或兩端是不確定值得資料;④推斷等級資料的等級強度差別。2、主要數(shù)據(jù)資料類型:①配對樣本比較:(樣本量:)50時可以采用近似正態(tài)法作u檢驗)HQ樣本總體中位數(shù)二人群總體中位數(shù);H1:樣本總體中位數(shù)中人群總體中位數(shù)。②兩獨立樣本的比較:(n1>10或n2-n1>10時,令n1+n2=N作近似正態(tài)分布檢驗)H。兩樣本總體分布位置相同;H1:兩樣本總體分布位置不同。③完全隨機多個樣本:HQ多個樣本總體分布位置相同;H1:多個樣本總體分布位置不全相同。注意:當(dāng)完全隨機的多個樣本為兩個樣本時,使用完全隨機多個樣本的檢驗方法求得的統(tǒng)計值H(或代)與使用兩獨立樣本的u檢驗求得的u值等價。H=i2o第九章:雙變量回歸與相關(guān)1、直線回歸(linearregression):因變量Y隨著自變量X的變化而變化呈直線趨勢,但并非所有的對應(yīng)點恰好全都在一條直線上,稱為直線回歸或者簡單回歸。注:a為常數(shù)項,是回歸直線在Y軸上的截距;b為回歸系數(shù)(coefficientofregression),為直線的斜率;其統(tǒng)計意義是當(dāng)X變化一個單位時Y的平均改變的估計值。直線回歸方程的求法基本原貝U:最小二乘(leastsumofsquares)將實測值與假定回歸線上的估計值的縱向距離稱為殘差(residual)或剩余值。為了使各點殘差盡可能的小,考慮到所有點之殘差有正有負,所以通常取各點殘差平方和最小的直線即為所求,如此得到的回歸系數(shù)最理想。統(tǒng)計推斷的檢驗:方差分析F檢驗或者t檢驗兩者等價:t=F2b離0越遠,Y受X的影響越大,SS回就越大,回歸效果越好;SS殘越小,估計誤差越小,回歸作用越明顯。2、直線相關(guān)(linearcorrelation):兩個數(shù)值變量進行比較時,一個變量在增加或者減少時,另一個變量也表現(xiàn)為增加或者減少,這兩個變量之間的關(guān)系即為直線相關(guān)。本目關(guān)系數(shù)(correlationcoefficient)又稱為pearson積差相關(guān)系數(shù),以符號r表示樣本相關(guān)系數(shù),符號p表示其總體相關(guān)系數(shù)。用來說明具有直線關(guān)系的兩變量間相關(guān)的密切程度與相關(guān)方向。相關(guān)系數(shù)的統(tǒng)計推斷:t檢驗決定系數(shù)(coefficientofdetermination):為回歸平方和與總平方和之比。其數(shù)值大小反映了回歸貢獻的相對程度,也就是在Y的總變異中回歸關(guān)系所能解釋的百分比。3、殘差圖考察數(shù)據(jù)是否符合模型假設(shè)的基本要求:①、應(yīng)變量與自變量關(guān)系為線性;②、誤差服從均數(shù)為0的正態(tài)分布;③、方差相等;④、各觀測對象獨立。4、直線回歸與直線相關(guān)的區(qū)別和共同點區(qū)別:①相關(guān)系數(shù)無單位,回歸系數(shù)有單位;②相關(guān)表示相互關(guān)系,沒有依存關(guān)系,回歸有依存關(guān)系;③兩者對資料的要求不同:當(dāng)X和Y都是隨機的,可以進行相關(guān)和回歸分析;當(dāng)Y是隨機變量,X是控制變量時,理論上只能做回歸分析。聯(lián)系:①均表示線性關(guān)系;②符號相同,共變方向一致;③假設(shè)檢驗結(jié)果相同;(tr=tb)④可以互相換算(數(shù)值的相同不代表意義的相同)第十二章重復(fù)測量設(shè)計資料的方差分析1、重復(fù)測量設(shè)計資料的數(shù)據(jù)特征:①、未設(shè)立平行對照的前后測量設(shè)計:(重復(fù)測量資料最常見的情況是前后測量設(shè)計)前后測量設(shè)計與配對設(shè)計t檢驗的區(qū)別:a、配對設(shè)計中同一對子的兩個實驗單位可以隨機分配處理,兩個實驗單位同期觀察實驗結(jié)果,可以比較處理組間差別;前后測量設(shè)計不能同期觀察實驗結(jié)果,雖然可以在前后測量之間安排處理,但本質(zhì)上比較的是前后差別,推論處理是否有效是有條件的,即假定測量時間對觀察結(jié)果沒有影響。b、配對t檢驗要求同一對子的兩個實驗單位的觀察結(jié)果分別是差值相互獨立,差值服從正態(tài)分布。而前后測量設(shè)計前后兩次觀察結(jié)果通常與差值不獨立,大多數(shù)情況第一次觀察結(jié)果與差值存在負相關(guān)的關(guān)系。c、配對設(shè)計用平均差值推論處理的作用,前后測量設(shè)計出了分析平均差值外,還可進行相關(guān)分析。②、設(shè)立平行對照的前后測量設(shè)計:雖然分為處理組和對照組,但是不能進行差值均數(shù)t檢驗,因為通常兩組差值的方差不會相等。③、重復(fù)測量設(shè)計:重復(fù)測量數(shù)據(jù)與隨機區(qū)組設(shè)計數(shù)據(jù)相似,兩者的差別是:a、重復(fù)測量設(shè)計中處理是在區(qū)組間隨機分配,區(qū)組內(nèi)的各時間點是固定的,不能隨機分配;隨機區(qū)組設(shè)計則要求每個區(qū)組內(nèi)實驗單位彼此獨立,處理只能在區(qū)組內(nèi)隨機分配,每個實驗單位接受的處理是不相同的。b、重復(fù)測量設(shè)計區(qū)組內(nèi)實驗單位彼此不獨立,而隨機區(qū)組內(nèi)實驗單位彼此獨立,如果按照隨機區(qū)組進行t檢驗則要求進行統(tǒng)計值的校正。第十五章多元線性回歸資料的分析適用范圍:分析一個應(yīng)變量與多個自變量之間的線性關(guān)系;1、多元線性回歸模型的一般形式:Y=B0+B1X1+B2X2+??…+BmXm+ea、偏回歸系數(shù)pj的意義:表示在其他自變量保持不變的時候,Xj增加或減少一個單位時Y的平均變化量。b、偏回歸分布的應(yīng)用條件:①、Y與各個變量之間有線性關(guān)系;②、各例觀測值Yi相互獨立;③、殘差e服從均數(shù)為0,方差為S2的正態(tài)分布。(等價于對任意一組自變量X1、X2……Xmf直,應(yīng)變量Y具有相同方差,并且服從正態(tài)分布)c、參數(shù)的計算方法:最小二乘法2、多元線性回歸方程的假設(shè)檢驗及其評價:(對整體的假設(shè)檢驗)A、可以將回歸方程中所有的自變量作為一個整體來檢驗它們與應(yīng)變量Y之間是否具有線性關(guān)系。假設(shè)檢驗方法:方差分析法:HQp1=p2= = pm=QH1:各Bj不全為0.若拒絕H0,接受H1,即可確定所擬合的回歸方程有統(tǒng)計學(xué)意義。1)決定系數(shù)R2:即為偏回歸平方和與殘差平方和的比值,其值越接近1,說明擬合程度越好。2)復(fù)相關(guān)系數(shù):決定系數(shù)開根號,可用來度量應(yīng)變量與多個自變量之間的線性相關(guān)程度。R各自變量的假設(shè)檢驗:①、使用方法為偏回歸平方和(SS回(Xj)):表示在m-1個自變量的基礎(chǔ)上新增加Xj所引起的回歸平方和的增加量。其值越大,說明Xj越重要。偏回歸平方和檢驗:HO:pj=0;H1:Bj?。注意:單獨分析各個變量的偏回歸平方和,所有值的和小于總的回歸平方和,其原因是忽略了各個變量之間的相互作用成②、t檢驗法:對于同一資料,不同自變量的t值間可以相互比較,t的絕對值越大,說明該自變量對Y的回歸所起的作用越大。③標(biāo)準化回歸系數(shù):減少自變量觀測單位不同對結(jié)果的影響。在有統(tǒng)計學(xué)意義的前提下,標(biāo)準化回歸系數(shù)的絕對值越大說明相應(yīng)自變量對Y的作用越大。3、自變量選擇方法:A、全局擇優(yōu)法:①、校正決定系數(shù)Rc選擇法(當(dāng)R2相同時,自變量個數(shù)越多,Rc越小,最優(yōu)為Rc最大)②、Cp選擇法:應(yīng)選擇Cp最接近p+1的回歸方程為最優(yōu)方程。B>逐步選擇法:①、前進法:(只選不剔)在有統(tǒng)計學(xué)意義的前提下,選取偏回歸平方和最大的一個自變量做F檢驗以決定是否選入。②、后退法:(只剔不選)選取回歸平方和最小的一個自變量做F檢驗以決定是否剔除。③、逐步回歸法:先選后剔,雙向篩選。本質(zhì)上是前進法,但每引入一個自變量進入方程后,要對方程中的每一個自變量做基于偏回歸平方和的F檢驗,看是否需要剔除一些退化為不顯著的自變量。注意:為了避免已經(jīng)剔除的自變量再次入選,選入自變量的檢驗水準要小于或等于剔除自變量的檢驗水準。第十六章logistic回歸分析logistic回歸(logisticregression)屬于概率型非線性回歸。適用對象:二分類或多分類影響因素之間的關(guān)系1、表示方法:陽性概率 P=1/1+exp(-Z)Z=B0+B1X1+P2X2++BmXmP的logit轉(zhuǎn)換:logitP=ln(p/1-p尸 p0+p1X1+p2X2++BmXm回歸系數(shù)Bj表示自變量Xj改變一個單位時logitP的該變量。2、模型參數(shù)的意義:①、確定優(yōu)勢比(oddsratio,OR 衡量危險因素作用大小的比數(shù)比例用于分類指標(biāo)而不適用于計量指標(biāo);多變量調(diào)整后的優(yōu)勢比(adjustoddsratio)ORj:表示扣除了其他自變量影響后危險因素的作用。用來對比某一危險因素兩個不同暴露水平 Xj=c1和Xj=c0之間的發(fā)病情況。1)8尸。時,0Rj=1,說明因素Xj對疾病的發(fā)生不起作用;2)陽>。時,ORj>1,說明因素Xj對疾病發(fā)生起危險作用;3)時,ORj<1,說明因素Xj時一個保護因子。②、確定相對危險度(relativerisk,RB對于發(fā)病率很低的疾病存在優(yōu)勢比即等于兩種暴露水平之間的相對危險度。2、logistic 回歸方程的參數(shù)估計:主要方法有最大似然估計法(maximumlikelihoodestimateML?和優(yōu)勢比估計法。3、logistic 回歸的適用對象:①、比較各暴露因素的致病風(fēng)險的大??;②、多因素的共同作用的評價;③、危險因素的篩選:多經(jīng)文獻報道選取,但統(tǒng)計學(xué)資料不能代替專業(yè)依據(jù)4、logistic 回歸模型的假設(shè)檢驗:常用的檢驗方法有似然比檢驗(likelihoodratiotest)>Wald檢驗和計分檢驗(scoretest) 統(tǒng)計量為卡方值logistic 回歸模型變量的篩選與多元線性回歸相同。第十七章生存分析1、生存分析資料與一般資料比較的不同:①、同時考慮生存時間和生存結(jié)局;②、通常含有刪失數(shù)據(jù);③、生存時間的分布通常不服從正態(tài)分布。2、概念:生存時間(survivaltime),從起始事件到終點事之間所經(jīng)歷的時間跨度。完全數(shù)據(jù)(completedata),在追蹤觀察中,當(dāng)觀察到了某觀察對象的明確結(jié)局時,該觀察對象所提供的關(guān)于生存時間的信息是完整的,這種生存時間數(shù)據(jù)稱為完全數(shù)據(jù)。不完全數(shù)據(jù)(incompletedata),在實際追蹤觀察中,由于某種原因無法知道觀察對象的確切生存時間,這種生存時間數(shù)據(jù)也稱為截尾數(shù)據(jù)。生存率(survivalrate)是指病人經(jīng)歷給定的時間之后仍存活的概率,若有截尾數(shù)據(jù),應(yīng)用乘積極限法。生存概率(p

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論