


版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、學(xué)習(xí)必備第一章 緒論1、數(shù)據(jù)/資料的分類: 、計(jì)量資料,又稱定量資料或者數(shù)值變量;為觀測(cè)每個(gè)觀察單位某項(xiàng)治療的大小 而獲得的資料。 、計(jì)數(shù)資料,又稱定性資料或者無序分類變量;為將觀察單位按照某種屬性或者 類別分組計(jì)數(shù),分組匯總各組觀察單位數(shù)后而得到的資料。 、等級(jí)資料,又稱半定量資料或者有序分類變量。為將觀察單位按某種屬性的不 同程度分成等級(jí)后分組計(jì)數(shù),分類匯總各組觀察單位數(shù)后而得到的資料。2、統(tǒng)計(jì)學(xué)常用基本概念: 、統(tǒng)計(jì)學(xué)(statistic®是關(guān)于數(shù)據(jù)的科學(xué)與藝術(shù),包括設(shè)計(jì)、搜集、整理、分析 和表達(dá)等步驟,從數(shù)據(jù)中提煉新的有科學(xué)價(jià)值的信息。 、總體(population)指的是根
2、據(jù)研究目的而確定的同質(zhì)觀察單位的全體。 、醫(yī)學(xué)統(tǒng)計(jì)學(xué)(medical statistics):用統(tǒng)計(jì)學(xué)的原理和方法處理醫(yī)學(xué)資料中的同 質(zhì)性和變異性的科學(xué)和藝術(shù),通過一定數(shù)量的觀察、對(duì)比、分析,揭示那些困惑費(fèi)解的醫(yī)學(xué)問題背后的規(guī)律性。 、樣本(sample):指的是從總體中隨機(jī)抽取的部分觀察單位。 、變量(variable):對(duì)觀察單位某項(xiàng)特征進(jìn)行測(cè)量或者觀察,這種特征稱為變量。 、頻率(frequency):指的是樣本的實(shí)際發(fā)生率。 、概率(probability ):指的是隨機(jī)事件發(fā)生的可能性大小。用大寫的P表示。3、統(tǒng)計(jì)工作的基本步驟: 、統(tǒng)計(jì)設(shè)計(jì):包括對(duì)資料的收集、整理和分析全過程的設(shè)想
3、與安排; 、收集資料:采取措施取得準(zhǔn)確可靠的原始數(shù)據(jù); 、整理資料:將原始數(shù)據(jù)凈化、系統(tǒng)化和條理化; 、分析資料:包括統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷兩個(gè)方面。第二章計(jì)量資料的統(tǒng)計(jì)描述1. 頻數(shù)表的編制方法,頻數(shù)分布的類型及頻數(shù)表的用途 、求極差(range):也稱全距,即最大值和最小值之差,記作R; 、確定組段數(shù)和組距,組段數(shù)通常取10-15組; 、根據(jù)組距寫出組段,每個(gè)組段的下限為L(zhǎng),上限為U,變量X值得歸組統(tǒng)一定為L(zhǎng) w X v U,最后一組包括下限。歡迎下載 、分組劃記并統(tǒng)計(jì)頻數(shù)。頻數(shù)分布的類型包括對(duì)稱分布和偏態(tài)分布;偏態(tài)分布主要分為右偏態(tài)分布(也稱正偏態(tài)分布)和左偏態(tài)分布(也稱負(fù)偏態(tài)分布)。 頻數(shù)
4、表的用途包括以下幾個(gè)方面: 、描述頻數(shù)分布的類型; 、描述頻數(shù)分布的特征; 、便于發(fā)現(xiàn)一些特大或特小的離群值; 、便于進(jìn)一步做統(tǒng)計(jì)分析和處理。2. 集中趨勢(shì)指標(biāo)的適用條件、計(jì)算方法和意義。統(tǒng)計(jì)學(xué)用平均數(shù)(average)這一指標(biāo)體系來描述一組變量值的幾種位置或者平均水 平。常用的平均數(shù)有算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)。 、算數(shù)均數(shù),簡(jiǎn)稱均數(shù)( mean),可用于反映一組呈對(duì)稱分布的變量值在數(shù)量上的平均水平。計(jì)算方法包括直接計(jì)算法和頻數(shù)表法(公式見2-2)。 、幾何均數(shù)(geometric mean),可用于反映一組經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的變量值在數(shù)量上的平均水平,在醫(yī)學(xué)研究中常用于免疫學(xué)的指標(biāo)。(
5、計(jì)算公式見于2-3) 、中位數(shù)(median),適用于各種分布類型的資料,尤其是偏態(tài)分布資料和一端或者兩端無確切數(shù)值的資料。 、百分位數(shù)(percentile)是一種位置指標(biāo),是一個(gè)界值,其重要用途是確定醫(yī)學(xué) 參考值范圍(reference range)。直接計(jì)算法(公式見于 2-7、2-8)頻數(shù)表法(2-9、2-10)3、離散趨勢(shì)指標(biāo)的適用條件、計(jì)算方法和意義。描述數(shù)據(jù)變異大小的常用統(tǒng)計(jì)指標(biāo)有極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系數(shù)。 、極差,一組變量值的最大值與最小值之差。 、四分位數(shù)間距(quartile range , QR)是把全部變量值分為四部分的分位數(shù)后,學(xué)習(xí)必備. 由第3四分
6、位數(shù)和第1四分位數(shù)相減而得。它一般和中位數(shù)一起描述偏態(tài)分布資料 的分布特征。QR=P75-P25。 、方差(variance)也稱均方差(mean square deviation )離均差平方和與樣本含 量的比值。計(jì)算公式為2-11、標(biāo)準(zhǔn)差(standard deviation)是方差的正平方根,其單位與原變量值得單位相 同。計(jì)算公式為 2-13、2-14、變異系數(shù)(coefficient of variation)記作CV,多用于觀察指標(biāo)單位不同時(shí), 或者均數(shù)相差較大時(shí)兩者變異程度的比較。計(jì)算公式為2-164. 正態(tài)分布的圖形,正態(tài)分布的特征,正態(tài)曲線下面積的分布規(guī)律。 正態(tài)分布的特征:
7、、在直角坐標(biāo)的橫軸上方呈鐘形曲線,兩端與X軸永不相交,且以 X=卩為對(duì)稱軸,左右完全對(duì)稱。 、在X=卩處,f (X)取最大值,遠(yuǎn)離 卩,其值越小。 、正態(tài)分布有兩個(gè)參數(shù),位置參數(shù)(1和形態(tài)參數(shù)(T , (1決定正態(tài)分布的曲線在坐標(biāo)軸上的左右移動(dòng),越大越右移;6決定曲線的弓背程度,越小峰值越高。 正態(tài)分布曲線下的面積分布有一定的規(guī)律。X軸與正態(tài)曲線所夾面積恒等于1或者 100%區(qū)間1 ± 6的面積為68.27%;區(qū)間1 土 1.96 6的面積為95.00%,區(qū)間1 土 2.58 6的面積為99.00%。5. 醫(yī)學(xué)參考值范圍的意義和估計(jì)方法。醫(yī)學(xué)參考值(reference value)是
8、指包括絕大多數(shù)正常人的人體形態(tài)、機(jī)能和代謝 產(chǎn)物等各種生理及生化指標(biāo)常數(shù),也稱正常值。由于存在個(gè)體差異,生物醫(yī)學(xué)數(shù)據(jù)并非常數(shù),而是在一定范圍內(nèi)波動(dòng),故采用醫(yī)學(xué)參考值范圍(medical referenee range)作為判定正常和異常的參考標(biāo)準(zhǔn)。通常使用 的醫(yī)學(xué)參考值范圍有 90%、95%、99% 、正態(tài)分布法:數(shù)據(jù)服從或者近似服從正態(tài)分布,或者通過適當(dāng)?shù)淖儞Q轉(zhuǎn)換為正態(tài)分布,采用此方法之前一般要對(duì)資料進(jìn)行正態(tài)性檢驗(yàn)且要求樣本含量足夠大(如歡迎下載n > 100)計(jì)算公式為2-23、2-24:雙側(cè):?jiǎn)蝹?cè): 、百分位數(shù)法:適用于偏態(tài)分布資料醫(yī)學(xué)參考值范圍的制定,所要求的樣本含量 比正態(tài)分布
9、要多(不低于100 )。計(jì)算公式為2-25、2-26:雙側(cè):?jiǎn)蝹?cè):第三章總體均數(shù)的估計(jì)與假設(shè)檢驗(yàn)仆基本概念: 抽樣誤差(sampling error):指的是由于個(gè)體變異產(chǎn)生、隨機(jī)抽樣造成的樣本統(tǒng) 計(jì)量與總體參數(shù)的差異。 標(biāo)準(zhǔn)誤(standard error , SE):指的是樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差。 均數(shù)的標(biāo)準(zhǔn)誤(standard error of mean , SEM ):指的是樣本均數(shù)的標(biāo)準(zhǔn)差。 探SEM反映樣本均數(shù)之間的離散程度,也反映樣本均數(shù)與相應(yīng)總體均數(shù)間的差異。均數(shù)的標(biāo)準(zhǔn)誤的計(jì)算公式為3-1、3-2統(tǒng)計(jì)推斷(statistical inference):通過抽樣研究的方法從總體中隨機(jī)
10、抽取一個(gè)樣 本,用樣本的信息來推斷總體的特征的統(tǒng)計(jì)學(xué)方法,包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。2、標(biāo)準(zhǔn)差的用途: 、反映資料的離散趨勢(shì)。標(biāo)準(zhǔn)差越小,說明變異程度越小,均數(shù)的代表性越好; 用于計(jì)算變異系數(shù); 用于計(jì)算標(biāo)準(zhǔn)誤; 結(jié)合均數(shù)和正態(tài)分布規(guī)律估計(jì)參考值范圍。3、u分布與t分布:學(xué)習(xí)必備歡迎下載u分布(也稱Z分布):指的是總體均數(shù)為 0,總體標(biāo)準(zhǔn)差為1的標(biāo)準(zhǔn)正態(tài)分布 N(0,1 2)。t分布:隨機(jī)變量X服從總體均數(shù)為,總體標(biāo)準(zhǔn)差為b的正態(tài)分布N(y, d 2), 則可以通過u變換將一般的正態(tài)分布轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布。但是通常獲得的資料為樣本的均數(shù)標(biāo)準(zhǔn)誤,因此經(jīng)過轉(zhuǎn)換后并不是完全意義上的標(biāo)準(zhǔn)正態(tài)分布,而是服
11、從 t分布。(計(jì)算公式為3-3)b、d已知或者未知,但 n足夠大(如60)時(shí):按u分布 雙側(cè)和單側(cè)公式見 3、8、3-9、3-10B、兩總體均數(shù)之差的可信區(qū)間: 前提:兩總體方差相等,但均數(shù)不等 計(jì)算公式見于 3-12、3-13、3-14標(biāo)準(zhǔn)差反映一組數(shù)據(jù)的離散情況;( S)不能通過統(tǒng)計(jì)方法來控 制t分布主要用于總體均數(shù)的區(qū)間估計(jì)和t檢驗(yàn)。4、可信區(qū)間:從固定樣本含量的已知總體總進(jìn)行重復(fù)隨機(jī)抽樣試驗(yàn),根據(jù)每個(gè)樣本可算得一個(gè)可信區(qū)間,則平均有1-a (如95%)的可信區(qū)間包含了總體參數(shù),而不是總體參數(shù)落在該范圍的可能性為1- a。5、參考值范圍和總體均數(shù)可信區(qū)間的區(qū)別見課本表3-26、標(biāo)準(zhǔn)差與標(biāo)
12、準(zhǔn)誤的區(qū)別和聯(lián)系:均數(shù)的標(biāo)準(zhǔn)誤意反映 X的抽樣誤義差大小= ;丁. - n計(jì)算Sx二S.用控制增加 n方法7、總體均數(shù)可信區(qū)間的計(jì)算:根據(jù)總體標(biāo)準(zhǔn)差d是否已知以及樣本含量 n的大小而異,通常有t分布和u分布兩類方法。A、單一總體均數(shù)的可信區(qū)間:a、總體標(biāo)準(zhǔn)差d已未知:按t分布雙側(cè)和單側(cè)公式見 3-5、3-6、3-78、t分布圖的特征: 、單峰分布,以 0為中心,左右對(duì)稱; 、t分布的曲線形態(tài)取決于自由度v的大小,自由度越小,貝Ut值越分散,曲線的峰部越矮而尾部翹得越高; 、當(dāng)自由度逼近無窮的時(shí)候,樣本標(biāo)準(zhǔn)誤接近總體標(biāo)準(zhǔn)誤,t分布逼近標(biāo)準(zhǔn)正態(tài)分布。(標(biāo)準(zhǔn)正態(tài)分布是t分布的特例)9、t檢驗(yàn)的適用條
13、件t檢驗(yàn)(t test/Student t-test)當(dāng)d未知且樣本含量較小時(shí)(如nv 60),理論上要求t檢驗(yàn)的樣本隨機(jī)地取自正態(tài)分布的總體,兩小樣本均數(shù)比較式還要求兩樣本所對(duì)應(yīng)的兩總體方差相等,即 方差齊性。在實(shí)際應(yīng)用中,如與上述條件略有偏離,對(duì)結(jié)果 影響也不大。10、假設(shè)檢驗(yàn)A、 假設(shè)檢驗(yàn)的基本思想:利用小概率反證法的思想,從問題的對(duì)立面(H。)出發(fā)簡(jiǎn)介判斷要解決的問題(H1 )是否成立。即在假設(shè) H。成立的條件下計(jì)算檢驗(yàn)統(tǒng)計(jì) 量,然后根據(jù)獲得的 P值來判斷。B、假設(shè)檢驗(yàn)的基本步驟:建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn); 計(jì)算檢驗(yàn)統(tǒng)計(jì)量; 確定P值,做出推斷結(jié)論。C、假設(shè)檢驗(yàn)的錯(cuò)誤I型錯(cuò)誤:拒絕了
14、實(shí)際上成立的H0,這類“棄真”的錯(cuò)誤;(a )n型錯(cuò)誤:“接受”了實(shí)際上不成立的 H0,這類“取偽”的錯(cuò)誤。(3)學(xué)習(xí)必備歡迎下載.注意:a越小,B越大;反之a(chǎn)越大,B越小;若要同時(shí)減小I 型和n型錯(cuò)誤,唯一的方法就是增加樣本含量n ;若重點(diǎn)是減少I型錯(cuò)誤,一般取a =0.05 ;若重點(diǎn)是減少n型錯(cuò)誤,一般拒絕H0,只可能犯I型錯(cuò)誤;接受 H0,只可能犯n型錯(cuò)誤。取3 =0.10或者0.20甚至更高;資 料 或 數(shù) 據(jù)計(jì)量資 料(已 知均數(shù) 和/或標(biāo) 準(zhǔn)差)兩樣 本(樣 本含 量較 小,60)單樣本t檢驗(yàn)適用于已知樣本均數(shù)和已知總體均 數(shù)的比較t分布(v=n-1 )對(duì)方差齊與否無要求 正態(tài)分布
15、t值配對(duì)樣本t檢 驗(yàn)適用于配對(duì)設(shè)計(jì)的計(jì)量資料t分布(v=n-1 )對(duì)方差齊與否無要求 正態(tài)分布t值兩樣本t檢驗(yàn)/ 成組t檢驗(yàn)方差齊適用于任意兩計(jì)量資料 的比較t分布(v=n 1+ n2-2 )方差齊 正態(tài)分布t值方差不齊Cochran&Cox 近似 t 檢驗(yàn)t分布方差不齊 正態(tài)分布t'值(校正t值)Satterthwaite 近似 t 檢驗(yàn)t分布方差不齊 正態(tài)分布t'值(校正自由度)兩樣本的方差比較時(shí),可以使用F檢驗(yàn),分子為較大的樣本方差(自由度為n1-1);分母為較小的樣本方差(自由度為n2-1)。F值滿足F分布,統(tǒng)計(jì)值為F值。多樣本完全隨機(jī)設(shè)計(jì) 資料的方差分 析完全
16、隨機(jī)化分組方法將試驗(yàn)對(duì)象分 配到g個(gè)處理組中去,試驗(yàn)后比較各 組均數(shù)之間的差別F分布方差齊 正態(tài)分布F值與成組t檢驗(yàn)意義相同隨機(jī)區(qū)組設(shè)計(jì) 資料的方差分 析隨機(jī)分配的次數(shù)要重復(fù)多次, 且各個(gè) 處理組實(shí)驗(yàn)對(duì)象數(shù)量相同, 區(qū)組內(nèi)均 衡F分布方差齊 正態(tài)分布F值與配對(duì)t檢驗(yàn)意義相同拉丁方設(shè)計(jì)資料的方差分析可多安排一個(gè)已知的對(duì)實(shí)驗(yàn)結(jié)果有 影響的非處理因素,增加了均衡性, 減少了誤差,提高了效率F分布方差齊 正態(tài)分布F值兩階段交叉設(shè) 計(jì)資料的方差 分析兩種處理在全部實(shí)驗(yàn)過程中交叉進(jìn) 行F分布方差齊 正態(tài)分布F值兩個(gè)階段之間一定要經(jīng) 過一段洗脫階段以消除 殘留效應(yīng)多樣本的多重比較LSD-t檢驗(yàn)/最小顯著差異
17、t檢驗(yàn),適用于一對(duì)或者幾對(duì)在專業(yè)上有特殊意義的樣本均數(shù)間的比較,統(tǒng)計(jì)量為t值Dunnett-t檢驗(yàn)適用于g-1個(gè)實(shí)驗(yàn)組與一個(gè)對(duì)照組均數(shù)差別的多重比較,統(tǒng)計(jì)量為Dunnett-t值SNK-q檢驗(yàn)適用于多個(gè)樣本均數(shù)兩兩之間的全面比較,統(tǒng)計(jì)量為q值多樣本的方差比較Bartlett檢驗(yàn),要求資料具有正態(tài)性,統(tǒng)計(jì)量為卡方;學(xué)習(xí)必備歡迎下載Levene檢驗(yàn),比Bartlett檢驗(yàn)要求低,不需要資料具有正態(tài)性,統(tǒng)計(jì)量為F值。其他類型資料分類資料四格表資料通過兩個(gè)樣本的樣本率來反映總體 率有無差異卡方分布無方差齊性要求無正態(tài)分布要求卡方值與兩樣本的u檢驗(yàn)等價(jià):u 2=卡方值配對(duì)四格表資 料強(qiáng)調(diào)配對(duì):即針對(duì)同一
18、樣本米取不 冋的試驗(yàn)或者處理方法??ǚ椒植紵o方差齊性要求無正態(tài)分布要求卡方值行X列表資料用于多個(gè)樣本率的比較、兩個(gè)或多 個(gè)構(gòu)成比的比較以及雙向無序分類 資料的關(guān)聯(lián)性檢驗(yàn)卡方分布無方差齊性要求無正態(tài)分布要求卡方值可用來分析兩個(gè)分類變量之間有無關(guān)系A(chǔ). |-ZTTV-或者關(guān)聯(lián)多樣本率的多 重比較適用于多樣本率兩兩之間的多重比 較(基本思想:對(duì)卡方值進(jìn)行校正)卡方分布無方差齊性要求無正態(tài)分布要求卡方值H0:H1頻數(shù)分布的擬 合優(yōu)度推斷頻數(shù)分布的擬合優(yōu)度適用于正 態(tài)分布、二項(xiàng)分布、 poisson分布和 負(fù)二項(xiàng)分布卡方分布無方差齊性要求無正態(tài)分布要求卡方值推斷某現(xiàn)象的頻數(shù)分 布是否符合某一理論 分布不
19、滿足上述統(tǒng) 計(jì)方法的資料、 等級(jí)資料 秩檢驗(yàn)配對(duì)樣本的檢 驗(yàn)適用于配對(duì)樣本差值的中位數(shù)和0比較;還可用于單個(gè)樣本中位數(shù)和 總體中位數(shù)比較無方差齊性要求 無正態(tài)分布要求秩和(正秩 和或負(fù)秩 和)T值樣本量n > 50時(shí)可用正 態(tài)分布近似法兩獨(dú)立樣本比 較適用于推斷計(jì)量資料或等級(jí)資料的 兩個(gè)獨(dú)立樣本所來自的兩個(gè)總體分 布是否有差別方差不齊 正態(tài)分布秩和(正秩 和或負(fù)秩 和)T值n1 > 10 或 n2-n1 > 10 可 用正態(tài)分布近似法作 U 檢驗(yàn)完全隨機(jī)多樣 本比較用于推斷計(jì)量資料或者等級(jí)資料的 多個(gè)獨(dú)立樣本所來自的多個(gè)總體分 布是否有差別無方差齊性要求 無正態(tài)分布要求H檢驗(yàn)
20、H值g=3且最小樣本的例數(shù) 大于5或g>3, H近似 服從g-1的正態(tài)分布, 可用卡方分布法多變量資料的 處理回歸 與相關(guān)雙變量直線回 歸用于對(duì)兩變量總體間線性關(guān)系的估 計(jì)線性、獨(dú)立、方差 齊性、誤差服從均 數(shù)為0的正態(tài)分布回歸方程 (回歸系 數(shù))雙變量直線相 關(guān)用于判斷 兩個(gè)數(shù)值變量之間 有無線 性關(guān)系,雙變量正態(tài)分布資料正態(tài)分布相關(guān)系數(shù)r相關(guān)系數(shù)求出后應(yīng)做假 設(shè)檢驗(yàn)多元線性回歸用于分析一個(gè)應(yīng)變量 與多個(gè)自變量 之間的線性關(guān)系正態(tài)分布多元回歸 方程回歸方程求出后應(yīng)做整 體假設(shè)檢驗(yàn)以及各自變 量的假設(shè)檢驗(yàn)非正態(tài)分布或/和方差不齊:變量轉(zhuǎn)換t單因素方差分析秩和檢驗(yàn)第四章多樣本均數(shù)比較的方差
21、分析1、概念: 離均差平方和 (sum of squares of deviation from mean, SS)指的是各個(gè)觀測(cè)值與總 均數(shù)差值的平方。 均方差,簡(jiǎn)稱均方(mean squareMS )指的是離均差平方和與自由度之間的比值。2、方差分析的基本思想:設(shè)處理因素有g(shù) ( g> 2)個(gè)不同的水平,實(shí)驗(yàn)對(duì)象隨機(jī)分為g組,分別接受不同水平的干預(yù)。方差分析的目的就是在H0:卩1=卩2=卩g成立的條件下,通過分析各處理均數(shù)之間的差別大小,推斷g各總體均數(shù)間有無差別。3、 方差分析的應(yīng)用條件為:各個(gè)樣本是相互獨(dú)立的隨機(jī)樣本,均來自于正態(tài)分布 總體;相互比較的各個(gè)樣本的總體方差相等,即具
22、有方差齊性。4、方差分析的變異分析:總變異的大小一一SS總:各個(gè)觀測(cè)值與總均數(shù)差值的平方和; 組間變異的大小一一 SS組間:各組均數(shù)與總均數(shù)的離均差平方和; 組內(nèi)變異的大小 SS組內(nèi):組內(nèi)個(gè)觀測(cè)值與其所在組的均數(shù)的差值的平方和。并有SS總=SS 組間 +SS 組內(nèi)由于組間與組內(nèi)的離均差平方和的自由度不同,因此單純的比較并無實(shí)際意義。MS組間=SS組間/v組間;MS組內(nèi)=SS組內(nèi)/v組內(nèi)5、完全隨機(jī)設(shè)計(jì)資料的方差分析:變異來源自由度MSF總變異N-1組間g-1MS組間MS組間/MS組內(nèi)組內(nèi)N-gMS組內(nèi)完全隨機(jī)設(shè)計(jì)資料:正態(tài)分布且方差齊:?jiǎn)我蛩胤讲罘治龀山Mt檢驗(yàn)(意義相同t2 =F)6、隨機(jī)區(qū)組
23、設(shè)計(jì)資料的方差分析:變異來源自由度MSF總變異N-1處理間g -1MS處理MS處理/ MS誤差區(qū)組間n -1MS區(qū)組MS區(qū)組/ MS誤差誤差(n -1)(g -1)MS誤差隨機(jī)區(qū)組設(shè)計(jì)資料:正態(tài)分布且方差齊:雙向分類的方差分析2配對(duì)t檢驗(yàn)(意義相同t =F)非正態(tài)分布或/和方差不齊:變量轉(zhuǎn)換t雙向分類的方差分析Friedman M 檢驗(yàn)初衷:考慮環(huán)境因素對(duì)實(shí)驗(yàn)結(jié)果的影響。7、拉丁方設(shè)計(jì)資料的方差分析:可多安排一個(gè)已知的對(duì)實(shí)驗(yàn)結(jié)果有影響的非處理因素,增加了均衡性,減少了誤差,提高了效率。完全隨機(jī)設(shè)計(jì)只涉及一個(gè)處理因素;隨機(jī)區(qū)組設(shè)計(jì)涉及一個(gè)處理因素、一個(gè)區(qū)組因素;如果實(shí)驗(yàn)研究涉及一個(gè)處理因素和兩個(gè)
24、控制因素,每個(gè)因素的類別數(shù)或水平數(shù)相 等,此時(shí)可采用拉丁方設(shè)計(jì)。變異來源自由度MSF總變異N-1處理組g -1MS處理MS處理/ MS誤差行區(qū)組g -1MS行MS行/ MS誤差列區(qū)組g -1MS列MS列/ MS誤差誤差(g -1)(g -2)MS誤差&兩階段交叉設(shè)計(jì)資料的方差分析該設(shè)計(jì)不僅平衡了處理順序的影響,而且能把處理方法間的差別、時(shí)間先后之間的 差別和實(shí)驗(yàn)對(duì)象之間的差別分開來分析。9、 多樣本均數(shù)間的多重比較方法:LSD-t檢驗(yàn)、Dunnett-t檢驗(yàn)、SNK-q檢驗(yàn)三種。10、 多樣本方差比較:Bartlett檢驗(yàn)、Levene檢驗(yàn)標(biāo)準(zhǔn)化率,需要作假設(shè)檢驗(yàn)。(但如果比較的兩者是
25、總體的參數(shù),則可進(jìn)行直接比較,無需進(jìn)行t、F檢驗(yàn))第五章 計(jì)數(shù)資料的統(tǒng)計(jì)描述1、基本概念: 、相對(duì)數(shù)(Relative number):是兩個(gè)有關(guān)聯(lián)的數(shù)據(jù)之比,用以說明事物的相對(duì) 關(guān)系,便于對(duì)比分析。常用的相對(duì)數(shù)指標(biāo)很多,按聯(lián)系的性質(zhì)和說明的問題不同,主要分為:率、構(gòu)成、 相對(duì)比三類。 、強(qiáng)度相對(duì)數(shù)-頻率(frequency):是最常見的一種相對(duì)數(shù),頻率在實(shí)踐中又稱 為比率(proportion )。它表示事物內(nèi)部某個(gè)組成部分所占的相對(duì)多少。 、結(jié)構(gòu)相對(duì)數(shù) 一構(gòu)成比(constituent ratio):說明某事物內(nèi)部各組成部分所占的比重或分布,又稱構(gòu)成比。構(gòu)成比可相加,和等于100%。 、優(yōu)
26、勢(shì)相對(duì)數(shù)-比(ratio):是指兩個(gè)有關(guān)聯(lián)的指標(biāo)A和B之比,簡(jiǎn)稱比。A和B可以是性質(zhì)相同,也可以是性質(zhì)不相同。通常以倍數(shù)或百分?jǐn)?shù)(%)表示。 、率的標(biāo)準(zhǔn)化法:指的是消除內(nèi)部構(gòu)成差別,使總體率能夠直接進(jìn)行比較的方法。采用統(tǒng)一標(biāo)準(zhǔn)調(diào)整后的率為標(biāo)準(zhǔn)化率,簡(jiǎn)稱為標(biāo)化率(sta ndardized rate)。標(biāo)準(zhǔn)化的基本思想:采用統(tǒng)一的 標(biāo)準(zhǔn)人口構(gòu)成”,以消除人口構(gòu)成不同對(duì)各組總率的影響,使算得的標(biāo)準(zhǔn)化率具有可比性。 、動(dòng)態(tài)數(shù)列(dynamic series):是按時(shí)間順序排列的統(tǒng)計(jì)指標(biāo)(可以為絕對(duì)數(shù), 相對(duì)數(shù)或平均數(shù)),用以觀察和比較該事物在時(shí)間上的變化和發(fā)展趨勢(shì)。分析動(dòng)態(tài)數(shù)列常用的指標(biāo)有:絕對(duì)增長(zhǎng)
27、量、發(fā)展速度與增長(zhǎng)速度、平均發(fā)展速度與 平均增長(zhǎng)速度。 、發(fā)展速度:表示報(bào)告期指標(biāo)的水平相當(dāng)于基線期(或前一期)指標(biāo)的百分之 多少或若干倍。 、增長(zhǎng)速度:表示的是凈增加速度,增長(zhǎng)速度=發(fā)展速度-(100% )。2、率的標(biāo)準(zhǔn)化的注意事項(xiàng): 標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)化率,已經(jīng)不再反映當(dāng)時(shí)當(dāng)?shù)氐膶?shí)際水平,它只是表示相互比 較的資料間的相對(duì)水平。 兩樣本標(biāo)準(zhǔn)化率是 樣本值,存在抽樣誤差。當(dāng)樣本含量較小時(shí),比較兩樣本的第六章幾種離散型變量的分布及其應(yīng)用連續(xù)型分布舉例:u分布、t分布和F分布;常用離散型分布:二項(xiàng)分布、Poisson分布、負(fù)二項(xiàng)分布。1、基本概念 、二項(xiàng)分布(binomial distributio
28、n):是指在只會(huì)產(chǎn)生兩種可能結(jié)果之一的n次獨(dú)立重復(fù)試驗(yàn)中,當(dāng)每次實(shí)驗(yàn)的“陽性”的概率n保持不變時(shí),出現(xiàn)“陽性”次數(shù)X=0,1,2n的一種概率分布。 、Poisson分布(Poisson distribution ):是二項(xiàng)分布的一種極端形式,指的是每次實(shí)驗(yàn)的“陽性”概率比較低的時(shí)候,出現(xiàn)陽性次數(shù)的相應(yīng)概率滿足以入為參數(shù)的XP(入)。2、二項(xiàng)分布的適用條件: 、每次試驗(yàn)只會(huì)發(fā)生兩種隊(duì)里的額可能結(jié)果之一,即分別發(fā)生兩種結(jié)果的概率之和很等于1; 、每次試驗(yàn)產(chǎn)生某種結(jié)果的概率固定不變; 、重復(fù)試驗(yàn)是相互獨(dú)立的,不相互影響。3、二項(xiàng)分布的性質(zhì) 、樣本率的標(biāo)準(zhǔn)差也稱為率的標(biāo)準(zhǔn)誤,可以用來描述樣本率的抽樣誤
29、差,率的標(biāo) 準(zhǔn)誤越小,則率的抽樣誤差就越小。 、當(dāng)n =0.5時(shí),二項(xiàng)分布圖形是對(duì)稱的,當(dāng)n工0.5時(shí),圖形是偏態(tài)的,隨著 n增大,圖形趨于對(duì)稱。當(dāng)n無窮時(shí),只要n不太靠近0或1,二項(xiàng)分布則近似正態(tài)分布。 、禾U用二項(xiàng)分布的性質(zhì),可進(jìn)行總體率的區(qū)間估計(jì)和差異推斷。(當(dāng)n< 50時(shí)可查表得到可信區(qū)間,50是可采用近似正態(tài)分布法)4、Poisson分布的適用條件:普通性:才充分小的觀測(cè)單位上X的取值最多為1;獨(dú)立增量性:重復(fù)實(shí)驗(yàn)室相互獨(dú)立的,不相互影響;平穩(wěn)性:每次試驗(yàn)陽性時(shí)間發(fā)生的概率都應(yīng)相同。5、Poisson分布的性質(zhì):學(xué)習(xí)必備_ 、總體均數(shù) 入與總體方差(T 2相等時(shí)Poisson分
30、布的重要特征; 、當(dāng)n很大,而n很小時(shí),且n n =入為常數(shù)時(shí),二項(xiàng)分布近似 Poisson分布; 、當(dāng)入增大時(shí),Poisson分布逐漸近似正態(tài)分布。一般而言,入> 20時(shí),Poisson分布資料可作為正態(tài)分布處理。 、Poisson分布具備可加性。6、Poisson分布的圖形特點(diǎn):當(dāng)入越小,分布就越偏態(tài);當(dāng) 入越大時(shí),Poisson分布則越漸近正態(tài)分布。當(dāng) 入w 1 時(shí),隨X取值的變大,P (X)值反而會(huì)變??;當(dāng) 入1時(shí),隨X取值的變大,P(X)值先增大后變小。第七章卡方檢驗(yàn)X 21、 X 2分布曲線的特點(diǎn): X 2分布曲線的形狀依賴于自由度的大小當(dāng)自由度w2時(shí),曲線呈L形;隨著自由度
31、的增加,曲線逐漸趨于對(duì)稱;當(dāng)自由度t無窮時(shí),x2分布趨近正態(tài)分布。2、x 2分布的基本性質(zhì):可加性;3、 x 2檢驗(yàn)的原理:通過實(shí)際頻數(shù)和理論頻數(shù)滿足f( x 2),來推斷實(shí)際頻數(shù)與理論 頻數(shù)的差異大小及有無統(tǒng)計(jì)學(xué)意義。4、幾種常見的資料類型: 、普通四格表:自由度 =(行數(shù)-1)(列數(shù)-1)X 2可使用四格表專用公式;X: n40且所有的T > 5 t使用基本公式;Pa時(shí),改用Fisher確切概率法;n > 40但有1 w T w 5 t四格表校正公式或者 Fisher確切概率法n v 40或T v 1 Fisher確切概率法 配對(duì)四格表資料:b+cv 40且1w T w 5要校
32、正;5、Fisher確切概率法思想:四格表資料周邊合計(jì)數(shù)不變的條件下,計(jì)算表內(nèi)4個(gè)實(shí)際頻數(shù)變動(dòng)時(shí)的各種組合之概率;再按照假設(shè)檢驗(yàn)用單側(cè)或雙側(cè)的累計(jì)概率依據(jù)所取得檢驗(yàn)水準(zhǔn)a做出推斷。6、行X列表資料使用范圍:多個(gè)樣本率的比較;樣本構(gòu)成比的比較;雙向無序分類資料的關(guān)聯(lián)性檢驗(yàn);7、多個(gè)樣本率的多重比較:歡迎下載多個(gè)實(shí)驗(yàn)組間的兩兩比較與實(shí)驗(yàn)組與同一對(duì)照組的比較均應(yīng)對(duì)a進(jìn)行校準(zhǔn),且方法相同。&擬合優(yōu)度檢驗(yàn):適用范圍:推斷某一現(xiàn)象的頻數(shù)分布是否符合某一理論分布;比較實(shí)際頻數(shù)與理論頻數(shù)的差異大小。第八章非參數(shù)檢驗(yàn)1、非參數(shù)檢驗(yàn)的適用范圍: 不滿足正態(tài)分布和方差齊性條件的計(jì)量資料; 對(duì)于分布不知道是否
33、正態(tài)的小樣本資料; 對(duì)于一端或兩端是不確定值得資料; 推斷等級(jí)資料的等級(jí)強(qiáng)度差別。2、主要數(shù)據(jù)資料類型: 配對(duì)樣本比較:(樣本量50時(shí)可以采用近似正態(tài)法作u檢驗(yàn))H0 :樣本總體中位數(shù)=人群總體中位數(shù);H1 :樣本總體中位數(shù)工人群總體中位數(shù)。 兩獨(dú)立樣本的比較:(n1> 10或n2-n1 > 10時(shí),令n1+ n2=N,作近似正態(tài)分布檢 驗(yàn))H0:兩樣本總體分布位置相同;H1:兩樣本總體分布位置不同。 完全隨機(jī)多個(gè)樣本:H0 :多個(gè)樣本總體分布位置相同;H1 :多個(gè)樣本總體分布位置不全相同。注意:當(dāng)完全隨機(jī)的多個(gè)樣本為兩個(gè)樣本時(shí),使用完全隨機(jī)多個(gè)樣本的檢驗(yàn)方法求得的統(tǒng)計(jì)值H (或H
34、C)與使用兩獨(dú)立樣本的 u檢驗(yàn)求得的u值等價(jià)。H=u2。第九章:雙變量回歸與相關(guān)1、直線回歸(linear regression):因變量Y隨著自變量X的變化而變化呈直線趨 勢(shì),但并非所有的對(duì)應(yīng)點(diǎn)恰好全都在一條直線上,稱為直線回歸或者簡(jiǎn)單回歸。注:a為常數(shù)項(xiàng),是回歸直線在 Y軸上的截距;b為回歸系數(shù)(coefficient of regression),為直線的斜率;其統(tǒng)計(jì)意義是當(dāng)X變化一個(gè)單位時(shí)Y的平均改變的估計(jì)值。直線回歸方程的求法基本原則: 最小二乘(least sum of square®將實(shí)測(cè)值與假定回歸線上的估計(jì)值的縱向距離稱為殘差(residual)或剩余值。為了使各點(diǎn)
35、殘差盡可能的小,考慮到所有點(diǎn)之殘差有正有負(fù),所以通常取各點(diǎn)殘差平方和最小的直線即為所求,如此得到的回歸系數(shù)最理想。統(tǒng)計(jì)推斷的檢驗(yàn):方差分析F檢驗(yàn)或者t檢驗(yàn)兩者等價(jià):t=F2b離0越遠(yuǎn),Y受X的影響越大, SS回就越大,回歸效果越好;SS殘?jiān)叫?,估?jì)誤差越小,回歸作用越明顯。2、 直線相關(guān)(linear correlation):兩個(gè)數(shù)值變量進(jìn)行比較時(shí),一個(gè)變量在增加或 者減少時(shí),另一個(gè)變量也表現(xiàn)為增加或者減少,這兩個(gè)變量之間的關(guān)系即為直線相 關(guān)。相關(guān)系數(shù)(correlation coefficient)又稱為pearson積差相關(guān)系數(shù),以符號(hào)r表示樣本相關(guān)系數(shù),符號(hào)p表示其總體相關(guān)系數(shù)。用來說
36、明具有直線關(guān)系的兩變量間相關(guān) 的密切程度與相關(guān)方向。相關(guān)系數(shù)的統(tǒng)計(jì)推斷:t檢驗(yàn)決定系數(shù)(coefficie nt of determ in ation ):為回歸平方和與總平方和之比。其數(shù)值大小反映了回歸貢獻(xiàn)的相對(duì)程度,也就是在Y的總變異中回歸關(guān)系所能解釋的百分比。3、殘差圖考察數(shù)據(jù)是否符合模型假設(shè)的基本要求: 、應(yīng)變量與自變量關(guān)系為線性; 、誤差服從均數(shù)為 0的正態(tài)分布; 、方差相等; 、各觀測(cè)對(duì)象獨(dú)立。4、直線回歸與直線相關(guān)的區(qū)別和共同點(diǎn)區(qū)別:相關(guān)系數(shù)無單位,回歸系數(shù)有單位; 相關(guān)表示相互關(guān)系,沒有依存關(guān)系,回歸有依存關(guān)系; 兩者對(duì)資料的要求不同:當(dāng)X和Y都是隨機(jī)的,可以進(jìn)行相關(guān)和回歸分析
37、;當(dāng)Y是隨機(jī)變量,X是控制變量時(shí),理論上只能做回歸分析。聯(lián)系:均表示線性關(guān)系; 符號(hào)相同,共變方向一致; 假設(shè)檢驗(yàn)結(jié)果相同;(tr=tb) 可以互相換算(數(shù)值的相同不代表意義的相同)第十二章重復(fù)測(cè)量設(shè)計(jì)資料的方差分析1、重復(fù)測(cè)量設(shè)計(jì)資料的數(shù)據(jù)特征: 、未設(shè)立平行對(duì)照的前后測(cè)量設(shè)計(jì):(重復(fù)測(cè)量資料最常見的情況是前后測(cè)量設(shè)計(jì))前后測(cè)量設(shè)計(jì)與配對(duì)設(shè)計(jì) t檢驗(yàn)的區(qū)別:a、 配對(duì)設(shè)計(jì)中同一對(duì)子的兩個(gè)實(shí)驗(yàn)單位可以隨機(jī)分配處理,兩個(gè)實(shí)驗(yàn)單位同期觀 察實(shí)驗(yàn)結(jié)果,可以比較處理組間差別;前后測(cè)量設(shè)計(jì)不能同期觀察實(shí)驗(yàn)結(jié)果,雖然可以在前后測(cè)量之間安排處理,但本質(zhì)上比較的是前后差別,推論處理是否有效是有條件的,即假定測(cè)
38、量時(shí)間對(duì)觀察結(jié)果沒有影響。b、配對(duì)t檢驗(yàn)要求同一對(duì)子的兩個(gè)實(shí)驗(yàn)單位的觀察結(jié)果分別是差值相互獨(dú)立,差值服從正態(tài)分布。而前后測(cè)量設(shè)計(jì)前后兩次觀察結(jié)果通常與差值不獨(dú)立,大多數(shù)情況第一次觀察結(jié)果與差值存在負(fù)相關(guān)的關(guān)系。c、配對(duì)設(shè)計(jì)用平均差值推論處理的作用,前后測(cè)量設(shè)計(jì)出了分析平均差值外,還 可進(jìn)行相關(guān)分析。 、設(shè)立平行對(duì)照的前后測(cè)量設(shè)計(jì):雖然分為處理組和對(duì)照組,但是不能進(jìn)行差值均數(shù)t檢驗(yàn),因?yàn)橥ǔ山M差值的方差不會(huì)相等。 、重復(fù)測(cè)量設(shè)計(jì):重復(fù)測(cè)量數(shù)據(jù)與隨機(jī)區(qū)組設(shè)計(jì)數(shù)據(jù)相似,兩者的差別是:a、重復(fù)測(cè)量設(shè)計(jì)中處理是在區(qū)組間隨機(jī)分配,區(qū)組內(nèi)的各時(shí)間點(diǎn)是固定的,不能隨機(jī)分配;隨機(jī)區(qū)組設(shè)計(jì)則要求每個(gè)區(qū)組內(nèi)實(shí)驗(yàn)單
39、位彼此獨(dú)立,處理只能在區(qū)組內(nèi)隨機(jī)分配,每個(gè)實(shí)驗(yàn)單位接受的處理是不相同的。b、重復(fù)測(cè)量設(shè)計(jì)區(qū)組內(nèi)實(shí)驗(yàn)單位彼此不獨(dú)立,而隨機(jī)區(qū)組內(nèi)實(shí)驗(yàn)單位彼此獨(dú)立, 如果按照隨機(jī)區(qū)組進(jìn)行 t檢驗(yàn)則要求進(jìn)行統(tǒng)計(jì)值的校正。第十五章多元線性回歸資料的分析適用范圍:分析一個(gè)應(yīng)變量與多個(gè)自變量之間的線性關(guān)系;1、 多元線性回歸模型的一般形式:Y 3 0+ 3 1X1+ 3 2X2+ 3 mXm+ea偏回歸系數(shù)3 j的意義:表示在其他自變量保持不變的時(shí)候,Xj增加或減少一個(gè)單位時(shí)Y的平均變化量。b、偏回歸分布的應(yīng)用條件: 、Y與各個(gè)變量之間有線性關(guān)系; 、各例觀測(cè)值Yi相互獨(dú)立; 、殘差e服從均數(shù)為0,方差為S 2的正態(tài)分布
40、。(等價(jià)于對(duì)任意一組自變量 X1、X2Xm值,應(yīng)變量Y具有相同方差,并且服從正態(tài)分布)c、參數(shù)的計(jì)算方法:最小二乘法2、 多元線性 回歸方程 的假設(shè)檢驗(yàn)及其評(píng)價(jià):(對(duì)整體的假設(shè)檢驗(yàn))A、 可以將回歸方程中所有的自變量作為一個(gè)整體來檢驗(yàn)它們與應(yīng)變量 Y之間是否 具有線性關(guān)系。假設(shè)檢驗(yàn)方法:方差分析法:H0: 3仁3 2= = 3 m=0 ; H1 :各3 j不全為0.若拒絕H0,接受H1,即可確定所擬合的回歸方程有統(tǒng)計(jì)學(xué)意義。1) 決定系數(shù)R2 :即為偏回歸平方和與殘差平方和的比值,其值越接近1,說明擬 合程度越好。2)復(fù)相關(guān)系數(shù):決定系數(shù)開根號(hào),可用來度量應(yīng)變量與多個(gè)自變量之間的線性相 關(guān)程度
41、。B、各自變量的假設(shè)檢驗(yàn): 、使用方法為偏回歸平方和(SS回(Xj):表示在m-1個(gè)自變量的基礎(chǔ)上新增加Xj所引起的回歸平方和的增加量。其值越大,說明Xj越重要。偏回歸平方和檢驗(yàn): H0: 3 j=0;H1 : 3 j豐0注意:?jiǎn)为?dú)分析各個(gè)變量的偏回歸平方和,所有值的和小于總的回歸平方和,其原 因是忽略了各個(gè)變量之間的相互作用成分。 、t檢驗(yàn)法:對(duì)于同一資料,不同自變量的t值間可以相互比較,t的絕對(duì)值越大, 說明該自變量對(duì)Y的回歸所起的作用越大。 標(biāo)準(zhǔn)化回歸系數(shù):減少自變量觀測(cè)單位不同對(duì)結(jié)果的影響。在有統(tǒng)計(jì)學(xué)意義的前提下,標(biāo)準(zhǔn)化回歸系數(shù)的絕對(duì)值越大說明相應(yīng)自變量對(duì)Y的作用越大。3、自變量選擇方
42、法:A、全局擇優(yōu)法: 、校正決定系數(shù) Rc選擇法(當(dāng)R2相同時(shí),自變量個(gè)數(shù)越多,Rc越小,最優(yōu)為Rc最大) 、Cp選擇法:應(yīng)選擇 Cp最接近p+1的回歸方程為最優(yōu)方程。B、逐步選擇法: 、前進(jìn)法:(只選不剔)在有統(tǒng)計(jì)學(xué)意義的前提下,選取偏回歸平方和最大的一 個(gè)自變量做F檢驗(yàn)以決定是否選入。 、后退法:(只剔不選)選取回歸平方和最小的一個(gè)自變量做F檢驗(yàn)以決定是否剔除。 、逐步回歸法:先選后剔,雙向篩選。本質(zhì)上是前進(jìn)法,但每引入一個(gè)自變量進(jìn)入方程后,要對(duì)方程中的每一個(gè)自變量做基于偏回歸平方和的F檢驗(yàn),看是否需要剔除一些退化為不顯著的自變量。注意:為了避免已經(jīng)剔除的自變量再次入選,選入自變量的檢驗(yàn)水
43、準(zhǔn)要小于或等于剔除自變量的檢驗(yàn)水準(zhǔn)。第十六章logistic回歸分析logistic回歸(logistic regression )屬于概率型非線性回歸。 適用對(duì)象:二分類或多分類影響因素之間的關(guān)系。1、 表示方法:陽性概率 P=1/1+exp(-Z) Z= 3 0+ 3 1X1+ 3 2X2+ + 3 mXmP 的 logit 轉(zhuǎn)換:logit P=ln(p/1-p)= 3 0+ 3 1X1+ 3 2X2+ 3 mXm回歸系數(shù)3 j表示自變量Xj改變一個(gè)單位時(shí)logit P的該變量。2、模型參數(shù)的意義: 、確定優(yōu)勢(shì)比(odds ratio, OR)衡量危險(xiǎn)因素作用大小的比數(shù)比例OR適用于分類
44、指標(biāo)而不適用于計(jì)量指標(biāo);多變量調(diào)整后的優(yōu)勢(shì)比(adjust odds ratio) ORj:表示扣除了其他自變量影響 后危險(xiǎn)因素的作用。用來對(duì)比某一危險(xiǎn)因素兩個(gè)不同暴露水平Xj=c1和Xj=c0之間的發(fā)病情況。1)3 j=0時(shí),0Rj=1,說明因素Xj對(duì)疾病的發(fā)生不起作用;2)3 j > 0時(shí),ORj > 1,說明因素Xj對(duì)疾病發(fā)生起危險(xiǎn)作用;3)3 j V 0時(shí),ORj V 1,說明因素Xj時(shí)一個(gè)保護(hù)因子。 、確定相對(duì)危險(xiǎn)度(relative risk , RR)學(xué)習(xí)必備_對(duì)于發(fā)病率很低的疾病存在優(yōu)勢(shì)比即等于兩種暴露水平之間的相對(duì)危險(xiǎn)度。2、logistic回歸方程的參數(shù)估計(jì):
45、主要方法有最大似然估計(jì)法(maximum likelihood estimate , MLE )和優(yōu)勢(shì)比估計(jì)法。3> logistic回歸的適用對(duì)象: 、比較各暴露因素的致病風(fēng)險(xiǎn)的大??; 、多因素的共同作用的評(píng)價(jià); 、危險(xiǎn)因素的篩選:多經(jīng)文獻(xiàn)報(bào)道選取,但統(tǒng)計(jì)學(xué)資料不能代替專業(yè)依據(jù)4、logistic回歸模型的假設(shè)檢驗(yàn):常用的檢驗(yàn)方法有似然比檢驗(yàn)(likelihood ratio test )、Wald檢驗(yàn)和計(jì)分檢驗(yàn)(score test)統(tǒng)計(jì)量為卡方值logistic回歸模型變量的篩選與多元線性回歸相同。第十七章生存分析1、生存分析資料與一般資料比較的不同: 、同時(shí)考慮生存時(shí)間和生存結(jié)局; 、通常含有刪失數(shù)據(jù); 、生存時(shí)間的分布通常不服從正態(tài)分布。2、概念:生存時(shí)間(survival time),從起始事件到終點(diǎn)事之間所經(jīng)歷的時(shí)間跨度。完全數(shù)據(jù)(complete data),在追蹤觀察中,當(dāng)觀察到了某觀察對(duì)象的明確結(jié)局時(shí), 該觀察對(duì)象所提供的關(guān)于生存時(shí)間的信息是完整的,這種生存時(shí)間數(shù)據(jù)稱為完全數(shù)據(jù)。不完全數(shù)據(jù)(incomplete data),在實(shí)際追蹤觀察中,由于某種原因無法知道觀察 對(duì)象的確切生存時(shí)間,這種生存時(shí)間數(shù)據(jù)也稱為截尾數(shù)據(jù)。生存率(survival rate)是指病人經(jīng)歷給定的時(shí)間之后仍存活的概率,若有截尾數(shù) 據(jù),應(yīng)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 買房有物業(yè)合同范本
- bt合同ppp合同范本
- 企業(yè)人事聘用合同范本
- 出租保安服裝合同范本
- 單位購(gòu)儀器合同范本
- 先打款后開票合同范本
- 協(xié)議付款合同范例
- 上門宴席服務(wù)合同范本
- 東莞企業(yè)勞務(wù)合同范本
- 兒童游泳班合同范本
- 2025年企業(yè)法務(wù)顧問聘用協(xié)議范本
- 教育部人文社科 申請(qǐng)書
- 無菌手術(shù)臺(tái)鋪置的細(xì)節(jié)管理
- 《康復(fù)評(píng)定技術(shù)》課件-第五章 運(yùn)動(dòng)控制
- 議論文8(試題+審題+范文+點(diǎn)評(píng)+素材)-2025年高考語文寫作復(fù)習(xí)
- 【理特咨詢】2024生成式人工智能GenAI在生物醫(yī)藥大健康行業(yè)應(yīng)用進(jìn)展報(bào)告
- 2025新人教版英語七年級(jí)下單詞默寫表(小學(xué)部分)
- 2025年春新外研版(三起)英語三年級(jí)下冊(cè)課件 Unit6第1課時(shí)Startup
- 2025江蘇蘇州高新區(qū)獅山商務(wù)創(chuàng)新區(qū)下屬國(guó)企業(yè)招聘9人高頻重點(diǎn)提升(共500題)附帶答案詳解
- 《蒙牛集團(tuán)實(shí)施財(cái)務(wù)共享過程中存在的問題及優(yōu)化建議探析》8800字(論文)
- 平拋運(yùn)動(dòng)的經(jīng)典例題
評(píng)論
0/150
提交評(píng)論