復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件

上傳人：h*** IP屬地：貴州上傳時(shí)間：2022-12-12 格式：PPT 頁數(shù)：92 大?。?.44MB 積分：25 舉報(bào) 版權(quán)申訴

復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件_第2頁

復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件_第3頁

復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件_第4頁

復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件_第5頁

已閱讀5頁，還剩87頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

復(fù)雜疾病的遺傳學(xué)研究

研究設(shè)計(jì)與統(tǒng)計(jì)分析方法北京大學(xué)公共衛(wèi)生學(xué)院流行病學(xué)與衛(wèi)生統(tǒng)計(jì)學(xué)系陳大方教授

復(fù)雜疾病的遺傳學(xué)研究

研究設(shè)計(jì)與統(tǒng)計(jì)分析方法北京大學(xué)公共衛(wèi)生內(nèi)容

概述研究設(shè)計(jì)方法統(tǒng)計(jì)分析方法分析實(shí)例

內(nèi)容概述概述概述疾病的分類

隨著人類基因組計(jì)劃的完成和后基因組計(jì)劃的開展，人們對(duì)于疾病的認(rèn)識(shí)也越來越深入。已有的研究結(jié)果發(fā)現(xiàn)人類疾病都與基因受損有關(guān)，因此提出了基因病-人類疾病的新概念。由此提出將人類疾病分為三種類型。

第一類是單基因病。僅由單個(gè)基因DNA序列某個(gè)堿基對(duì)的改變就造成疾病，并且可以把這樣的改變傳遞給后代。如血友病A、白化病等。疾病的分類隨著人類基因組計(jì)劃的完

第二類是多基因?。◤?fù)雜性疾?。?。這類疾病的發(fā)生涉及兩個(gè)以上基因的結(jié)構(gòu)或表達(dá)調(diào)控的改變，主要指慢性非傳染性疾病，如腫瘤、高血壓、冠心病、糖尿病、哮喘病、骨質(zhì)疏松癥、神經(jīng)性疾病、原發(fā)性癲癇等。

第三類為獲得性基因病。主要是傳染病由病原微生物通過感染將其基因入侵到宿主基因引起。如HIV。第二類是多基因?。◤?fù)雜性疾?。?。這類復(fù)雜性疾病的特征GeneticHeterogeneity（遺傳異質(zhì)性）Gene-GeneandGene-EnvironmentInteraction（基因基因，基因環(huán)境的交互作用)IncompletePenetrance（不完全外顯性）Phenocopy（擬表型）Pleiotropy（多效性）復(fù)雜性疾病的特征GeneticHeterogeneity（研究設(shè)計(jì)方法研究設(shè)計(jì)方法患病家系成員設(shè)計(jì)患病家系成員設(shè)計(jì)優(yōu)點(diǎn):具有明顯的孟德爾遺傳特點(diǎn)。遺傳方式確定（常顯、常隱或X連鎖）。缺點(diǎn):如果指定的遺傳方式不正確，可能導(dǎo)致錯(cuò)誤的結(jié)論。難以收集到家系全部人員。患病家系成員設(shè)計(jì)優(yōu)點(diǎn):患病家系成員設(shè)計(jì)患病同胞對(duì)設(shè)計(jì)患病同胞對(duì)表型不一致同胞對(duì)患病同胞對(duì)設(shè)計(jì)患病同胞對(duì)表型不一致同胞對(duì)患病同胞對(duì)設(shè)計(jì)優(yōu)點(diǎn):可以進(jìn)行非參數(shù)統(tǒng)計(jì)分析。研究對(duì)象相對(duì)容易收集。缺點(diǎn):檢驗(yàn)效能相對(duì)較低樣本量要求較大患病同胞對(duì)設(shè)計(jì)優(yōu)點(diǎn):患病先證者核心家系設(shè)計(jì)患病先證者核心家系設(shè)計(jì)優(yōu)點(diǎn):可以進(jìn)行非參數(shù)統(tǒng)計(jì)分析。研究對(duì)象相對(duì)容易收集。缺點(diǎn):統(tǒng)計(jì)分析時(shí)僅僅雜合子的雙親可以有效利用。對(duì)于遲發(fā)性疾病難以收集到雙親資料?；疾∠茸C者核心家系設(shè)計(jì)優(yōu)點(diǎn):患病先證者核心家系設(shè)計(jì)雙生子研究設(shè)計(jì)通過比較在相似或不同環(huán)境中成長(zhǎng)起來的同卵雙生子及異卵雙生子某一疾病或性狀發(fā)生的一致性，來判斷遺傳與環(huán)境因素的作用。養(yǎng)子研究設(shè)計(jì)通過比較、分析養(yǎng)子與其同胞及生身父母某疾病或性狀的相似性和與其寄養(yǎng)同胞或養(yǎng)父母的相似性，研究在某種疾病或性狀發(fā)生中遺傳因素與環(huán)境因素相對(duì)作用的大小。家系研究中其它研究設(shè)計(jì)方法雙生子研究設(shè)計(jì)家系研究中其它研究設(shè)計(jì)方法半同胞研究設(shè)計(jì)是指同父異母或同母異父的兄弟姐妹。根據(jù)半同胞中所研究疾病的患病情況，可分析疾病或遺傳性狀來自父方或母方。半同胞研究設(shè)計(jì)病例對(duì)照研究設(shè)計(jì)病例對(duì)照研究設(shè)計(jì)優(yōu)點(diǎn):相對(duì)容易收集到資料。投入少，產(chǎn)出高。缺點(diǎn):由于存在連鎖不平衡和種群分層，容易導(dǎo)致假陽性或假陰性。病例對(duì)照研究設(shè)計(jì)優(yōu)點(diǎn):病例對(duì)照研究設(shè)計(jì)背景1994年P(guān)iegorseh、Begs等提出

遺傳與環(huán)境的關(guān)系交互作用單純病例研究

應(yīng)用前提條件

在正常人群中基因型與環(huán)境暴露各自獨(dú)立發(fā)生，所研究疾病為罕見病。衍生的研究設(shè)計(jì)方法

背景單純病例研究應(yīng)用前提條件衍生的研究設(shè)計(jì)方法研究示意圖單純病例研究環(huán)境暴露基因型病人+-+-+-研究示意圖單純病例研究環(huán)境暴露基因型病人+-+-+-統(tǒng)計(jì)分析方法

統(tǒng)計(jì)分析方法表型與基因型常規(guī)統(tǒng)計(jì)分析病例-父母三結(jié)構(gòu)資料的TDT分析同胞數(shù)據(jù)SDT分析以家系為基礎(chǔ)的關(guān)聯(lián)分析(FBAT)交互作用分析連鎖分析單體型分析全基因組關(guān)聯(lián)分析……統(tǒng)計(jì)分析方法表型與基因型常規(guī)統(tǒng)計(jì)分析統(tǒng)計(jì)分析方法

分析基因型與表型的關(guān)系，也就是比較不同基因型的研究對(duì)象的表型是否存在差異，如基因型不同，表型也顯著不同，則表示兩者有關(guān)。表型為連續(xù)型變量的基因型之間比較可用t-檢驗(yàn)、方差分析、GEE等統(tǒng)計(jì)方法。表型為分類型變量的基因型之間比較可用卡方檢驗(yàn)、GEE等統(tǒng)計(jì)方法。表型與基因型常規(guī)統(tǒng)計(jì)分析分析基因型與表型的關(guān)系，也就是比交互作用的統(tǒng)計(jì)方法包括參數(shù)法和非參數(shù)法。參數(shù)法線性回歸和Logistic回歸模型。

非參數(shù)法（主要是數(shù)據(jù)挖掘方法）。(1)降維法；多因子降維法。(2)基于樹的方法；分類回歸樹和隨機(jī)森林法。(3)模式識(shí)別法；包括神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)。(4)貝葉斯法：貝葉斯上位效應(yīng)關(guān)聯(lián)圖譜。

參數(shù)法和非參數(shù)法分析交互作用時(shí)各有優(yōu)缺點(diǎn);低維數(shù)據(jù)的分析可采用參數(shù)法和非參數(shù)法,高維數(shù)據(jù)的分析則主要采用非參數(shù)法，交互作用的統(tǒng)計(jì)分析方法交互作用的統(tǒng)計(jì)方法包括參數(shù)法和非參數(shù)法。交互作用的統(tǒng)計(jì)分析方

以吸煙與飲酒兩個(gè)兩分類變量為例，它們有四種可能的組合（如下表）:不飲酒飲酒不吸煙β0β0+βa吸煙β0+βsβ0+βa+βs+βsa我們可以形成一個(gè)四分類的變量，再用四個(gè)二分類變量X00、X01、X10、X11指示這四組，形成回歸方程：回歸分析法以吸煙與飲酒兩個(gè)兩分類變量為例，它們方程I：f(Y)=β0+β1X10+β2X01+β3X11β1是吸煙不飲酒組與不吸煙不飲酒組的差，β2是不吸煙但飲酒組與不吸煙不飲酒組的差，β3是吸煙又飲酒組與不吸煙不飲酒組的差。方程II：f(Y)=β0+βaalcohol+βssmoke+βsasmoke*alcohol回歸系數(shù)的βs不能簡(jiǎn)單地解釋為吸煙的作用，而應(yīng)確切地說是對(duì)不飲酒者吸煙的作用（等于方程I的β1）。βa不能簡(jiǎn)單地解釋為飲酒的作用，而應(yīng)確切地說是對(duì)不吸煙者飲酒的作用（等于方程I的β2），因?yàn)棣聅、βa、β0三者間有相互依賴的關(guān)系?；貧w分析法方程I：f(Y)=β0+β1X10+β2X01+β3X11方程I與方程II是等同的，方程I中的β3

等于方程II中的βa+βs+βsa

。方程I和II都有3個(gè)自變量(自由度)，都沒有假定βsa等于零，又稱為飽和（Saturated）模型。從方程II中我們可以觀察βsa是否顯著。如果我們假定吸煙與飲酒無交互作用，βsa等于零，則方程II變?yōu)椋悍匠蘄II：f(Y)=β0+βaalcohol+βssmoke只用βa、βs來擬合這四組，如果得到的似然數(shù)與方程I（II）沒有顯著差別，表明βsa是多余的，或者說βsa與零無顯著性差異，吸煙與飲酒對(duì)f(Y)無交互作用。反之，吸煙與飲酒對(duì)f(Y)有交互作用?；貧w分析法方程I與方程II是等同的，方程I中的β3等于方程II中的β上面講了交互作用的兩種檢驗(yàn)方法：方法I：模型中乘積項(xiàng)回歸系數(shù)的檢驗(yàn)（又稱WALDTEST）。如上例βsa的檢驗(yàn)，如顯著表示有交互作用；方法II：似然比檢驗(yàn)（Loglikelihoodratiotest），具體方法為：計(jì)算卡方值：X2=2*（LL1-LL2）。如上例，LL1表示從方程I（或II）得出的似然對(duì)數(shù)；LL2表示從方程III得出的似然對(duì)數(shù)。計(jì)算自由度差。如上例，方程I（或II）有3個(gè)自變量，方程III只有2個(gè)自變量，差為1。按卡方檢驗(yàn)，得出P值。一般來說，似然比檢驗(yàn)效率高于回歸系數(shù)的檢驗(yàn)?；貧w分析法上面講了交互作用的兩種檢驗(yàn)方法：回歸分析法優(yōu)點(diǎn):(1)分析某個(gè)自變量的效應(yīng)時(shí),可以同時(shí)控制多個(gè)協(xié)變量的影響;(2)可以處理自變量對(duì)因變量的非線性效應(yīng);(3)可以在模型中引入交互作用項(xiàng);(4)回歸系數(shù)的可解釋性。缺點(diǎn):(1)維度困擾的問題。維度困擾是指樣本量有限而自變量較多(高維數(shù)據(jù))時(shí),分析交互作用時(shí)會(huì)使得觀測(cè)數(shù)相對(duì)于自變量數(shù)過少,數(shù)據(jù)分布在高維稀疏的列聯(lián)表中,此時(shí)維度困擾的問題會(huì)導(dǎo)致Logistic回歸模型中參數(shù)估計(jì)的錯(cuò)誤,或使回歸系數(shù)的標(biāo)準(zhǔn)誤過大,從而導(dǎo)致I類錯(cuò)誤或II類錯(cuò)誤增加。(2)自變量之間的相關(guān)性會(huì)導(dǎo)致不同的建模策略(前進(jìn)法或后退法),并得到不同的結(jié)果。(3)Logistic回歸不能很好地解決遺傳異質(zhì)性的問題。Logistic回歸分析優(yōu)點(diǎn):(1)分析某個(gè)自變量的效應(yīng)時(shí),可以同時(shí)控制多個(gè)協(xié)多因子降維法

多因子降維法（multifactordimensionalityreduction,MDR）是2001年發(fā)展出的一種非參數(shù)、無需遺傳模式的高階交互作用分析方法，在2007年又提出了一種基于MDR基本原理的擴(kuò)展方法——廣義多因子降維法(generalizedmultifactordimensionalityreduction，GMDR)，又稱基于計(jì)分的多因子降維法(score-basedMDR)。該法可以通過將廣義線性模型的概念引人到MDR中，使其不但能夠分析連續(xù)變量，且能夠納入?yún)f(xié)變量，從而控制協(xié)變量引起的干擾，提高預(yù)測(cè)的準(zhǔn)確度。其主要特點(diǎn)：①分析的基因表型和校正因素不限于離散型變量，也可以是連續(xù)型變量；②可應(yīng)用于多種數(shù)據(jù)結(jié)構(gòu)(病例對(duì)照資料、人群隨機(jī)抽樣樣本或其他類型樣本)；③結(jié)合GMDRsoftware軟件，可識(shí)別多個(gè)位點(diǎn)或環(huán)境因素之間的交互作用。

多因子降維法多因子降維法（mult基本原理GMDR是對(duì)原始MDR的擴(kuò)展，其基本原理包括計(jì)分統(tǒng)計(jì)量(scorestatistic)和交叉驗(yàn)證(crossvalidation）。計(jì)分統(tǒng)計(jì)量：通過計(jì)算每個(gè)個(gè)體的計(jì)分統(tǒng)計(jì)量均值是否超過某個(gè)設(shè)定標(biāo)準(zhǔn)(例如大于或等于1)，分別標(biāo)記為“高危”或“低?！保瑔卧褚虼吮环譃?類，形成一維兩水平的模型。交叉驗(yàn)證（Crossvalidation）：隨機(jī)方式產(chǎn)生十等份幾乎相同的數(shù)據(jù)子集，每次用十份中的九份作為訓(xùn)練樣本，另一份稱為留存數(shù)據(jù)（held-outdata）作為測(cè)試樣本，當(dāng)十次全部完成后再將十次所得的平均絕對(duì)誤差求均值，即為研究的預(yù)測(cè)誤差。基本原理復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件GMDR軟件：目前最新的GMDR軟件(版本beta0．7)是基于Java程序編寫的源代碼開放的免費(fèi)軟件,/intemet/addiction.genomics/Software/免費(fèi)下載).文件類型：GMDR能夠識(shí)別的文件包括三種，分別為標(biāo)記文件(markerfile)，協(xié)變量與表型文件(covariate&phenotypefile)以及計(jì)分文件(scorefile)。三者均為文本文件。結(jié)果輸出:每個(gè)單元格的顏色由單元格的計(jì)分決定，藍(lán)色為計(jì)分超過設(shè)定值，黃色為未超過設(shè)定值，白色表示單元格內(nèi)沒有數(shù)據(jù)。單元格中的左側(cè)條帶表示正計(jì)分之和，右側(cè)條帶表示負(fù)計(jì)分之和。GMDR軟件：目前最新的GMDR軟件(版本beta0．7)優(yōu)點(diǎn):(1)在單個(gè)SNP位點(diǎn)缺乏主效應(yīng)時(shí),可以同時(shí)檢測(cè)位點(diǎn)間的交互作用;(2)將研究中的多因子組合以疾病易感性的方式分為高危和低危,把高維結(jié)構(gòu)降低到一維兩水平,降低了建模所需的自由度,從而可以分析多個(gè)位點(diǎn)間的高階交互作用；(3)GMDR能有效識(shí)別無主效應(yīng)但具有交互作用的功能性SNP位點(diǎn);存在5%以下的基因分型錯(cuò)誤和5%的缺失數(shù)據(jù)時(shí),對(duì)降低GMDR的檢驗(yàn)效能影響很小,說明GMDR具有一定的穩(wěn)健性。缺點(diǎn):(1)如果使用窮盡搜索的方式檢測(cè)最佳n因子組合,由于該搜索方式非常耗時(shí),GMDR只能用于分析中小規(guī)模預(yù)測(cè)變量數(shù)的交互作用,而不能用于處理大規(guī)模數(shù)據(jù)(如全基因組關(guān)聯(lián)研究的多個(gè)位點(diǎn))。(2)當(dāng)數(shù)據(jù)中存在遺傳異質(zhì)性和擬表型時(shí),GMDR的檢驗(yàn)效能大大降低

。(3)GMDR將基因型組合簡(jiǎn)單地根據(jù)病例與對(duì)照的比值分為高風(fēng)險(xiǎn)組和低風(fēng)險(xiǎn)組,當(dāng)某種組合中病例數(shù)和對(duì)照數(shù)的比值接近于全部觀測(cè)數(shù)據(jù)中的比值,或者該組合中病例數(shù)和對(duì)照數(shù)都很少時(shí),GMDR很容易發(fā)生分類錯(cuò)誤,導(dǎo)致假陽性率或假陰性率增高;另外,有些n因子組合的n維列聯(lián)表的觀測(cè)數(shù)可能為零,此時(shí)就很難準(zhǔn)確地將該組合歸類為高風(fēng)險(xiǎn)組或是低風(fēng)險(xiǎn)組。GMDR分析優(yōu)點(diǎn):(1)在單個(gè)SNP位點(diǎn)缺乏主效應(yīng)時(shí),可以同時(shí)檢測(cè)

FBAT既適應(yīng)于定性資料又適應(yīng)于定量資料，并且可以先對(duì)表型變量經(jīng)有關(guān)混雜因素進(jìn)行調(diào)整，將調(diào)整后的殘差值或校正值放入FBAT程序中進(jìn)行分析，這樣得到的結(jié)果就是經(jīng)過混雜因素調(diào)整后的關(guān)聯(lián)分析的結(jié)果。FBAT適用于各種類型的家系結(jié)構(gòu)。有父母雙親、只有單親、雙親均無、一個(gè)同胞、多個(gè)同胞的家系都可混合在一起應(yīng)用，有效避免人群分層影響。軟件：/fbat/default.htmlFBAT分析(Family-BasedAssociationTest)FBAT分析原理：FBAT以核心家系為單位計(jì)算每個(gè)核心家系數(shù)的基因型（X）的分布概率與統(tǒng)計(jì)量“S”（統(tǒng)計(jì)量S是表型T與基因型X的乘積），然后累加各核心家系的統(tǒng)計(jì)量S及S的方差與協(xié)方差，進(jìn)行卡方檢驗(yàn)。#fmy：進(jìn)入分析的核心家系數(shù)。S：表示實(shí)際觀察值，S＝X*G，X表示表型值，G表示基因型。即S等于表型值與基因型的乘積。E(s)：表示期望值，E(s)＝E(x)*G,E(x)表示期望的表型值，G表示基因型。即E(x)等于期望的表型值與基因型的乘積。Var(s):表示S的變異Z：表示FBAT的統(tǒng)計(jì)值，Z＝S-E(S)/[Var(s)]2,由此來判斷P值的大小。P：表示統(tǒng)計(jì)概率，以P<0.05的水平來判斷是統(tǒng)計(jì)結(jié)果否具有顯著性。原理：FBAT以核心家系為單位計(jì)算每個(gè)核心家系數(shù)的基因型（X分析實(shí)例分析實(shí)例PharmacogeneticsandGenomics2009,19:345–352Gene–geneinteractionsofCYP2A6andMAOApolymorphismsonsmokingbehaviorinChinesemalepopulation交互作用分析實(shí)例PharmacogeneticsandGenomics復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件北京大學(xué)學(xué)報(bào)（醫(yī)學(xué)版）2003：35（4）:377－381Tumornecrosisfactor-alphageneG308ApolymorphismisassociatedwiththeriskofpretermdeliveryFBAT分析實(shí)例北京大學(xué)學(xué)報(bào)（醫(yī)學(xué)版）2003：35（4）:377－381T復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件謝謝謝謝復(fù)雜疾病的遺傳學(xué)研究

研究設(shè)計(jì)與統(tǒng)計(jì)分析方法北京大學(xué)公共衛(wèi)生學(xué)院流行病學(xué)與衛(wèi)生統(tǒng)計(jì)學(xué)系陳大方教授

復(fù)雜疾病的遺傳學(xué)研究

研究設(shè)計(jì)與統(tǒng)計(jì)分析方法北京大學(xué)公共衛(wèi)生內(nèi)容

概述研究設(shè)計(jì)方法統(tǒng)計(jì)分析方法分析實(shí)例

內(nèi)容概述概述概述疾病的分類

第二類是多基因?。◤?fù)雜性疾病）。這類疾病的發(fā)生涉及兩個(gè)以上基因的結(jié)構(gòu)或表達(dá)調(diào)控的改變，主要指慢性非傳染性疾病，如腫瘤、高血壓、冠心病、糖尿病、哮喘病、骨質(zhì)疏松癥、神經(jīng)性疾病、原發(fā)性癲癇等。

第三類為獲得性基因病。主要是傳染病由病原微生物通過感染將其基因入侵到宿主基因引起。如HIV。第二類是多基因?。◤?fù)雜性疾?。＿@類復(fù)雜性疾病的特征GeneticHeterogeneity（遺傳異質(zhì)性）Gene-GeneandGene-EnvironmentInteraction（基因基因，基因環(huán)境的交互作用)IncompletePenetrance（不完全外顯性）Phenocopy（擬表型）Pleiotropy（多效性）復(fù)雜性疾病的特征GeneticHeterogeneity（研究設(shè)計(jì)方法研究設(shè)計(jì)方法患病家系成員設(shè)計(jì)患病家系成員設(shè)計(jì)優(yōu)點(diǎn):具有明顯的孟德爾遺傳特點(diǎn)。遺傳方式確定（常顯、常隱或X連鎖）。缺點(diǎn):如果指定的遺傳方式不正確，可能導(dǎo)致錯(cuò)誤的結(jié)論。難以收集到家系全部人員?；疾〖蚁党蓡T設(shè)計(jì)優(yōu)點(diǎn):患病家系成員設(shè)計(jì)患病同胞對(duì)設(shè)計(jì)患病同胞對(duì)表型不一致同胞對(duì)患病同胞對(duì)設(shè)計(jì)患病同胞對(duì)表型不一致同胞對(duì)患病同胞對(duì)設(shè)計(jì)優(yōu)點(diǎn):可以進(jìn)行非參數(shù)統(tǒng)計(jì)分析。研究對(duì)象相對(duì)容易收集。缺點(diǎn):檢驗(yàn)效能相對(duì)較低樣本量要求較大患病同胞對(duì)設(shè)計(jì)優(yōu)點(diǎn):患病先證者核心家系設(shè)計(jì)患病先證者核心家系設(shè)計(jì)優(yōu)點(diǎn):可以進(jìn)行非參數(shù)統(tǒng)計(jì)分析。研究對(duì)象相對(duì)容易收集。缺點(diǎn):統(tǒng)計(jì)分析時(shí)僅僅雜合子的雙親可以有效利用。對(duì)于遲發(fā)性疾病難以收集到雙親資料?；疾∠茸C者核心家系設(shè)計(jì)優(yōu)點(diǎn):患病先證者核心家系設(shè)計(jì)雙生子研究設(shè)計(jì)通過比較在相似或不同環(huán)境中成長(zhǎng)起來的同卵雙生子及異卵雙生子某一疾病或性狀發(fā)生的一致性，來判斷遺傳與環(huán)境因素的作用。養(yǎng)子研究設(shè)計(jì)通過比較、分析養(yǎng)子與其同胞及生身父母某疾病或性狀的相似性和與其寄養(yǎng)同胞或養(yǎng)父母的相似性，研究在某種疾病或性狀發(fā)生中遺傳因素與環(huán)境因素相對(duì)作用的大小。家系研究中其它研究設(shè)計(jì)方法雙生子研究設(shè)計(jì)家系研究中其它研究設(shè)計(jì)方法半同胞研究設(shè)計(jì)是指同父異母或同母異父的兄弟姐妹。根據(jù)半同胞中所研究疾病的患病情況，可分析疾病或遺傳性狀來自父方或母方。半同胞研究設(shè)計(jì)病例對(duì)照研究設(shè)計(jì)病例對(duì)照研究設(shè)計(jì)優(yōu)點(diǎn):相對(duì)容易收集到資料。投入少，產(chǎn)出高。缺點(diǎn):由于存在連鎖不平衡和種群分層，容易導(dǎo)致假陽性或假陰性。病例對(duì)照研究設(shè)計(jì)優(yōu)點(diǎn):病例對(duì)照研究設(shè)計(jì)背景1994年P(guān)iegorseh、Begs等提出

遺傳與環(huán)境的關(guān)系交互作用單純病例研究

應(yīng)用前提條件

在正常人群中基因型與環(huán)境暴露各自獨(dú)立發(fā)生，所研究疾病為罕見病。衍生的研究設(shè)計(jì)方法

等于方程II中的βa+βs+βsa

。方程I和II都有3個(gè)自變量(自由度)，都沒有假定βsa等于零，又稱為飽和（Saturated）模型。從方程II中我們可以觀察βsa是否顯著。如果我們假定吸煙與飲酒無交互作用，βsa等于零，則方程II變?yōu)椋悍匠蘄II：f(Y)=β0+βaalcohol+βssmoke只用βa、βs來擬合這四組，如果得到的似然數(shù)與方程I（II）沒有顯著差別，表明βsa是多余的，或者說βsa與零無顯著性差異，吸煙與飲酒對(duì)f(Y)無交互作用。反之，吸煙與飲酒對(duì)f(Y)有交互作用?；貧w分析法方程I與方程II是等同的，方程I中的β3等于方程II中的β上面講了交互作用的兩種檢驗(yàn)方法：方法I：模型中乘積項(xiàng)回歸系數(shù)的檢驗(yàn)（又稱WALDTEST）。如上例βsa的檢驗(yàn)，如顯著表示有交互作用；方法II：似然比檢驗(yàn)（Loglikelihoodratiotest），具體方法為：計(jì)算卡方值：X2=2*（LL1-LL2）。如上例，LL1表示從方程I（或II）得出的似然對(duì)數(shù)；LL2表示從方程III得出的似然對(duì)數(shù)。計(jì)算自由度差。如上例，方程I（或II）有3個(gè)自變量，方程III只有2個(gè)自變量，差為1。按卡方檢驗(yàn)，得出P值。一般來說，似然比檢驗(yàn)效率高于回歸系數(shù)的檢驗(yàn)。回歸分析法上面講了交互作用的兩種檢驗(yàn)方法：回歸分析法優(yōu)點(diǎn):(1)分析某個(gè)自變量的效應(yīng)時(shí),可以同時(shí)控制多個(gè)協(xié)變量的影響;(2)可以處理自變量對(duì)因變量的非線性效應(yīng);(3)可以在模型中引入交互作用項(xiàng);(4)回歸系數(shù)的可解釋性。缺點(diǎn):(1)維度困擾的問題。維度困擾是指樣本量有限而自變量較多(高維數(shù)據(jù))時(shí),分析交互作用時(shí)會(huì)使得觀測(cè)數(shù)相對(duì)于自變量數(shù)過少,數(shù)據(jù)分布在高維稀疏的列聯(lián)表中,此時(shí)維度困擾的問題會(huì)導(dǎo)致Logistic回歸模型中參數(shù)估計(jì)的錯(cuò)誤,或使回歸系數(shù)的標(biāo)準(zhǔn)誤過大,從而導(dǎo)致I類錯(cuò)誤或II類錯(cuò)誤增加。(2)自變量之間的相關(guān)性會(huì)導(dǎo)致不同的建模策略(前進(jìn)法或后退法),并得到不同的結(jié)果。(3)Logistic回歸不能很好地解決遺傳異質(zhì)性的問題。Logistic回歸分析優(yōu)點(diǎn):(1)分析某個(gè)自變量的效應(yīng)時(shí),可以同時(shí)控制多個(gè)協(xié)多因子降維法

多因子降維法多因子降維法（mult基本原理GMDR是對(duì)原始MDR的擴(kuò)展，其基本原理包括計(jì)分統(tǒng)計(jì)量(scorestatistic)和交叉驗(yàn)證(crossvalidation）。計(jì)分統(tǒng)計(jì)量：通過計(jì)算每個(gè)個(gè)體的計(jì)分統(tǒng)計(jì)量均值是否超過某個(gè)設(shè)定標(biāo)準(zhǔn)(例如大于或等于1)，分別標(biāo)記為“高?！被颉暗臀！?，單元格因此被分為2類，形成一維兩水平的模型。交叉驗(yàn)證（Crossvalidation）：隨機(jī)方式產(chǎn)生十等份幾乎相同的數(shù)據(jù)子集，每次用十份中的九份作為訓(xùn)練樣本，另一份稱為留存數(shù)據(jù)（held-outdata）作為測(cè)試樣本，當(dāng)十次全部完成后再將十次所得的平均絕對(duì)誤差求均值，即為研究的預(yù)測(cè)誤差。基本原理復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件GMDR軟件：目前最新的GMDR軟件(版本beta0．7)是基于Java程序編寫的源代碼開放的免費(fèi)軟件,/intemet/addiction.genomics/Software/免費(fèi)下載).文件類型：GMDR能夠識(shí)別的文件包括三種，分別為標(biāo)記文件(markerfile)，協(xié)變量與表型文件(covariate&phenotypefile)以及計(jì)分文件(scorefile)。三者均為文本文件。結(jié)果輸出:每個(gè)單元格的顏色由單元格的計(jì)分決定，藍(lán)色為計(jì)分超過設(shè)定值，黃色為未超過設(shè)定值，白色表示單元格內(nèi)沒有數(shù)據(jù)。單元格中的左側(cè)條帶表示正計(jì)分之和，右側(cè)條帶表示負(fù)計(jì)分之和。GMDR軟件：目前最新的GMDR軟件(版本beta0．7)優(yōu)點(diǎn):(1)在單個(gè)SNP位點(diǎn)缺乏主效應(yīng)時(shí),可以同時(shí)檢測(cè)位點(diǎn)間的交互作用;(2)將研究中的多因子組合以疾病易感性的方式分為高危和低危,把高維結(jié)構(gòu)降低到一維兩水平,降低了建模所需的自由度,從而可以分析多個(gè)位點(diǎn)間的高階交互作用；(3)GMDR能有效識(shí)別無主效應(yīng)但具有交互作用的功能性SNP位點(diǎn);存在5%以下的基因分型錯(cuò)誤和5%的缺失數(shù)據(jù)時(shí),對(duì)降低GMDR的檢驗(yàn)效能影響很小,說明GMDR具有一定的穩(wěn)健性。缺點(diǎn):(1)如果使用窮盡搜索的方式檢測(cè)最佳n因子組合,由于該搜索方式非常耗時(shí),GMDR只能用于分析中小規(guī)模預(yù)測(cè)變量數(shù)的交互作用,而不能用于處理大規(guī)模數(shù)據(jù)(如全基因組關(guān)聯(lián)研究的多個(gè)位點(diǎn))。(2)當(dāng)數(shù)據(jù)中存在遺傳異質(zhì)性和擬表型時(shí),GMDR的檢驗(yàn)效能大大降低

。(3)GMDR將基因型組合簡(jiǎn)單地根據(jù)病例與對(duì)照的比值分為高風(fēng)險(xiǎn)

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

復(fù)雜疾病的遺傳學(xué)研究研究設(shè)計(jì)與統(tǒng)計(jì)分析方法課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔