人類疾病網(wǎng)絡_第1頁
人類疾病網(wǎng)絡_第2頁
人類疾病網(wǎng)絡_第3頁
人類疾病網(wǎng)絡_第4頁
人類疾病網(wǎng)絡_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

人類疾病網(wǎng)絡第1頁,課件共72頁,創(chuàng)作于2023年2月背景在刻畫人類疾病位點的研究中,很多疾病基因的位置克隆和全基因組的關聯(lián)研究,產(chǎn)生了疾病與基因的關聯(lián)對列表。另外,蛋白質(zhì)相互作用,人類代謝圖譜和調(diào)控網(wǎng)絡等都為不同疾病基因間的相互作用提供了一些細節(jié)描述。2*第2頁,課件共72頁,創(chuàng)作于2023年2月給出一個不同的方法,在細胞和有機體的組織的高水平上,探索人類遺傳疾病和對應的疾病基因是否可以彼此相關聯(lián)。通過提供有多個基因引起的疾?。ɑ蜃愘|(zhì)性)的例子來支持這個方法的有效性。比方說,腦肝腎綜合癥是由至少11個基因的變異引起的,所有的都與過氧化酶體的生物發(fā)生有關。還有由一個基因的不同變異(等位基因異質(zhì)性)的疾病。比方說,TP53的變異被關聯(lián)到11個臨床上不同的癌癥相關疾病。通過發(fā)展一個全部遺傳疾?。膊”硇徒M)和全部疾病基因(疾病基因組)的關聯(lián)框架,得到對疾病組學的全局認識。3*第3頁,課件共72頁,創(chuàng)作于2023年2月結果和討論疾病組的構建:構建兩個不相交頂點集的二部圖。一個集合對應所有的已知遺傳疾病,另一個集合對應人類基因組的所有已知的疾病基因。如果一個基因的變異暗示了某種疾病的發(fā)生,則疾病和基因相關聯(lián)。疾病、疾病基因和他們之間的關系的列表都是從OMIM獲得。到2005年12月,包含了1284種疾病和1777個疾病基因。我們基于被疾病所影響的生理系統(tǒng),將疾病分成22類疾病。4*第4頁,課件共72頁,創(chuàng)作于2023年2月由疾病組的二部圖可以產(chǎn)生兩個相關的生物網(wǎng)絡投影。一個是人類疾病網(wǎng)絡(HDN),頂點是疾病,當兩個疾病共享至少一個疾病基因時,二者關聯(lián)。另一個是疾病基因網(wǎng)絡(DGN),頂點是疾病基因,當兩個基因關聯(lián)到同一疾病時,二者相連。然后,我們討論了這些網(wǎng)絡對于幫助我們理解和代表所有已知疾病和表型關聯(lián)的框架的潛力。5*第5頁,課件共72頁,創(chuàng)作于2023年2月6*第6頁,課件共72頁,創(chuàng)作于2023年2月HDN的性質(zhì):如果一個人類疾病有不同并且唯一的遺傳原因,那么HDN對應的是不連通的孤立點。但,獲得的HDN包含了單個疾病間和疾病類間的很多關聯(lián)。1284個疾病中,867個至少一個邊關聯(lián)到其他疾病,516個疾病形成一個巨大的類,暗示很多疾病同其他疾病是同享遺傳原因。一個疾病關聯(lián)的基因數(shù)目s有很寬的分布,暗示大多數(shù)疾病關聯(lián)到少數(shù)基因,很少的疾病關聯(lián)到很多基因。白血病s=37,結腸癌s=34等。HDN的度分布也是冪律的,結腸癌k=507*第7頁,課件共72頁,創(chuàng)作于2023年2月灰色表示linearbinning;紅色表示以2為底的對數(shù)數(shù)據(jù)8*第8頁,課件共72頁,創(chuàng)作于2023年2月HDN有明顯的聚類現(xiàn)象,但在不同疾病類之間有明顯的不同。癌癥類因為共享很多癌基因,所以緊密相連,并且還有很多疾病同癌癥有強相關;代謝疾病沒有明顯的形成一個不同的類。如圖三為了量化這種差異,我們衡量了每個疾病類的基因座異質(zhì)性和連通性(HDN中彼此連接的一部分疾?。?。如圖四,紅色代表較高的顯著性,藍色代表較低的顯著性。發(fā)現(xiàn)癌癥有著較高的異質(zhì)性和連通性,而代謝類有較低的異質(zhì)性和連通性。基因座異質(zhì)性:指多于一個基因的變異。用屬于這個類的疾病中基因的平均數(shù)目(也就是節(jié)點的平均大小)來衡量。一個類的連通性:用在HDN中彼此互相關聯(lián)的一部分疾病來衡量9*第9頁,課件共72頁,創(chuàng)作于2023年2月10*第10頁,課件共72頁,創(chuàng)作于2023年2月11*第11頁,課件共72頁,創(chuàng)作于2023年2月DGN的性質(zhì)基因間的關聯(lián),代表了相關表型關聯(lián),他們代表了表型相關性的衡量,這個可以用在未來的研究中,同蛋白質(zhì)相互作用、轉錄因子—啟動子相互作用、代謝相互作用關聯(lián),發(fā)現(xiàn)新的遺傳相互作用。在DGN中,1377個疾病基因連接到其他基因,903個基因屬于一個巨大的類。如圖五涉及多種疾病的基因數(shù)目急劇減少。如圖六12*第12頁,課件共72頁,創(chuàng)作于2023年2月13*第13頁,課件共72頁,創(chuàng)作于2023年2月14*第14頁,課件共72頁,創(chuàng)作于2023年2月HDN和DGN的功能類在保持疾病和基因的度不變的情況下,在二部圖基礎上隨機化重連邊,得到的疾病網(wǎng)絡的最大類的平均大小是643±16,遠大于實際HDN中的516。相似,基因網(wǎng)絡的最大類的平均大小為1087±20,也遠大于實際DGN中的903(P<10^(-4))。這些不同顯示了疾病和基因的重要的病理生理學類。在實際的網(wǎng)絡中,疾?。ɑ颍└鼉A向于相同疾病類中疾病(基因)的相連。15*第15頁,課件共72頁,創(chuàng)作于2023年2月疾病關聯(lián)基因識別不同功能模塊大多數(shù)的疾病和疾病類對應細胞內(nèi)網(wǎng)絡中怎樣的不同的功能模塊仍然不清楚。假設1:如果編碼蛋白質(zhì)的疾病關聯(lián)基因在功能不同的模塊中相互作用,則在這些疾病模塊中的蛋白質(zhì)比其他蛋白質(zhì)更可能相互作用。為了檢驗這種假設,建立了蛋白質(zhì)相互作用網(wǎng)絡,發(fā)現(xiàn)290個重疊的相互作用,是隨機情況下的10倍。*16第16頁,課件共72頁,創(chuàng)作于2023年2月同一個疾病關聯(lián)的基因共享一般的細胞和功能特性,在GeneOntology(GO)中注釋。假設2:如果HDN顯示模塊化組織,則與相同疾病關聯(lián)的一組基因應該分享相似的細胞和功能特性,正如在GO中注釋的一樣。為了證實這個假設的有效性,對于GO的每個分支(生物過程、分子功能和細胞組分),我們測量了每個疾病的GO同質(zhì)性。發(fā)現(xiàn)有很高的顯著性。GO同質(zhì)性:,是疾病i關聯(lián)的有GO術語j的基因數(shù)目;是與疾病i關聯(lián)的有GO注釋的所有基因數(shù)目。*17第17頁,課件共72頁,創(chuàng)作于2023年2月*18第18頁,課件共72頁,創(chuàng)作于2023年2月假設3:在一般功能模塊中相互作用的編碼蛋白質(zhì)的疾病基因應該趨向于在相同的組織中表達。為了衡量,我們引入疾病的組織同質(zhì)系數(shù)。定義為:其中

表示對于疾病i的關聯(lián)基因至少在一個組織中表達的基因數(shù)目,表示在組織j中

表達的基因的數(shù)目。如右圖,有68%的疾病有

完全組織同質(zhì)性,隨機情

況下為51%。(P<10^(-5))*19第19頁,課件共72頁,創(chuàng)作于2023年2月最后,參與一個功能模塊的基因應該顯示較高的表達譜相關。通過與隨機控制的比較,發(fā)現(xiàn)關聯(lián)相同疾病的基因對的Pearson相關系數(shù)(PCCs)有較高的值。一個給定疾病的所有基因對的PCC的平均值也存在顯著性。大約33種疾病的平均PCC>0.6。*20第20頁,課件共72頁,創(chuàng)作于2023年2月總結:關聯(lián)同一疾病的基因1)他們對應的產(chǎn)物通過蛋白質(zhì)相互作用傾向于彼此連接;2)傾向于在特異性組織中共同表達;3)顯示較高的共表達水平;4)作為一個組顯示同步表達;5)傾向于共享GO術語。這些支持了對于疾病基因和他們產(chǎn)物的全局功能相關性,提供了一個疾病組的基于網(wǎng)絡的模型*21第21頁,課件共72頁,創(chuàng)作于2023年2月中心性和外圍性一個細胞網(wǎng)絡的結構和它功能特性的關聯(lián)的最早的解釋是在釀酒酵母中高連通蛋白或hubs更傾向于被關鍵基因編碼。這促使研究者對人類疾病基因傾向于編碼hubs的假設進行研究,但有研究者發(fā)現(xiàn),二者僅有很弱的相關性。我們最初的研究是支持這一假設的。但是,疾病基因和hubs的關系在不同疾病基因間是不相同的。*22第22頁,課件共72頁,創(chuàng)作于2023年2月在探索疾病基因是否編碼hubs時,忽略了在早期發(fā)育中的關鍵基因,它們的改變導致高比例的自發(fā)流產(chǎn)。通過對老鼠基因的人類同源基因分析,發(fā)現(xiàn)1276個人類基因的老鼠重要同源基因,其中398個與人類疾病有關,占人類疾病基因的22%。這樣就把人類基因分為:1276個關鍵基因和1379個非關鍵疾病基因。發(fā)現(xiàn)關鍵蛋白顯示了同hubs關聯(lián)的趨勢,而其余非關鍵疾病蛋白沒有這種趨勢。*23第23頁,課件共72頁,創(chuàng)作于2023年2月*24第24頁,課件共72頁,創(chuàng)作于2023年2月期望:關鍵基因和疾病基因的表達模式同相當數(shù)量的其他基因同步。定義關鍵基因(或非關鍵疾病基因)i和細胞中所有其他基因之間的平均基因共表達系數(shù)

,是從人類正常組織中計算得到的。發(fā)現(xiàn):對于關鍵基因,有高的<p>的基因比小的或負的的基因更關鍵;而對于非關鍵疾病基因正好相反。*25第25頁,課件共72頁,創(chuàng)作于2023年2月最后,我們問:看家基因是否有一個編碼疾病基因的趨勢?我們發(fā)現(xiàn)一個基因在越多的組織中表達,則這個基因是關鍵基因的可能性越高。而非關鍵疾病基因有在很少的組織中表達的趨勢。發(fā)現(xiàn)9.9%的看家基因對應到疾病基因,13.5%的非看家基因;*26第26頁,課件共72頁,創(chuàng)作于2023年2月大部分疾病基因的次要性可以用進化的觀點進行解釋。導致嚴重表型的體細胞突變更可能影響中心功能。我們分別研究了體細胞癌基因的特性,發(fā)現(xiàn)它們更可能編碼hubs、顯示了與其他基因更高的共表達性、更可能代表看家基因。體細胞癌基因的這種功能和拓撲中心性與當前的理解相吻合——很多癌基因在細胞的發(fā)育和生長中發(fā)揮很重要的作用。*27第27頁,課件共72頁,創(chuàng)作于2023年2月在人類的復雜表型中探索遺傳重疊某些疾病會在病人中高頻率(低頻)的同時發(fā)生。因此研究疾病間的遺傳重疊至關重要。我們用對多種疾病的觀察的大量的表型數(shù)據(jù)集和適當?shù)慕y(tǒng)計模型,推理表型間的遺傳重疊。比方說,孤獨癥、雙相型障礙和精神分裂癥存在重要的遺傳重疊。因此,這種疾病網(wǎng)絡假說可以很快被用在遺傳圖譜的方法設計上,它涉及看似孤立的多種表型間的聯(lián)合關聯(lián)*28第28頁,課件共72頁,創(chuàng)作于2023年2月數(shù)據(jù)來源:哥倫比亞大學醫(yī)學中心的臨床資料庫。包括161種疾病的150萬病人記錄。這些數(shù)據(jù)包含了疾病的比較寬的范圍,從一般到稀有,影響不同的生理系統(tǒng)。*29第29頁,課件共72頁,創(chuàng)作于2023年2月方法:考慮一對疾病D1和D2,模擬一個人在特定年齡或之前的表型。一個人天生帶有(沒有)疾病易感變化集合,用k1、k2和k12的隨機變量表示,這些變量確定了某個人在某個時間被診斷為某種病的概率。如果沒有時間的調(diào)節(jié),早發(fā)疾病和晚發(fā)疾病可能被錯誤的判斷為負關聯(lián)。*30第30頁,課件共72頁,創(chuàng)作于2023年2月*31第31頁,課件共72頁,創(chuàng)作于2023年2月假設1)如果有兩種(多種)不同疾病是在相同環(huán)境下發(fā)生的,那么它們通常是通過分子機制引發(fā)的。2)對于每個表型對D1和D2,整個人類基因組被分為四個不相交的核苷酸位點集合。3)涉及連接疾病表型的四個集合中遺傳變異的假設機制。在位點的疾病易感集合中,遺傳變異的數(shù)目越大,疾病表型越可能顯現(xiàn)出來。*32第32頁,課件共72頁,創(chuàng)作于2023年2月這兒考慮兩類遺傳外顯率函數(shù):sharp-threshold和soft-threshold。Sharp-threshold是指當多態(tài)性的數(shù)目超過閾值時,表現(xiàn)出表型i的特征來。是指表現(xiàn)疾病表型i所需要的,在疾病特異性核苷酸位點的有害多態(tài)性的最少數(shù)目。Soft-threshold是指,閾值是一個隨機變量,滿足均值為,方差為的二項分布。()*33第33頁,課件共72頁,創(chuàng)作于2023年2月對每一個疾病對,我們選擇三種模型中的一種進行分析:二者不相關(也就是沒有遺傳重疊);二者負相關(競爭遺傳重疊);二者正相關(合作遺傳重疊)。合作模型比標準的遺傳多效模型更一般。因為合作模型除了分享的多態(tài)性,還允許關聯(lián)影響各自的遺傳多態(tài)性。獨立模型是兩個重疊模型的特殊情況,我們通過將兩個重疊模型同獨立模型比較,用兩個對數(shù)似然比統(tǒng)計代表我們分析的結果。進一步,我們的參數(shù)模型提供了對假定遺傳重疊的大小的評估。*34第34頁,課件共72頁,創(chuàng)作于2023年2月相關性和重疊對于遺傳重疊的分析顯示了疾病間的大量的相關性,很多都被很好的確定,但有些相關性先前沒有描述過。與孤獨癥的遺傳重疊的疾病分為四類;雙相型障礙和精神分裂癥也類似分析。這三種疾病同其余158中疾病的關聯(lián),紅線代表正相關,藍線代表負相關。*35第35頁,課件共72頁,創(chuàng)作于2023年2月*36第36頁,課件共72頁,創(chuàng)作于2023年2月非孟德爾疾病的表型經(jīng)常定義一個模糊度,尤其是神經(jīng)學上的。很多情況下,觀察到的疾病是有相似癥狀但可能不同遺傳原因的多種病態(tài)的混合。我們對一對疾病間遺傳疾病的解釋不排除一個疾病是另一個疾病的原因的可能*37第37頁,課件共72頁,創(chuàng)作于2023年2月具體方法:對于病人i的兩個疾病D1和D2,第i個病人用下式表示N是數(shù)據(jù)庫中病人的總數(shù);是病人的年齡;是病人的性別;是病人的種族;和分別指病人被診斷為疾病D1,D2的年齡。當病人沒有被診斷為疾病Dk時,為∞。*38第38頁,課件共72頁,創(chuàng)作于2023年2月對于疾病D1和D2,將整個基因組分為四個不相交的集合。盡管我們是集中在點突變的研究,但是我們的方法可以擴展到遺傳多態(tài)性的其他類型,比方說插入、刪除、倒置和替換。對于D1和D2,我們定義四種表型

基因型:的概率。對病人i,我們用隨機變量三元組表示所有有害多態(tài)性,這些多態(tài)性被分成。這三個隨機變量完全描述了病人涉及到疾病D1,D2的基因型。假設獨立的服從poisson分布,參數(shù)分別為。如果一個疾病相關的核苷酸位點集合很小,可以假設用二項分布代替poisson分布。*39第39頁,課件共72頁,創(chuàng)作于2023年2月給定,的概率(外顯函數(shù))我們用表示一個病人在他生命結束時涉及到疾病D1和D2。定義兩個外顯函數(shù):一個是在和中的有害變異的數(shù)目大于等于一個閾值;另一個定義是指,閾值本身是一個隨機變量,所以疾病發(fā)生的概率隨有害多態(tài)性數(shù)目的增加而逐漸增加。給定,的概率用表示一個人在時間t之前的表型。令和表示第一次診斷到D1和D2的時間,等價于。因此對于和,兩個疾病表型狀態(tài)的可能可以用聯(lián)合失效時間模型來研究,基于類似于年齡和性別的遺傳因子和協(xié)方差*40第40頁,課件共72頁,創(chuàng)作于2023年2月然后,我們定義下面的條件概率其中k=1,2.我們可以直接從數(shù)據(jù)估計,的估計如圖一。

最后我們定義,在給定,的概率以

的形式給出。*41第41頁,課件共72頁,創(chuàng)作于2023年2月病人i被診斷為疾病Di的概率為

*42第42頁,課件共72頁,創(chuàng)作于2023年2月兩類遺傳重疊模型:合作和競爭在合作模型中,重疊基因可以同時對兩種疾病貢獻;在競爭模型中,重疊基因僅對于其中一種病有貢獻,具體對那種病有影響是隨機的。似然比檢驗為了計算第i個病人的似然值,我們需要對給定的在所有可能的取值()和上的概率求和。如果我們假設對于所有的e和g,參數(shù)向量都是一樣的,則似然函數(shù)是所觀察表型的概率的乘積(所有病人);或者,我們根據(jù)種族和性別將數(shù)據(jù)細分,對每個數(shù)據(jù)子集估計參數(shù)的集合。*43第43頁,課件共72頁,創(chuàng)作于2023年2月核心:我們的分析是模型選擇的問題。1)當兩種疾病有任意大的遺傳重疊時,我們對同一模型有兩種看法。(合作或競爭)2)當兩個疾病在遺傳上是獨立的時,我們有一個更簡單的模型嵌套在前兩個模型里,即為空,因此,我們可以用一個標準似然比統(tǒng)計量來計算。隨著樣本數(shù)的增加,漸近的服從分布。通過計算和區(qū)分三個模型(獨立、合作和競爭)。*44第44頁,課件共72頁,創(chuàng)作于2023年2月研究人類表型的動態(tài)網(wǎng)絡方法通過證明以下事實,我們提供了關于表型疾病網(wǎng)絡的結構同疾病發(fā)展的理解相關的根據(jù):1)一個人患的某種病在網(wǎng)絡中與曾經(jīng)患過的病接近;2)對于不同性別和種族的病人,疾病在網(wǎng)絡中沿著網(wǎng)絡邊的發(fā)展是不同的;3)在表型疾病網(wǎng)絡中,有高連通的疾病的病人要比低連通疾病更易于死亡;4)在網(wǎng)絡中,后發(fā)生的疾病比先發(fā)生的有較多的連通,并且與較高的死亡率相關聯(lián)。*45第45頁,課件共72頁,創(chuàng)作于2023年2月我們的結果顯示,疾病的發(fā)展可以用網(wǎng)絡的方法進行研究,并且提供了加強對人類疾病的起源和進化的理解的可能性。*46第46頁,課件共72頁,創(chuàng)作于2023年2月方法數(shù)據(jù)醫(yī)療機構提供關于疾病診斷的有效的,系統(tǒng)的和完整的數(shù)據(jù)。每條記錄包括:拜訪的日期、最初的診斷和到第九級的診斷,所有的都被一個5位的ICD9碼指定。前三位指定了主要的疾病類,后兩位提供關于疾病的其他信息。ICD-9-CM分類在3位水平上分為657類,而在5位水平上分為16459類。我們基于1990-1993年的住院治療的MedPAR記錄編寫了原始的醫(yī)療保險聲明(medicareclaims)。大部分是65歲以上的老人。*47第47頁,課件共72頁,創(chuàng)作于2023年2月*48MFM+FW4910362(37.66%)6835054(52.42%)11745416(90.08%)B386663(2.97%)596432(4.57%)983095(7.54%)B+W5297025(40.62%)7431486(56.99%)12728511(97.62%)B+W+Other5440490(41.72%)7598529(58.28%)Other(Hispanic+Asian+NativeAmerican+Other)310507(2.38%)Total13039018(100%)第48頁,課件共72頁,創(chuàng)作于2023年2月數(shù)據(jù)限制:有時候,一個疾病對應多于一個的編碼,或者編碼對于研究目的沒有足夠的特定性。例如,在5位數(shù)水平上,有33種診斷關聯(lián)到高血壓。有時候,對于脫水這個癥狀,編碼沒有指定到任何一個診斷。但是,大部分的疾病被映射到ICD9碼。對于那些在老年中不常見的疾?。ㄅc懷孕有關的),數(shù)據(jù)信息不足;并且不包含那些沒有住院治療的病人的信息。*49第49頁,課件共72頁,創(chuàng)作于2023年2月合并癥關系的定量測量引入兩個疾病間“距離”的概念。這種方法的困難之處是:不同的統(tǒng)計距離測量有偏差。這種偏差給出了一個疾病被診斷的次數(shù)與它的流行程度服從重尾分布。意味著大部分疾病被很少的診斷到,少數(shù)疾病在種群的很大一部分被診斷到。因此,定量分析合并癥需要比較影響一小部分病人的疾病和影響大部分病人的疾病。用兩種合并癥測量來定量分析兩個疾病間的距離:相對風險比率(RR)和Ф-相關(Ф)。*50第50頁,課件共72頁,創(chuàng)作于2023年2月相對風險率RR:

其中是指被兩種病影響的病人數(shù)目,N指種群中病人的總數(shù),和是指疾病i和j的流行程度。RR值的分布如圖:*51第51頁,課件共72頁,創(chuàng)作于2023年2月Ф-相關是對于二值變量的Pearson相關:

對于,值的分布如圖:

*52第52頁,課件共72頁,創(chuàng)作于2023年2月這兩個合并癥的測量不是完全獨立的,因為他們都隨著兩個疾病所影響的病人數(shù)目的增加而增加,并且這兩個測量都有固有的誤差。

給定兩個測量的

互補誤差,分別

構建每個測量的PDN,討論它們

對于特定疾病組

的各自的相關性*53第53頁,課件共72頁,創(chuàng)作于2023年2月重要的問題是:基于關系的合并癥的預測能力怎么與遺傳和已知遺傳標記的預測能力進行比較?給定一個疾病,計算與另一種疾病的RR的范圍是0.25-16;而兄弟姐妹間的研究表明,他們患同一種病的RR值范圍也在這個范圍內(nèi)。在遺傳易感研究上的比較。更進一步,可用合并癥數(shù)據(jù)探索疾病風險。*54第54頁,課件共72頁,創(chuàng)作于2023年2月結果表型疾病網(wǎng)絡(PDN)節(jié)點是唯一被ICD9碼識別的疾病表型,連接表型的邊是根據(jù)測量得到的顯著性的合并癥關系。分別用RR測量和Ф-相關構造了PDN。這兩個網(wǎng)絡有很多相似之處。但用RR構造的網(wǎng)絡對于那些相對不常見的疾病較流行,并且有可辨別的模塊,這種模塊與ICD9分類有點接近;用Ф構造的網(wǎng)絡對于高度流行的疾病很流行。盡管它們之間有這些不同,它們都在不同的流行程度水平上揭示了顯著性關聯(lián),兩者互相補充。*55第55頁,課件共72頁,創(chuàng)作于2023年2月疾病網(wǎng)絡動力學從一個網(wǎng)絡動力學的觀點揭示PDN對于研究疾病發(fā)展的應用。PDN允許我們研究病人從一個疾病到另一個疾病沿PDN中的邊發(fā)展的動態(tài)過程。限制:即使根據(jù)診斷時間排好序的疾病,也不能揭示哪個疾病是結果。因此,我們在靜態(tài)網(wǎng)絡上研究疾病發(fā)展的可能的結果上用了一個保守的方法。*56第56頁,課件共72頁,創(chuàng)作于2023年2月通過三個問題探索疾病網(wǎng)絡動力學:1)沿PDN的邊疾病是不是顯著發(fā)展的?2)對于不同種族和性別的病人,疾病的發(fā)展是不是不同?3)在PDN中,疾病的高連通性是不是同高致命性相關?*57第57頁,課件共72頁,創(chuàng)作于2023年2月對于第一個問題,我們測量了所有四次訪問的病人的第一、二次診斷的疾病和第三、四次診斷的疾病間的平均相關性(N=946580)。構造隨機疾病集合作為對照組:保持疾病的流行程度相同,隨機選取前兩次診斷的疾病。發(fā)現(xiàn)真實數(shù)據(jù)中的相關性更高。*58第58頁,課件共72頁,創(chuàng)作于2023年2月

比較真實和隨機情況下的相關性,用,其中表示真實數(shù)據(jù)的平均相關,表示對照組的平均相關。*59第59頁,課件共72頁,創(chuàng)作于2023年2月對于第二個問題,我們用比值比OR(oddsratio)來計算種群α和β中疾病i和j關系的不同

其中是疾病i和j在種群α中的一個病人中觀察到的概率。

并且用關聯(lián)到高血壓或局部缺血性心臟病的所有疾病來顯示白種人男性和黑人男性對關系的影響。另一個圖顯示了性別不同對關系的影響*60第60頁,課件共72頁,創(chuàng)作于2023年2月*61第61頁,課件共72頁,創(chuàng)作于2023年2月*62第62頁,課件共72頁,創(chuàng)作于2023年2月對于第三個問題:首先,我們定義一個疾病的連通性和。高的和表示疾病i在PDN中高連通。其次,為了測量一個疾病的致命性,我們計算在第一次診斷后8年病人減少的百分比。從下圖發(fā)現(xiàn)連通性和致命性在兩種PDN中相關(A和B);發(fā)現(xiàn)致命性和流行程度只有弱相關(C);對于某些疾病組,疾病的連通性和致命性關系很強,比方說,對于腫瘤,這種關系很強,而對于精神類疾病,這種關系比較弱甚至為負的。*63第63頁,課件共72頁,創(chuàng)作于2023年2月*64第64頁,課件共72頁,創(chuàng)作于2023年2月這種關系可能解釋是:病的重的病人更容易檢測到。通過觀察給定拜訪次數(shù)、診斷次數(shù)、最后一次診斷后存活的年數(shù)的病人的平均連通性間

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論