




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、基因表達(dá)數(shù)據(jù)的獲得與分析徐 娟Email: 生物信息教研室 分子學(xué)館106辦公室基因芯片數(shù)據(jù)的基礎(chǔ)分析思路預(yù)處理差異表達(dá)基因篩選聚類與分類功能注釋和富集分析根據(jù)疾病風(fēng)險基因識別疾病風(fēng)險通路利用各種技術(shù)(基因表達(dá)譜、RNAseq、質(zhì)譜、大規(guī)模突變、全基因組關(guān)聯(lián)分析等)識別疾病風(fēng)險基因注釋這些基因到通路中識別疾病風(fēng)險通路分析這些通路與疾病的相關(guān)性丙酮酸丙酮酸激酶2-磷酸甘油酸磷酸烯醇式丙酮酸烯醇化酶葡萄糖6-磷酸葡萄糖6-磷酸果糖1,6-雙磷酸果糖3-磷酸甘油醛1,3-二磷酸甘油酸3-二磷酸甘油酸 葡萄糖代謝通路MAPK信號通路節(jié)點(diǎn)間的各種關(guān)系通過這些詳細(xì)的互作關(guān)系,我們能夠更清晰的了解通路! D
2、etail:泛素化去磷酸化抑制激活磷酸化綁定/相關(guān) ERGOBioCyc GeneDB 通路數(shù)據(jù)庫KEGG 其它通路數(shù)據(jù)庫: Reactomewikipathways biocarta KEGG數(shù)據(jù)庫介紹Kyoto Encyclopedia of Genes and Genomes1995年5月,日本的教育、科學(xué)、體育和文化部攜手建立了KEGG數(shù)據(jù)庫。由日本京都大學(xué)生物信息學(xué)中心的Kanehisa實(shí)驗(yàn)室開發(fā) KEGG是系統(tǒng)地分析基因功能、鏈接基因組信息和功能信息的數(shù)據(jù)庫,旨在揭示生命現(xiàn)象的遺傳與化學(xué)藍(lán)圖。數(shù)據(jù)庫的維護(hù)人員不定期的根據(jù)最近出版的一些學(xué)術(shù)論文和生物學(xué)實(shí)驗(yàn)得到的數(shù)據(jù)對該數(shù)據(jù)庫進(jìn)行更新
3、,經(jīng)過了17年的發(fā)展,數(shù)據(jù)庫的規(guī)模不斷的擴(kuò)大,其應(yīng)用價值也得到了世界范圍內(nèi)的認(rèn)可。與其他數(shù)據(jù)庫相比,KEGG 的一個顯著特點(diǎn)就是具有強(qiáng)大的圖形功能,它利用圖形而不是繁縟的文字來介紹眾多的代謝途徑以及各途徑之間的關(guān)系。KEGG主頁KEGG分析工具KEGG PATHWAY 可以看到KEGG 收錄的所有代謝途徑信息通路類別 KEGG pathway 分類 1. Metabolism 2. Genetic Information Processing 3. Environmental Information Processing 4. Cellular Processes 5. Organismal
4、Systems 6. Human Diseases 6.1 Cancers 6.2 Immune System Diseases 6.3 Neurodegenerative Diseases 6.4 Cardiovascular Diseases 6.5 Metabolic Diseases 6.6 Infectious Diseases 心血管疾病(Cardiovascular Diseases )肥厚性心肌病(HCM)hypertrophic cardiomyopathy致心律失常性右心室心肌癥(ARVC)Arrhythmogenic right ventricular cardiomyo
5、pathy擴(kuò)張性心肌癥(DCM)Dilated cardiomyopathy 病毒性心肌炎Viral myocarditis 糖尿?。═ype II diabetes mellitus )結(jié)腸直腸癌(Colorectal cancer)KEGG通路中的疾病基因信息? 1. Metabolism 2. Genetic Information Processing 3. Environmental Information Processing 4. Cellular Processes 5. Organismal Systems 6. Human Diseases KEGG通路中的疾病信息?查詢通
6、路中的疾病信息進(jìn)入KEGG網(wǎng)站 選擇一個通路(如:MAPK)進(jìn)入該通路,改變通路顯示方式為Homo sapiens (human) + Disease/drug 。點(diǎn)擊GoMAPK通路結(jié)果: 瀏覽通路中與疾病相關(guān)的基因疾病基因 藥靶基因 人類基因 培利替尼 案例:查看單個疾病風(fēng)險基因注釋到哪些通路神經(jīng)膠質(zhì)瘤(Glioma)風(fēng)險基因(NCBI-GeneID :1956),該基因編碼表皮生長因子受體(EGFR) 進(jìn)入KEGG搜索界面 選擇Search against為:hsa選擇Primary ID 類型為:NCBI-GeneID輸入EGFR基因(如格式:1956 red)點(diǎn)擊Exec案例:查看多
7、個疾病風(fēng)險基因注釋到哪些通路(適用于復(fù)雜疾?。耐ㄟ^差異表達(dá)分析獲得動脈硬化(artherosclerosis)風(fēng)險基因集合:共234個基因進(jìn)入KEGG搜索界面 選擇Search against為:hsa選擇Primary ID 類型為:NCBI-GeneID輸入差異表達(dá)基因,格式:19 red 368 red點(diǎn)擊Exec234個動脈硬化相關(guān)基因凝血相關(guān)功能數(shù)據(jù)庫:Gene Ontology (GO) Year19822005# of records60244, 202,133 Sequence databases:GenBank、EMBL、DDBJ背景 (1)傳統(tǒng)認(rèn)識功能的方法遠(yuǎn)遠(yuǎn)跟不上基因
8、發(fā)現(xiàn)的速度(2)大規(guī)模的基因功能預(yù)測的必要性;需系統(tǒng)水平上認(rèn)識基因功能(3)功能的規(guī)范化和大規(guī)模處理的需要(4)基因功能的多效性?困難和挑戰(zhàn) 問題一、一個基因多種功能TP53induction of apoptosisnegative regulation of apoptosis cellular response to UVchromosome organizationmitotic cell cycle G1/S transition DNA damage checkpoint negative regulation of DNA replication Glucose biosynth
9、esisGlucose synthesisGlucose formationGlucose anabolismGluconeogenesisAll refer to the process of making glucose from simpler components問題二、生物學(xué)功能的多種描述GO(gene ontology)是: 基因本體聯(lián)合會(Gene Onotology Consortium)所建立的數(shù)據(jù)庫,旨在建立一套適用于各種物種的,對基因和蛋白質(zhì)功能從多個方面進(jìn)行限定和描述的,并能隨著研究不斷深入而更新的語義(terms)詞匯標(biāo)準(zhǔn),即基因產(chǎn)物分類標(biāo)準(zhǔn)。GO數(shù)據(jù)庫不是以其自身為
10、中心而是依靠外部數(shù)據(jù)庫,這些外部數(shù)據(jù)庫中收錄的基因及其產(chǎn)物都將用GO定義的詞匯進(jìn)行注釋。因此GO是與時俱進(jìn)與相互合作的代表,它致力于統(tǒng)一基因及其產(chǎn)物注釋的方式。 You can visit GO at .GO語義的分類分子功能(Molecular Function)描述在個體分子生物學(xué)上的活性,如催化活性或結(jié)合活性。生物學(xué)過程(Biological Process)由分子功能有序地組成的,具有多個步驟的一個過程,如細(xì)胞周期。細(xì)胞組件(Cellular Component)指基因產(chǎn)物位于何種細(xì)胞器或基因產(chǎn)物組中(如糙面內(nèi)質(zhì)網(wǎng),核糖體,蛋白酶體等),即基因產(chǎn)物在什么地方起作用Cell agingt
11、erm: gluconeogenesisid: GO:0006094definition: The formation of glucose from noncarbohydrate precursors, such as pyruvate, amino acids and glycerol. Source: MetaCyc:GLUCONEO-PWY Ontology:Biological Process Synonyms exact: glucose biosynthesis exact: glucose biosynthetic process Whats in a GO term?Ont
12、ology StructureThe GO is structured as a hierarchical directed acyclic graph (DAG)GO isnt just a flat list of biological terms, terms are related within a hierarchyDirected Acyclic Graphs語義之間的關(guān)系is a:上一個概念包括下一個概念 , 下一個概念是上一個概念的實(shí)例 。part of:下一個概念是上一個概念的一部分 樹松樹葉子Part ofIs a(細(xì)胞質(zhì))(細(xì)胞器)(線粒體)(細(xì)胞器膜)Cell(細(xì)胞)p
13、art ofpart of案例:查看單個疾病風(fēng)險基因注釋到哪些通路神經(jīng)膠質(zhì)瘤(Glioma)風(fēng)險基因(NCBI-GeneID :1956),該基因編碼表皮生長因子受體(EGFR) 進(jìn)入GO界面 輸入EGFR基因(格式: EGFR )選擇gene or protein name 點(diǎn)擊Go!案例:查看多個疾病風(fēng)險基因注釋到哪些功能從通過差異表達(dá)分析獲得動脈硬化(artherosclerosis)風(fēng)險基因集合:共234個基因進(jìn)入GO搜索界面 在Enter your query文本框中輸入查詢基因輸入差異表達(dá)基因,格式:ABCA1 ABCC6Search type 選擇Genes or protein
14、sSearch fields選擇:symbol點(diǎn)擊Exec最多查詢50個基因Guide to GO Evidence CodesExperimental Evidence Codes EXP: Inferred from Experiment IDA: Inferred from Direct Assay IPI: Inferred from Physical Interaction IMP: Inferred from Mutant Phenotype IGI: Inferred from Genetic Interaction IEP: Inferred from Expression P
15、attern Computational Analysis Evidence Codes ISS: Inferred from Sequence or Structural Similarity ISO: Inferred from Sequence Orthology ISA: Inferred from Sequence Alignment ISM: Inferred from Sequence Model IGC: Inferred from Genomic Context IBA: Inferred from Biological aspect of Ancestor IBD: Inf
16、erred from Biological aspect of Descendant IKR: Inferred from Key Residues IRD: Inferred from Rapid Divergence RCA: inferred from Reviewed Computational Analysis 基因芯片數(shù)據(jù)的基礎(chǔ)分析思路預(yù)處理差異表達(dá)基因篩選聚類與分類功能注釋和富集分析基因集功能富集分析的原因一組基因直接注釋的結(jié)果是得到大量的功能結(jié)點(diǎn)。這些功能具有概念上的交疊現(xiàn)象,不利于進(jìn)一步的精細(xì)分析,所以研究人員希望對得到的功能結(jié)點(diǎn)加以過濾和篩選,以便獲得更有意義的功能信息。富
17、集分析方法通常是分析一組基因在某個功能結(jié)點(diǎn)上是否過出現(xiàn)(over-presentation)。由單個基因的注釋分析發(fā)展到大基因集合的成組分析。 由于分析的結(jié)論是基于一組相關(guān)的基因,而不是根據(jù)單個基因,所以富集分析方法增加了研究的可靠性,同時也能夠識別出與生物現(xiàn)象最相關(guān)的生物過程。案例:利用DAVID工具進(jìn)行動脈硬化風(fēng)險通路識別從GAD數(shù)據(jù)庫收集動脈硬化(artherosclerosis)風(fēng)險基因集合:共234個基因?qū)?34個基因輸入到DAVID系統(tǒng)利用EASE檢驗(yàn)計(jì)算每個通路的富集顯著性(P-value)EASE Score, a modified Fisher Exact P-Value 疾病風(fēng)險基因數(shù)人類基因In Pathway340Not In Pathway29729960Fisher Exact P-Value = 0.008 EASE Score = 0.06 EASE分值更加嚴(yán)格!-1DAVID Tools 步驟1:進(jìn)入DAVID網(wǎng)站,選擇
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國合式放大鏡數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國PVC地毯保護(hù)地墊數(shù)據(jù)監(jiān)測研究報告
- 郵政面試筆試題及答案
- 專題5 功和簡單機(jī)械 2021年和2022年江蘇省南通市中考物理模擬試題匯編
- 2019-2025年消防設(shè)施操作員之消防設(shè)備基礎(chǔ)知識自我檢測試卷A卷附答案
- 2019-2025年軍隊(duì)文職人員招聘之軍隊(duì)文職管理學(xué)真題練習(xí)試卷A卷附答案
- 酒店合同范本(2篇)
- 2023年黑龍江公務(wù)員《行政職業(yè)能力測驗(yàn)》試題真題及答案
- 環(huán)境保護(hù)與可持續(xù)發(fā)展知識點(diǎn)測試
- 語文課本里的經(jīng)典詩文賞析
- 課件-DeepSeek從入門到精通
- 【MOOC】理解馬克思-南京大學(xué) 中國大學(xué)慕課MOOC答案
- 醫(yī)學(xué)課件-耳穴壓豆教學(xué)課件
- 4.1.4公正性風(fēng)險評價記錄表
- 電力拖動自動控制系統(tǒng)-運(yùn)動控制系統(tǒng)(第5版)習(xí)題答案
- 關(guān)于印發(fā)《臨床輸血技術(shù)規(guī)范》的通知
- 高考語文復(fù)習(xí):虛實(shí)結(jié)合手法 課件23張
- 離婚調(diào)查取證申請書
- 家庭電路故障分析-課件
- 設(shè)備學(xué)習(xí)電子圍欄g5tk400說明書
- 外研版一起五年級英語下冊全冊教案教學(xué)設(shè)計(jì)版
評論
0/150
提交評論