版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、今天我們就來說一說蛋白質(zhì)組學(xué)涉及到的生信分析。1認識你的樣本 數(shù)據(jù)到手之后,我們第一步就是希望能夠?qū)?shù)據(jù)有個大體的了解,包括組內(nèi)樣品均一性、組間樣品差異性以及變化趨勢情況,有哪些分析可以快速的將這些數(shù)據(jù)進行可視化呢?請往下看:PCA分析,是一種非監(jiān)督性的多元統(tǒng)計分析,將高維復(fù)雜的數(shù)據(jù)進行“簡化和降維”,建立可靠的數(shù)學(xué)模型對研究對象的蛋白表達譜特點進行歸納和總結(jié)。從總體上反映各組樣本之間的蛋白差異和組內(nèi)樣本之間的變異度大小。相關(guān)性分析,是指對兩個或多個具備相關(guān)性的變量元素進行分析,從而衡量兩個變量因素的相關(guān)密切程度。相關(guān)性的元素之間需要存在一定的聯(lián)系或者概率才可以進行相關(guān)性分析?;谄柹嚓P(guān)系
2、數(shù),可以度量組內(nèi)樣品之間的關(guān)聯(lián)程度,從而分析組內(nèi)樣品間的平行性?;鹕綀D,將所有檢測到的蛋白的差異顯著性進行可視化展示,圖中橫坐標(biāo)為蛋白在兩個樣本間差異的倍數(shù)變化值,即樣本2的表達量除以樣本1的表達量得到的數(shù)值,對此數(shù)值做了對數(shù)化處理;縱坐標(biāo)為蛋白表達量變化差異的統(tǒng)計學(xué)t檢驗p值,p值越小則表達差異越顯著。紫色點為顯著差異的蛋白,黑色點為非顯著差異蛋白;將所有蛋白映射上去之后,可以獲知,在左邊的點為表達差異下調(diào)的蛋白,右邊的點為表達差異上調(diào)的蛋白,越靠左/右邊和上邊的點表達差異越顯著。 韋恩圖,通過差異蛋白Venn 圖可觀察出差異蛋白在各對比組間的數(shù)量分布狀況。每個顏色代表一組對比分析篩選出的差
3、異代謝物。 Heatmap,可以將蛋白在各樣品中的表達趨勢進行可視化展示,并根據(jù)表達趨勢進行聚類分析。圖中每列表示一個樣本,每行表示一個蛋白,圖中的顏色表示蛋白在該組樣本中相對表達量的大小,紅色代表該蛋白在該樣本中表達量較高,綠色代表表達量較低。左側(cè)為蛋白聚類的樹狀圖,兩個蛋白分支離得越近,說明它們的表達量越接近;上方為樣本聚類的樹狀圖,兩個樣本分支離的越近,說明這兩個樣本所有蛋白的表達模式越接近,即蛋白表達量變化趨勢越接近。 Cluster聚類,圖中每一條線表示一個蛋白;每張圖展示一種類型的表達模式,即體現(xiàn)這組蛋白表達量變化的趨勢。 2走進你的樣品 經(jīng)過以上這些分析我們可以很直觀的看出樣本間
4、的平行性,以及組間差異性,并且能夠快速找到一些差異極其顯著或者變化規(guī)律符合我們預(yù)期的蛋白。接下來的問題就是,我們怎么知道這些蛋白是否與我們的研究相關(guān),或者說這些蛋白都執(zhí)行哪些功能、怎樣發(fā)揮作用的呢? 這就要用到接下來的分析:GO功能注釋、KEGG注釋以及KOG注釋。GO (Gene Ontology, /) ,是基因本體論聯(lián)合會建立的將全世界所有與基因有關(guān)的研究結(jié)果進行分類匯總的綜合數(shù)據(jù)庫,其目的在于標(biāo)準(zhǔn)化不同數(shù)據(jù)庫中關(guān)于基因和基因產(chǎn)物的生物學(xué)術(shù)語,對基因和蛋白功能進行統(tǒng)一的限定和描述。利用 GO 數(shù)據(jù)庫,可以將基因按照其參與的生物過程(Bi
5、ological Process, BP)、細胞組分(Cellular Component, CC),分子功能(Molecular Function, MF)三個方面進行分類注釋。因此,GO注釋有助于了解蛋白所參與的生物學(xué)功能。 KEGG Pathway注釋,在生物體內(nèi),基因產(chǎn)物并不是孤立存在發(fā)揮作用的,不同基因產(chǎn)物之間通過有序的相互協(xié)調(diào)來行使其具體的生物學(xué)功能。因此,KEGG數(shù)據(jù)庫中豐富的通路信息將有助于我們從系統(tǒng)水平去了解蛋白的生物學(xué)功能,例如代謝途徑、遺傳信息傳遞以及細胞過程等一些復(fù)雜的生物功能。 COG注釋,全稱是Cluster of Orthologous Groups of pro
6、teins,由NCBI創(chuàng)建并維護的蛋白數(shù)據(jù)庫,根據(jù)細菌、藻類和真核生物完整基因組的編碼蛋白系統(tǒng)進化關(guān)系分類構(gòu)建而成。通過比對可以將某個蛋白序列注釋到某一個COG中,每一簇COG由直系同源序列構(gòu)成,從而可以推測該序列的功能。COG分為兩類,一類是原核生物的,另一類是真核生物。原核生物的一般稱為COG數(shù)據(jù)庫;真核生物的一般稱為KOG數(shù)據(jù)庫。 3終極大招大放送 我們可以通過蛋白所發(fā)揮的作用或者參與的通路,進一步篩選與我們的研究較為相關(guān)的蛋白進行后續(xù)的驗證。如果無法根據(jù)這些結(jié)果確定研究方向,那我們還有大招,就是富集分析。富集分析方法通常是分析一組蛋白在某個功能節(jié)點上是否出現(xiàn)過,原理是由單個蛋白的注釋分析發(fā)展為蛋白集合的注釋分析。富集分析提高了研究的可靠性,能夠識別出與生物現(xiàn)象最相關(guān)的生物學(xué)過程。GO富集,可以找到與生物現(xiàn)象最相關(guān)的生物功能,繪制成柱形圖、網(wǎng)絡(luò)圖。挑選數(shù)目最多,富集最為顯著的通路進行后續(xù)的驗證及深入研究。 KEGG富集,可以找到與生物現(xiàn)象最相
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國脈動微震袋式除塵器數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國土人參數(shù)據(jù)監(jiān)測研究報告
- 2025至2030年中國半掛粉粒物料運輸車數(shù)據(jù)監(jiān)測研究報告
- 二零二五年度環(huán)保型倉庫出租合同4篇
- 二零二四年信用借款逾期利率調(diào)整合同3篇
- 2025年度互聯(lián)網(wǎng)金融平臺數(shù)據(jù)安全保護合同4篇
- 2025年度個人債務(wù)擔(dān)保合同范本與風(fēng)險控制策略
- 二零二四年度園林綠化養(yǎng)護私人承包合同范本3篇
- 二零二五年度畜牧業(yè)農(nóng)業(yè)綜合開發(fā)項目合作協(xié)議4篇
- 2025版存量房買賣合同(含智能家居娛樂系統(tǒng)定制)3篇
- 中醫(yī)診療方案腎病科
- 2025年安慶港華燃氣限公司招聘工作人員14人高頻重點提升(共500題)附帶答案詳解
- 人教版(2025新版)七年級下冊數(shù)學(xué)第七章 相交線與平行線 單元測試卷(含答案)
- 從跨文化交際的角度解析中西方酒文化(合集5篇)xiexiebang.com
- 中藥飲片培訓(xùn)課件
- 醫(yī)院護理培訓(xùn)課件:《早產(chǎn)兒姿勢管理與擺位》
- 《論文的寫作技巧》課件
- 空氣自動站儀器運營維護項目操作說明以及簡單故障處理
- 2022年12月Python-一級等級考試真題(附答案-解析)
- T-CHSA 020-2023 上頜骨缺損手術(shù)功能修復(fù)重建的專家共識
- Hypermesh lsdyna轉(zhuǎn)動副連接課件完整版
評論
0/150
提交評論