生物信息學(xué)平臺課1_第1頁
生物信息學(xué)平臺課1_第2頁
生物信息學(xué)平臺課1_第3頁
生物信息學(xué)平臺課1_第4頁
生物信息學(xué)平臺課1_第5頁
已閱讀5頁,還剩69頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

什么是生物信息學(xué)生物信息學(xué)的誕生與發(fā)展生物信息學(xué)研究的幾個專題介紹生物信息學(xué)數(shù)據(jù)庫蛋白質(zhì)結(jié)構(gòu)預(yù)測基因發(fā)現(xiàn)研究微小RNA(miRNA)與復(fù)雜疾病精準醫(yī)療(PrecisionMedicine)本課程主要內(nèi)容第一頁第二頁,共75頁。1、什么是生物信息學(xué)第二頁第三頁,共75頁。什么是生物信息學(xué)?定義一:生物信息學(xué)是一門交叉科學(xué),它包含了生物信息的獲取、處理、存儲、分發(fā)、分析和解釋等在內(nèi)的所有方面,它綜合運用數(shù)學(xué)、計算機科學(xué)和生物學(xué)的各種工具,來闡明和理解大量數(shù)據(jù)所包含的生物學(xué)意義。--美國人類基因組計劃實施五年后的總結(jié)報告--第三頁第四頁,共75頁。什么是生物信息學(xué)?定義二:為拓展生物學(xué)、醫(yī)學(xué)、行為學(xué)和衛(wèi)生學(xué)數(shù)據(jù)的用途,而進行有關(guān)計算機方法手段的研究、開發(fā)與應(yīng)用,包括此類數(shù)據(jù)的采集、存貯、整理、歸檔、分析和可視化等。(Bioinformatics:Research,development,orapplicationofcomputationaltoolsandapproachesforexpandingtheuseofbiological,medical,behavioralorhealthdata,includingthosetoacquire,store,organize,archive,analyze,orvisualizesuchdata.)--美國國家衛(wèi)生研究院(NIH)--第四頁第五頁,共75頁。什么是生物信息學(xué)?定義三:Bioinformatics...istheresearchdomainfocusedonlinkingthebehaviorofbiomolecules,biologicalpathways,cells,organisms,andpopulationstotheinformationencodedinthegenomes.--TempleSmith--

《CurrentTopicsinComputationalMolecularBiology》2002年4月出版第五頁第六頁,共75頁。廣義生物信息學(xué)觀點生物學(xué)研究可以被看成是研究信息的傳遞:從DNA經(jīng)轉(zhuǎn)錄翻譯到蛋白質(zhì),從細胞質(zhì)中到細胞核內(nèi),從母細胞到子細胞,從一個細胞或一個組織到另一個細胞或另一個組織,從一代到下一代,從一個物種到另一個物種的進化演變。這種信息論的觀點即可稱為生物信息學(xué)。(Biologymaybeviewedasthestudyoftransmissionofinformation:frommothercelltodaughtercell,fromonecellortissuetypetoanother,fromonegenerationtothenext,andfromonespeciestoanother.Thisinformationalviewpointistermedbioinformatics.)

Eisenbergetal.,2006第六頁第七頁,共75頁。第七頁第八頁,共75頁。生物信息學(xué)、系統(tǒng)生物學(xué)與計算生物學(xué)系統(tǒng)生物學(xué):系統(tǒng)生物學(xué)是研究一個生物系統(tǒng)中所有組分(gene,mRNA,protein)的構(gòu)成,以及在特定條件下這些組分之間的相互關(guān)系,并通過計算生物學(xué)方法建立一個數(shù)學(xué)模型來定量描述和預(yù)測生物功能、表型和行為的學(xué)科。第八頁第九頁,共75頁。生物信息學(xué)、系統(tǒng)生物學(xué)與計算生物學(xué)計算生物學(xué):計算生物學(xué)是一門概念性學(xué)科,以生物信息為基礎(chǔ),以計算為工具,解決生物學(xué)問題。(側(cè)重于計算與問題,通過計算解決問題)第九頁第十頁,共75頁。2、生物信息學(xué)的誕生與發(fā)展第十頁第十一頁,共75頁。生物信息學(xué)的誕生和發(fā)展迅速膨脹的生物信息數(shù)據(jù)分子生物學(xué)發(fā)展的一個顯著特點是生物信息的劇烈膨脹。形成了巨量的生物信息庫迅速膨脹的生物信息給科學(xué)家們提出了一個新問題:如何有效管理、準確解讀、充分使用這些信息?第十一頁第十二頁,共75頁。萌芽期(60-70年代)生物數(shù)據(jù)庫的建立;檢索工具的開發(fā);DNA和蛋白質(zhì)序列分析序列比對:以Dayhoff的替換矩陣和Needleman-Wunsch和Smith-Waterman比對算法為代表三個發(fā)展階段半胱氨酸Cys

C;絲氨酸

Ser

S

;蘇氨酸

Thr

T脯氨酸

Pro

P;丙氨酸

Ala

A;甘氨酸

Gly

G天冬酰胺Asn

N;天冬氨酸Asp

D;谷氨酸Glu

E谷氨酰胺Gln

Q;組氨酸

第十二頁第十三頁,共75頁。通過比較兩條或多條序列之間的相似區(qū)域和保守性位點,尋找二者之間可能的進化關(guān)系構(gòu)建進化樹比較基因組學(xué)研究兩條序列比對(pairwisealignment)第十三頁第十四頁,共75頁。蛋白序列(Blast)核酸序列(Blast)兩條序列比對(pairwisealignment)第十四頁第十五頁,共75頁。蛋白序列(Clustal)多條序列比對(multiplealignment)第十五頁第十六頁,共75頁。形成期(80年代)網(wǎng)絡(luò)數(shù)據(jù)庫系統(tǒng)的建立、交互界面的開發(fā);分子數(shù)據(jù)庫和BLAST等相似性搜索程序;基因?qū)ふ液妥R別;結(jié)構(gòu)基因組。三個發(fā)展階段第十六頁第十七頁,共75頁。Blast可以進行一條序列和數(shù)據(jù)庫的比對Blast可以兩條或多條序列的比對序列比對工具Blast第十七頁第十八頁,共75頁。三個發(fā)展階段高速發(fā)展期(90年代-)大規(guī)模基因組分析—HGP(HumanGenomeProject,1990-2003)功能基因組比較基因組學(xué)轉(zhuǎn)錄組學(xué)蛋白質(zhì)組學(xué)分子相互作用組學(xué)代謝組學(xué)第十八頁第十九頁,共75頁。于20世紀80年代提出,由美、英、日、中、德、法等國參加針對人體23對染色體全部DNA的堿基對(3×109)序列進行測序,對大約25,000基因進行染色體定位,構(gòu)建人類基因組遺傳圖譜和物理圖譜的國際合作研究計劃。人類基因組計劃-定義第十九頁第二十頁,共75頁。HGP對人類疾病基因研究的貢獻人類疾病相關(guān)的基因是人類基因組中結(jié)構(gòu)和功能完整性至關(guān)重要的信息。對于單基因病,采用“定位克隆”和“定位候選克隆”的全新思路,導(dǎo)致了亨廷頓舞蹈病、遺傳性結(jié)腸癌和乳腺癌等一大批單基因遺傳病致病基因的發(fā)現(xiàn),為這些疾病的基因診斷和基因治療奠定了基礎(chǔ)。對于心血管疾病、腫瘤、糖尿病、神經(jīng)精神類疾病(老年性癡呆、精神分裂癥)、自身免疫性疾病等多基因疾病是目前疾病基因研究的重點。人類基因組計劃-意義第二十頁第二十一頁,共75頁。HGP對生物技術(shù)的貢獻基因工程藥物:分泌蛋白(多肽激素,生長因子,趨化因子,凝血和抗凝血因子等)及其受體。診斷和研究試劑產(chǎn)業(yè):基因和抗體試劑盒、診斷和研究用生物芯片、疾病和篩藥模型。對細胞、胚胎、組織工程的推動:胚胎和成年期干細胞、克隆技術(shù)、器官再造。人類基因組計劃-意義第二十一頁第二十二頁,共75頁。人類基因組計劃的實施和完成,帶來了生物信息學(xué)這門學(xué)科的飛躍式的發(fā)展。人類基因組計劃-意義第二十二頁第二十三頁,共75頁。現(xiàn)階段組學(xué)時代計算和生物學(xué)實驗相結(jié)合展開科學(xué)研究計算算法和軟件在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用研究第二十三頁第二十四頁,共75頁。生物信息學(xué)研究的一些課題問題DNAsequencebasecallingandassembly(DNA測序和裝配)Transmembranesegmentprediction(蛋白質(zhì)跨膜區(qū)預(yù)測)Signalpeptideprediction(信號肽預(yù)測)Proteingeometry(蛋白的幾何形狀?主要指主鏈的結(jié)構(gòu)?)Homologymodeling(同源建模)Genefinding(基因發(fā)現(xiàn))Repetitivesequenceanalysis(重復(fù)序列分析)Proteinstructurecomparison(蛋白質(zhì)結(jié)構(gòu)比較)Phylogenetictreeconstructionandevolution(分子進化樹構(gòu)建和分析)Proteindocking(分子對接)第二十四頁第二十五頁,共75頁。Drugdesign(藥物設(shè)計)Proteindesign(蛋白質(zhì)設(shè)計)Linkageanalysisandquantitativetraits(連鎖遺傳和數(shù)量性狀分析)Multiplesequencecomparisonandremotehomologsearch(多序列比較和遠源搜索)Proteintertiarystructureprediction(蛋白質(zhì)三級結(jié)構(gòu)預(yù)測)RNAsecondarystructureprediction(RNA二級結(jié)構(gòu)預(yù)測)Regulatorysequenceanalysis(調(diào)控序列分析)Computationalproteomics(計算蛋白質(zhì)組學(xué))Geneontologyandfunctionprediction(基因功能預(yù)測)生物信息學(xué)研究的一些課題問題第二十五頁第二十六頁,共75頁。Computationalcomparativegenomics(計算比較基因組學(xué))Text(literature)mining(文獻挖掘)SmallRNAandanti-senseregulation(小RNA反義調(diào)控)Alternativesplicingprediction(選擇性剪切)Computationalmetabolomics(計算代謝組學(xué))Genomesemantics(基因組語義學(xué))Membraneproteinstructureprediction(膜蛋白結(jié)構(gòu)預(yù)測)RNAtertiarystructureprediction(RNA三級結(jié)構(gòu)預(yù)測)Post-translationalmodification(翻譯后編輯)Dynamicsofregulatorynetworks(動態(tài)調(diào)控網(wǎng)絡(luò))Virtualcell/organismmodeling(虛擬細胞建模)生物信息學(xué)研究的一些課題問題第二十六頁第二十七頁,共75頁。3、生物信息學(xué)研究的幾個專題介紹生物信息學(xué)數(shù)據(jù)庫蛋白質(zhì)結(jié)構(gòu)預(yù)測基因發(fā)現(xiàn)研究微小RNA(miRNA)與復(fù)雜疾病第二十七頁第二十八頁,共75頁。3-1、生物信息數(shù)據(jù)庫概述第二十八頁第二十九頁,共75頁。數(shù)據(jù)庫的產(chǎn)生背景是海量數(shù)據(jù)的出現(xiàn)第二十九頁第三十頁,共75頁。一級數(shù)據(jù)庫和二級數(shù)據(jù)庫一級數(shù)據(jù)庫數(shù)據(jù)庫中的數(shù)據(jù)直接來源于實驗獲得的原始數(shù)據(jù),只經(jīng)過簡單的歸類整理和注釋二級數(shù)據(jù)庫(三級,四級,,)對原始生物分子數(shù)據(jù)進行整理、分類的結(jié)果,是在一級數(shù)據(jù)庫、實驗數(shù)據(jù)和理論分析的基礎(chǔ)上針對特定的應(yīng)用目標而建立的。第三十頁第三十一頁,共75頁。分子生物信息數(shù)據(jù)庫分類基因組數(shù)據(jù)庫(來自基因組作圖)HGP:人;大腸桿菌、酵母、線蟲、果蠅和小鼠。核酸和蛋白質(zhì)序列(一級結(jié)構(gòu))數(shù)據(jù)庫(來自序列測定)生物大分子三級結(jié)構(gòu)數(shù)據(jù)庫(來自X射線衍射和核磁共振等結(jié)構(gòu)測定)由上述3類數(shù)據(jù)庫和文獻資料為基礎(chǔ)構(gòu)建的二級數(shù)據(jù)庫。第三十一頁第三十二頁,共75頁?;蚪M數(shù)據(jù)庫三大基因組數(shù)據(jù)庫NCBI:美國生物技術(shù)信息中心(TheNationalCenterforBiotechnologyInformation)Ensembl:歐洲分子生物學(xué)實驗室(TheEuropeanMolecularBiologyLaboratory)EMBL維護UCSC:加州大學(xué)圣克魯茲分校(UniversityofCaliforniaSantaCruz,UCSC)創(chuàng)立和維護第三十二頁第三十三頁,共75頁。核酸序列數(shù)據(jù)庫

美國生物技術(shù)信息中心(TheNationalCenterforBiotechnologyInformation)的GenBank:)

歐洲分子生物學(xué)實驗室的(TheEuropeanMolecularBiologyLaboratory)EMBL:

()

日本遺傳研究所(DNADataBankofJapan)的DDBJ:()第三十三頁第三十四頁,共75頁。蛋白質(zhì)序列數(shù)據(jù)庫SWISS-PROT(瑞士日內(nèi)瓦大學(xué)和歐洲生物信息學(xué)研究所(EBI)合作維護)

()PIR(美國國家生物醫(yī)學(xué)研究基金會NBRF維護)()UniProt()第三十四頁第三十五頁,共75頁。蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫PDB()蛋白質(zhì)分類數(shù)據(jù)庫SCOP()蛋白質(zhì)分類數(shù)據(jù)庫CATH()第三十五頁第三十六頁,共75頁。3-2、蛋白質(zhì)結(jié)構(gòu)預(yù)測第三十六頁第三十七頁,共75頁。關(guān)于數(shù)據(jù)庫,值得關(guān)注的一組數(shù)字核酸序列數(shù)據(jù)庫收錄約1.7ⅹ108(1億7千萬)條數(shù)據(jù)(2016-10-10)蛋白質(zhì)序列數(shù)據(jù)庫收錄約47M4.7ⅹ107(~5千萬)條數(shù)據(jù)(2016-10-10)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫收錄約0.1M1.0ⅹ105(10萬)條數(shù)據(jù)(2016-10-10)僅有約0.2%(千分之二)的蛋白質(zhì)序列解析出三級結(jié)構(gòu)。第三十七頁第三十八頁,共75頁。序列vs結(jié)構(gòu)#structurelagfarbehind#sequences第三十八頁第三十九頁,共75頁。蛋白質(zhì)三級結(jié)構(gòu)預(yù)測的意義由于分子生物學(xué)技術(shù)的發(fā)展,蛋白質(zhì)氨基酸序列的測定速度大大加快,而蛋白質(zhì)分子三維結(jié)構(gòu)測定的速度仍遠遠落后于其氨基酸序列測定的速度。隨著蛋白質(zhì)工程技術(shù)的發(fā)展和人類基因組計劃的順利進展,對蛋白質(zhì)空間結(jié)構(gòu)與一級結(jié)構(gòu)的關(guān)系的研究也變得更加緊迫和重要。根據(jù)蛋白質(zhì)分子的氨基酸序列預(yù)測其三維空間結(jié)構(gòu)具有重要的意義,是生物信息學(xué)研究領(lǐng)域的一項重要挑戰(zhàn)。第三十九頁第四十頁,共75頁。蛋白質(zhì)結(jié)構(gòu)的4個層次一級結(jié)構(gòu)——組成蛋白質(zhì)的氨基酸序列;二級結(jié)構(gòu)——即骨架原子間的相互作用形成的局部結(jié)構(gòu),比如α螺旋,β折疊等;三級結(jié)構(gòu)——即二級結(jié)構(gòu)在更大范圍內(nèi)的堆積形成的空間結(jié)構(gòu);四級結(jié)構(gòu)——主要描述由三級結(jié)構(gòu)形成的不同亞基之間的相互作用。第四十頁第四十一頁,共75頁。動物的胰島素(Insulin),氨基酸序列線性排列蛋白質(zhì)一級結(jié)構(gòu)

第四十一頁第四十二頁,共75頁。二級結(jié)構(gòu)是指多肽鏈借助于氫鍵沿一維方向排列成具有周期性的結(jié)構(gòu)的構(gòu)象,是多肽鏈局部的空間結(jié)構(gòu)主要有α-螺旋、β-片層、loop、colis等幾種形式,它們是構(gòu)成蛋白質(zhì)高級結(jié)構(gòu)的基本要素。多肽鏈中有60%的區(qū)段為α-螺旋和β-折疊。蛋白質(zhì)二級結(jié)構(gòu)

第四十二頁第四十三頁,共75頁。肽鏈主鏈骨架圍繞中心軸盤旋成螺旋狀的結(jié)構(gòu)α螺旋

第四十三頁第四十四頁,共75頁。在多肽鏈之間或一條肽鏈的肽段之間靠氫鍵聯(lián)結(jié)而成的鋸齒狀片層結(jié)構(gòu)β片層

第四十四頁第四十五頁,共75頁?;旌夕缕瑢?/p>

第四十五頁第四十六頁,共75頁。

Loops連接

-helix和b-sheet長度和三級結(jié)構(gòu)不定在蛋白質(zhì)結(jié)構(gòu)的表面受點突變的影響小柔性好,構(gòu)象變化余地大帶電荷、極性的氨基酸比例高傾向成為活性位點第四十六頁第四十七頁,共75頁。結(jié)構(gòu)域(domian)domian是在二級結(jié)構(gòu)或超二級結(jié)構(gòu)的基礎(chǔ)上形成三級結(jié)構(gòu)的局部折疊區(qū)。domian通常由50-300個氨基酸殘基組成,其特點是在三維空間可以明顯區(qū)分和相對獨立,并且具有一定的生物功能如結(jié)合小分子。motif是結(jié)構(gòu)域的亞單位,通常由2~3個二級結(jié)構(gòu)單位組成,一般為α-螺旋、β-片層和loops。第四十七頁第四十八頁,共75頁。三級和四級結(jié)構(gòu)三級結(jié)構(gòu)肽鏈折疊成三維的空間結(jié)構(gòu)二級結(jié)構(gòu)在空間上的排布長程的、共價與非共價的相互作用如果蛋白質(zhì)只有1條肽鏈,三級結(jié)構(gòu)就是最高結(jié)構(gòu)層次四級結(jié)構(gòu)多個肽鏈在空間上的排布第四十八頁第四十九頁,共75頁。蛋白質(zhì)的三級結(jié)構(gòu)

在二級結(jié)構(gòu)基礎(chǔ)上的肽鏈再折疊形成的構(gòu)象α螺旋β折疊Zn疏水核心α螺旋第四十九頁第五十頁,共75頁。蛋白質(zhì)的四級結(jié)構(gòu)

組成蛋白質(zhì)的多條肽鏈在天然構(gòu)象空間上的排列方式,多以弱鍵互相連接,疏水力、氫鍵、鹽鍵第五十頁第五十一頁,共75頁。蛋白質(zhì)二級結(jié)構(gòu)預(yù)測一級序列(1D)MVLSEGEWQLVLHVWAKVEADVAGHGQDILIRLFKSHPETLEKFDRVKHLKTEAEMKASEDLKKHGVTVLTALGAILKKKGHHEAELKPLAQSHATKHKIPIKYLEFISEAIIHVLHSRHPGNFGADAQGAMNKALELFRKDIAAKYKELGYQG

二級結(jié)構(gòu)(2D)第五十一頁第五十二頁,共75頁。參考文獻:Rost,B.&Sander,C.(1993),Predictionofproteinsecondarystructureatbetterthan70%Accuracy,JournalofMolecularBiology,232,584-599.Accuracy:75%PHD第五十二頁第五十三頁,共75頁。參考文獻:Jones,D.,1999.Proteinsecondarystructurepredictionbasedonposition-specificscoringmatrices.J.Mol.Biol292,195-202.Accuracy:80%PSIPRED第五十三頁第五十四頁,共75頁。PSIPRED第五十四頁第五十五頁,共75頁。PSIPRED第五十五頁第五十六頁,共75頁。蛋白質(zhì)三級結(jié)構(gòu)預(yù)測同源建模法從頭預(yù)測方法Threading方法組合方法第五十六頁第五十七頁,共75頁。同源建模法同源建模是使用與目標序列同源的某一蛋白質(zhì)的實驗結(jié)構(gòu)作為模板,對目標序列進行三維結(jié)構(gòu)的預(yù)測。第五十七頁第五十八頁,共75頁。同源建模法同源建模對于詮釋蛋白質(zhì)序列、結(jié)構(gòu)和功能之間的關(guān)系至關(guān)重要。同源建模應(yīng)用廣泛,但仍有一些局限,其準確性依賴于模板的質(zhì)量和關(guān)鍵步驟的準確性。同源建模目前的挑戰(zhàn)仍然在于結(jié)構(gòu)模型的優(yōu)化,既需要尋找更合理的優(yōu)化方法來使模型接近真實結(jié)構(gòu)而不是模板結(jié)構(gòu)。另外一個挑戰(zhàn)在于過度依賴“序列相似,結(jié)構(gòu)相似”的規(guī)則,有些蛋白質(zhì)序列差異大結(jié)構(gòu)卻相似,需要分辨這樣的“特例”。第五十八頁第五十九頁,共75頁。從頭預(yù)測方法從頭計算(Abinitio)方法:這類方法的依據(jù)是熱力學(xué)理論,即求蛋白質(zhì)能量最小的狀態(tài)。生物學(xué)家和物理學(xué)家等認為從原理上講能量是影響蛋白質(zhì)結(jié)構(gòu)的本質(zhì)因素。由于巨大的計算量,這種方法并不實用,目前只能計算短序列氨基酸形成的結(jié)構(gòu)。隨著超級計算機的出現(xiàn),計算機的計算能力在飛速發(fā)展,這個問題會解決嗎?第五十九頁第六十頁,共75頁。從頭預(yù)測方法能量函數(shù)鍵能(bondenergy)鍵的轉(zhuǎn)角能(bondangleenergy)二面角能(dihedralangleenergy)范德華力(vanderWaalsenergy)靜電力(electrostaticenergy)根據(jù)能量函數(shù)計算結(jié)構(gòu)的最小自由能:MolecularDynamicsorMonteCarlomethods計算量大第六十頁第六十一頁,共75頁。Threading方法穿線法(Threading)方法:由于AbInitio方法目前只有理論上的意義,Homology方法受限于待求蛋白質(zhì)必需和已知模板庫中某個蛋白質(zhì)有較高的序列相似性,對于其他大部分蛋白質(zhì)來說,有必要尋求新的方法。Threading就此應(yīng)運而生。第六十一頁第六十二頁,共75頁。Threading方法Threading將給定序列與模板庫做序列比較(foldlibrary)評分準則:給定序列是否與模板的結(jié)構(gòu)吻合(1D-3Dprofile)根據(jù)打分結(jié)果對模板適用性給予排序

TargetSequenceStructureTemplates

ALKKGF…HFDTSE第六十二頁第六十三頁,共75頁。同源建模法組合方法╋Abinitio法Threading法╋第六十三頁第六十四頁,共75頁。蛋白質(zhì)結(jié)構(gòu)預(yù)測的原則蛋白質(zhì)結(jié)構(gòu)的預(yù)測過程是個比較復(fù)雜的多步過程,不同類別的蛋白質(zhì),例如膜蛋白與可溶蛋白,由于不同的理化性質(zhì),可能需要不同的預(yù)測方法。一個蛋白質(zhì)可能有多個功能結(jié)構(gòu)域(domain),要直接預(yù)測具有多個domain的蛋白質(zhì)不大可能,因為數(shù)據(jù)庫中可能沒有相應(yīng)的模板。在很大程度上,一個蛋白質(zhì)的各domain的折疊方式不依賴于其他domain的折疊方式,因此,每個domain的結(jié)構(gòu)可以單獨預(yù)測。于是如何在一個蛋白質(zhì)序列定位各個domain的邊界也成了結(jié)構(gòu)預(yù)測的一個問題。有些蛋白質(zhì)序列可能包含信號肽,它們與蛋白質(zhì)結(jié)構(gòu)信息無關(guān),所以可以切除。第六十四頁第六十五頁,共75頁。蛋白質(zhì)結(jié)構(gòu)預(yù)測的原則序列一致性(sequenceidentity)大于30%→同源建模法。序列一致性(sequenceidentity)小于30%→Threading法或組合方法。第六十五頁第六十六頁,共75頁。蛋白質(zhì)結(jié)構(gòu)預(yù)測方法的評價驗證方法是取已知結(jié)構(gòu)的蛋白質(zhì),對這些蛋白質(zhì)進行模擬結(jié)構(gòu)預(yù)測,并將預(yù)測結(jié)構(gòu)與真實結(jié)構(gòu)進行比較。一是分析兩者之間的均方差差距RMSD,還有一個評價標準是TM-score。權(quán)威的評判機構(gòu),建立公共認可的蛋白質(zhì)結(jié)構(gòu)測試數(shù)據(jù)集。設(shè)立在馬里蘭生物技術(shù)研究中心的CASP就是這樣一個系統(tǒng)(

)CASP(CriticalAssessmentofTechniquesforProteinStructurePrediction)被譽為蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的奧林匹克競賽,沒兩年舉辦1次。第六十六頁第六十七頁,共75頁。蛋白質(zhì)結(jié)構(gòu)預(yù)測軟件SWISS-MODEL(同源建模)Phyre/Phyre2

(同源建模+Threading)ROBETTA(從頭計算)Hhpred(Threading)I-TASSER(組合法)第六十七頁第六十八頁,共75頁。SWISS-MODEL利用同源建模的方法實現(xiàn)對一段未知序列的三級結(jié)構(gòu)的預(yù)測。該服務(wù)創(chuàng)建于1993年,瑞士生物信息學(xué)研究院維護,開

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論