第五章-蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)和分子設(shè)計(jì)_第1頁
第五章-蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)和分子設(shè)計(jì)_第2頁
第五章-蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)和分子設(shè)計(jì)_第3頁
第五章-蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)和分子設(shè)計(jì)_第4頁
第五章-蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)和分子設(shè)計(jì)_第5頁
已閱讀5頁,還剩23頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第五章蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)和分子設(shè)計(jì)蛋白質(zhì)結(jié)構(gòu)的預(yù)測(cè)概述由于用X光晶體衍射和NMR核磁共振技術(shù)測(cè)定蛋白質(zhì)的三維結(jié)構(gòu),以及用生化方法研究蛋白質(zhì)的功能效率不高,無法適應(yīng)蛋白質(zhì)序列數(shù)量飛速增長(zhǎng)的需要。蛋白質(zhì)序列——結(jié)構(gòu)——功能….-Gly-Ala-Glu-Phe-….功能

蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)問題就是通過理論計(jì)算和統(tǒng)計(jì)模擬等方法尋找一種從蛋白質(zhì)的氨基酸線性序列到蛋白質(zhì)所有原子三維坐標(biāo)的一種映射。!蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)主要有兩大類方法:(1)理論分析方法通過理論計(jì)算(如分子力學(xué)、分子動(dòng)力學(xué)計(jì)算)進(jìn)行結(jié)構(gòu)預(yù)測(cè)。這種方法由于折疊前后的能量差太小、蛋白質(zhì)可能的構(gòu)象空間龐大和質(zhì)折疊的計(jì)算量太大等原因不大可行。(2)統(tǒng)計(jì)的方法對(duì)已知結(jié)構(gòu)的蛋白質(zhì)進(jìn)行統(tǒng)計(jì)分析,建立序列到結(jié)構(gòu)的映射模型,進(jìn)而對(duì)未知結(jié)構(gòu)的蛋白質(zhì)根據(jù)映射模型直接從氨基酸序列預(yù)測(cè)結(jié)構(gòu)。主要方法包括:經(jīng)驗(yàn)性方法根據(jù)一定序列形成一定結(jié)構(gòu)的傾向進(jìn)行結(jié)構(gòu)預(yù)測(cè)。結(jié)構(gòu)規(guī)律提取方法從蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫中提取關(guān)于蛋白質(zhì)結(jié)構(gòu)形成的一般性規(guī)則,指導(dǎo)建立未知結(jié)構(gòu)的蛋白質(zhì)的模型。同源模型化方法通過同源序列分析或者模式匹配預(yù)測(cè)蛋白質(zhì)的空間結(jié)構(gòu)或者結(jié)構(gòu)單元(如鋅指結(jié)構(gòu)、螺旋-轉(zhuǎn)角-螺旋結(jié)構(gòu)、DNA結(jié)合區(qū)域等)。這是目前預(yù)測(cè)結(jié)果最可靠的方法。預(yù)測(cè)蛋白質(zhì)的物理性質(zhì)由蛋白質(zhì)序列可以預(yù)測(cè)出蛋白質(zhì)的許多基本性質(zhì):氨基酸組成、等電點(diǎn)(pI)、分子質(zhì)量、酶切特性、親水性和疏水性、電荷分布等。相關(guān)工具有:ComputepI/MW(http://www.expasy.ch/tools/)是ExPASy工具包中的程序,計(jì)算蛋白質(zhì)的等電點(diǎn)和分子量。對(duì)于堿性蛋白質(zhì),計(jì)算出的等電點(diǎn)可能不準(zhǔn)確。PeptideMass(http://www.expasy.ch/tools/)是ExPASy工具包中的程序,分析蛋白質(zhì)在各種蛋白酶和化學(xué)試劑處理后的內(nèi)切產(chǎn)物(肽片段的相對(duì)分子質(zhì)量、理論等電點(diǎn)等)。TGREASE(/pub/fasta/)是FASTA工具包中的程序,分析蛋白質(zhì)序列的疏水性。這個(gè)程序延序列計(jì)算每個(gè)殘基位點(diǎn)的移動(dòng)平均疏水性,并給出疏水性-序列曲線,用這個(gè)程序可以發(fā)現(xiàn)膜蛋白的跨膜區(qū)和高疏水性區(qū)的明顯相關(guān)性。SAPS(http://www.isrec.isb-sib.ch/software/SAPS_form.html)蛋白質(zhì)序列統(tǒng)計(jì)分析,對(duì)提交的序列給出大量全面的分析數(shù)據(jù),包括氨基酸組成統(tǒng)計(jì)、電荷分布分析、電荷聚集區(qū)域、高度疏水區(qū)域、跨膜區(qū)段等。AACompIdent(http://www.expasy.ch/tools/)或PROSEARCH(http://www.embl-heidelberg.de/prs.html)利用未知蛋白的氨基酸組成檢索具有相同組成的已知蛋白。將查詢蛋白與庫中已知蛋白進(jìn)行比較,給出相似蛋白及其所打分?jǐn)?shù),分?jǐn)?shù)越高,可能性越大。蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)二級(jí)結(jié)構(gòu)是指α螺旋和β折疊等規(guī)則的蛋白質(zhì)局部結(jié)構(gòu)元件。二級(jí)結(jié)構(gòu)預(yù)測(cè)的基本依據(jù):每一段相鄰的氨基酸殘基具有形成一定二級(jí)結(jié)構(gòu)的傾向。二級(jí)結(jié)構(gòu)預(yù)測(cè)的目標(biāo):判斷每一段中心的殘基是否處于螺旋(H)、折疊(E)、轉(zhuǎn)角(-)(或其它狀態(tài))之一的二級(jí)結(jié)構(gòu)態(tài),即三態(tài)??偟膩碚f,二級(jí)結(jié)構(gòu)預(yù)測(cè)仍是未能完全解決的問題,一般對(duì)于α螺旋預(yù)測(cè)精度較好,對(duì)β折疊差些,而對(duì)除α螺旋和β折疊等之外的無規(guī)則二級(jí)結(jié)構(gòu)則效果很差。二級(jí)結(jié)構(gòu)預(yù)測(cè)的基本策略:(1)相似序列→相似結(jié)構(gòu)QLMGERIRARRKKLKQLMGAERIRARRKKLK結(jié)構(gòu)?(2)分類分析α螺旋提取樣本聚類分析學(xué)習(xí)分類規(guī)則預(yù)測(cè)….-Gly-Ala-Glu-Phe-….二級(jí)結(jié)構(gòu)預(yù)測(cè)的方法:經(jīng)驗(yàn)參數(shù)法又稱Chou-Fasman方法,是一種基于單個(gè)氨基酸殘基統(tǒng)計(jì)的經(jīng)驗(yàn)預(yù)測(cè)方法。通過統(tǒng)計(jì)分析,獲得的每個(gè)殘基出現(xiàn)于特定二級(jí)結(jié)構(gòu)構(gòu)象的傾向性因子,進(jìn)而利用這些傾向性因子預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu)?;具^程:掃描輸入的氨基酸序列,利用一組規(guī)則發(fā)現(xiàn)可能成為特定二級(jí)結(jié)構(gòu)成核區(qū)域的短序列,然后對(duì)于成核區(qū)域進(jìn)行擴(kuò)展,不斷擴(kuò)大成核區(qū)域,直到傾向性因子小于1.0為止。經(jīng)驗(yàn)規(guī)則:(i)α螺旋規(guī)則(ii)β折疊規(guī)則(iii)轉(zhuǎn)角規(guī)則(iv)重疊規(guī)則延伸成核區(qū)延伸(2)GOR方法基本過程:首先對(duì)已知二級(jí)結(jié)構(gòu)的蛋白樣本集進(jìn)行分析,計(jì)算出中心殘基的二級(jí)結(jié)構(gòu)分別為螺旋、折疊和轉(zhuǎn)角時(shí)每種氨基酸出現(xiàn)在窗口中各個(gè)位置的頻率,從而產(chǎn)生一個(gè)得分矩陣。然后利用矩陣中的值來計(jì)算待預(yù)測(cè)的序列中每個(gè)殘基形成螺旋、折疊或者轉(zhuǎn)角的概率。序列窗口中心殘基窗口中各個(gè)殘基對(duì)中心殘基二級(jí)結(jié)構(gòu)的支持程度(3)基于氨基酸疏水性的預(yù)測(cè)方法這種方法是一種用物理化學(xué)方法進(jìn)行二級(jí)結(jié)構(gòu)預(yù)測(cè)的方法,或稱為立體化學(xué)方法。在蛋白質(zhì)中,氨基酸的理化性質(zhì)對(duì)蛋白質(zhì)的二級(jí)結(jié)構(gòu)影響較大,因此在進(jìn)行結(jié)構(gòu)預(yù)測(cè)時(shí)需要考慮氨基酸殘基的物理化學(xué)性質(zhì),如疏水性、極性、側(cè)鏈基團(tuán)的大小等,根據(jù)氨基酸殘基各方面的性質(zhì)及殘基之間的組合預(yù)測(cè)可能形成的二級(jí)結(jié)構(gòu)?!笆杷浴笔前被岬囊环N重要性質(zhì),疏水性的氨基酸傾向于遠(yuǎn)離周圍水分子,將自己包埋進(jìn)蛋白質(zhì)的內(nèi)部。這一趨勢(shì)加上空間立體條件和其它一些因素決定了一個(gè)蛋白質(zhì)最終折疊成的三維空間構(gòu)象。目前已經(jīng)總結(jié)出α螺旋和β折疊的預(yù)測(cè)規(guī)則。(4)同源分析法將待預(yù)測(cè)的片段與數(shù)據(jù)庫中已知二級(jí)結(jié)構(gòu)的片段進(jìn)行相似性比較,利用打分矩陣計(jì)算出相似性得分,根據(jù)相似性得分以及數(shù)據(jù)庫中的構(gòu)象態(tài),構(gòu)建出待預(yù)測(cè)片段的二級(jí)結(jié)構(gòu)。該方法對(duì)數(shù)據(jù)庫中同源序列的存在非常敏感,若數(shù)據(jù)庫中有相似性大于30%的序列,則預(yù)測(cè)準(zhǔn)確率可大大上升。(5)綜合方法在實(shí)際進(jìn)行蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)時(shí),往往會(huì)綜合應(yīng)用各種分析方法和相關(guān)數(shù)據(jù)。綜合方法不僅包括各種預(yù)測(cè)方法的綜合,而且也包括結(jié)構(gòu)實(shí)驗(yàn)結(jié)果、序列對(duì)比結(jié)果、蛋白質(zhì)結(jié)構(gòu)分類預(yù)測(cè)結(jié)果等信息的綜合。最常見的綜合方法是同時(shí)使用多個(gè)軟件進(jìn)行預(yù)測(cè),通過分析各個(gè)軟件的特點(diǎn)以及各個(gè)軟件預(yù)測(cè)結(jié)果,最終形成二級(jí)結(jié)構(gòu)一致性的預(yù)測(cè)結(jié)果。nnPredict(/~nomi/nnpredict.html)預(yù)測(cè)每個(gè)氨基酸的二級(jí)結(jié)構(gòu)類型。它將蛋白質(zhì)結(jié)構(gòu)類型分為全α蛋白、全β蛋白和α/β蛋白,輸出結(jié)果包括“H”(螺旋)、“E”(折疊)和“-”(轉(zhuǎn)角)。這個(gè)方法對(duì)全α蛋白能達(dá)到79%的準(zhǔn)確率。二級(jí)結(jié)構(gòu)預(yù)測(cè)的程序:PredictProtein(/predictprotein/)提供了序列搜索和結(jié)構(gòu)預(yù)測(cè)服務(wù)。它先在SWISS-PROT中搜索相似序列,構(gòu)建多序列比對(duì)的特征簡(jiǎn)圖,再在數(shù)據(jù)庫中搜索相似的特征簡(jiǎn)圖,然后來預(yù)測(cè)相應(yīng)的結(jié)構(gòu)特征,包括二級(jí)結(jié)構(gòu)。返回的結(jié)果包含大量預(yù)測(cè)過程中產(chǎn)生的信息,還包含每個(gè)殘基位點(diǎn)的預(yù)測(cè)可信度。這個(gè)方法的平均預(yù)測(cè)準(zhǔn)確率達(dá)到72%。SOPMA(http://pbil.ibcp..fr/)一種獨(dú)特的自優(yōu)化預(yù)測(cè)方法,它是用五種相互獨(dú)立的方法進(jìn)行預(yù)測(cè),然后將預(yù)測(cè)結(jié)果匯集成“一致預(yù)測(cè)結(jié)果”,采用的二級(jí)結(jié)構(gòu)預(yù)測(cè)方法包括GOR方法、Levin同源預(yù)測(cè)方法、雙重預(yù)測(cè)方法、PHD方法和SOPMA方法。其它特殊局部結(jié)構(gòu)的預(yù)測(cè)蛋白質(zhì)還存在一些特殊的局部結(jié)構(gòu),如膜蛋白的跨膜螺旋、信號(hào)肽、卷曲螺旋等,具有明顯的序列特征和結(jié)構(gòu)特征,也可用計(jì)算方法加以預(yù)測(cè)。COILS(/software/COILS_form.html)卷曲螺旋預(yù)測(cè)方法,將序列與已知的平行雙鏈卷曲螺旋數(shù)據(jù)庫進(jìn)行比較,得到相似性得分,并據(jù)此算出序列形成卷曲螺旋的概率。TMpred(/software/TMPRED_form.html)預(yù)測(cè)蛋白質(zhì)的跨膜區(qū)段和在膜上的取向,它根據(jù)來自SWISS-PROT的跨膜蛋白數(shù)據(jù)庫Tmbase,利用跨膜結(jié)構(gòu)區(qū)段的數(shù)量、位置以及側(cè)翼信息,通過加權(quán)打分進(jìn)行預(yù)測(cè)。SignalP(http://www.cbs.dtu.dk/services/SignalP/)信號(hào)肽(signalpeptide)是未成熟蛋白質(zhì)中,可被細(xì)胞轉(zhuǎn)運(yùn)系統(tǒng)識(shí)別的特征氨基酸序列。預(yù)測(cè)蛋白質(zhì)序列中信號(hào)肽的剪切位點(diǎn)。蛋白質(zhì)的三維結(jié)構(gòu)的預(yù)測(cè)蛋白質(zhì)三維結(jié)構(gòu)預(yù)測(cè)是最復(fù)雜和最困難的預(yù)測(cè)技術(shù)。研究發(fā)現(xiàn),序列差異較大的蛋白質(zhì)序列也可能折疊成類似的三維構(gòu)象,自然界里的蛋白質(zhì)結(jié)構(gòu)骨架的多樣性遠(yuǎn)少于蛋白質(zhì)序列的多樣性。盡管由于蛋白質(zhì)的折疊過程仍然不十分清楚,但也發(fā)展出了一些有一定作用的三維結(jié)構(gòu)預(yù)測(cè)方法。三維結(jié)構(gòu)的預(yù)測(cè)方法:1.同源模型化方法主要思想:對(duì)于一個(gè)未知結(jié)構(gòu)的蛋白質(zhì),找到一個(gè)已知結(jié)構(gòu)的同源蛋白質(zhì),以該蛋白質(zhì)的結(jié)構(gòu)為模板,為未知結(jié)構(gòu)的蛋白質(zhì)建立結(jié)構(gòu)模型。依據(jù):任何一對(duì)蛋白質(zhì),如果兩者的序列等同部分超過30%,則它們具有相似的三維結(jié)構(gòu),即兩個(gè)蛋白質(zhì)的基本折疊相同,只是在非螺旋和非折疊區(qū)域的一些細(xì)節(jié)部分有所不同。對(duì)于具有60%等同的序列,用上述方法所建立的三維模型非常準(zhǔn)確。若序列的等同部分超過60%,則預(yù)測(cè)結(jié)果將接近于實(shí)驗(yàn)得到的測(cè)試結(jié)果。一般如果序列的等同部分大于30%,則可以期望得到比較好的預(yù)測(cè)結(jié)果。2.線索化方法(折疊識(shí)別方法)遠(yuǎn)程同源:有很多蛋白質(zhì)具有相似的空間結(jié)構(gòu),但它們的序列等同部分小于25%。線索化的主要思想:建立一個(gè)從目標(biāo)序列到已知結(jié)構(gòu)的線索,利用氨基酸的結(jié)構(gòu)傾向(如形成二級(jí)結(jié)構(gòu)的傾向、疏水性、極性等),評(píng)價(jià)一個(gè)序列所對(duì)應(yīng)的結(jié)構(gòu)是否能夠適配到一個(gè)給定的結(jié)構(gòu)環(huán)境中。建立序列到結(jié)構(gòu)的線索的過程稱為線索化,線索技術(shù)又稱折疊識(shí)別技術(shù)。線索化目標(biāo)是為目標(biāo)蛋白質(zhì)尋找合適的蛋白質(zhì)模板,這些模板蛋白質(zhì)與未知序列沒有顯著的序列相似性,但卻是遠(yuǎn)程同源的。未知序列與結(jié)構(gòu)數(shù)據(jù)庫核心折疊比對(duì)取最佳核心折疊建立結(jié)構(gòu)模型3.從頭預(yù)測(cè)方法在既沒有已知結(jié)構(gòu)的同源蛋白質(zhì)、也沒有已知結(jié)構(gòu)的遠(yuǎn)程同源蛋白質(zhì)的情況下,上述兩種蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)的方法都不能用,這時(shí)只能采用從頭預(yù)測(cè)方法,即(直接)僅僅根據(jù)序列本身來預(yù)測(cè)其結(jié)構(gòu)。目前這種方法還難以產(chǎn)生準(zhǔn)確的預(yù)測(cè)結(jié)構(gòu)。相關(guān)資源:SWISS-MODEL(http://www.expasy.ch/swissmod/SWISS-MODEL.html)自動(dòng)蛋白質(zhì)同源模建服務(wù)器。CPHmodels(http://www.cbs.dtu.dk/services/CPHmodels/)同源模建預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。預(yù)測(cè)方法評(píng)價(jià)對(duì)各種方法所得到的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)結(jié)果需要進(jìn)行驗(yàn)證,以確定預(yù)測(cè)方法是否可行,確定其適應(yīng)面。驗(yàn)證的方法是取已知結(jié)構(gòu)的蛋白質(zhì),對(duì)這些蛋白質(zhì)進(jìn)行模擬結(jié)構(gòu)預(yù)測(cè),并將預(yù)測(cè)結(jié)構(gòu)與真實(shí)結(jié)構(gòu)進(jìn)行比較,分析兩者之間的差距。為了客觀地評(píng)價(jià)各種預(yù)測(cè)方法,已經(jīng)設(shè)立了權(quán)威的評(píng)判機(jī)構(gòu),建立公共認(rèn)可的蛋白質(zhì)結(jié)構(gòu)測(cè)試數(shù)據(jù)集。設(shè)立在馬里蘭生物技術(shù)研究中心的CASP就是這樣一個(gè)系統(tǒng)(/casp4/)。

蛋白質(zhì)分子設(shè)計(jì)蛋白質(zhì)工程通過生物技術(shù)手段對(duì)蛋白質(zhì)的分子結(jié)構(gòu)或者對(duì)編碼蛋白質(zhì)的基因進(jìn)行改造,以便獲的更適合人類需要的蛋白質(zhì)產(chǎn)品的技術(shù)。蛋白質(zhì)的分子設(shè)計(jì)是為有目的的蛋白質(zhì)工程改造提供設(shè)計(jì)方案。這是一門新興的研究領(lǐng)域,其本身在不斷地發(fā)展,其內(nèi)容也在不斷地更新。蛋白質(zhì)分子設(shè)計(jì)的過程首先建立所研究對(duì)象的結(jié)構(gòu)模型,在此基礎(chǔ)上進(jìn)行結(jié)構(gòu)-功能關(guān)系研究,然后提出設(shè)計(jì)方案,通過實(shí)驗(yàn)驗(yàn)證后進(jìn)一步修正設(shè)計(jì),往往需要幾次循環(huán)才能達(dá)到目的。具體步驟:(1)建立所研究蛋白質(zhì)的結(jié)構(gòu)模型??赏ㄟ^PDB等蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫查閱蛋白結(jié)構(gòu),也可通過X射線晶體學(xué)、二維核磁共振等測(cè)定結(jié)構(gòu),還可根據(jù)類似物的結(jié)構(gòu)或其他結(jié)構(gòu)預(yù)測(cè)方法建立起結(jié)構(gòu)模型。(2)找出對(duì)所要求的性質(zhì)有重要影響的位置。可蛋白質(zhì)的序列對(duì)比、分析找出影響蛋白質(zhì)功能的重要位點(diǎn),這是分子設(shè)計(jì)工作的關(guān)鍵。(3)構(gòu)建和篩選突變體利用生物技術(shù)手段構(gòu)建突變體,然后從中選擇一系列的蛋白質(zhì)功能重要位點(diǎn)上殘基被改變的突變體。(4)預(yù)測(cè)突變體的結(jié)構(gòu)。預(yù)測(cè)新蛋白質(zhì)的二級(jí)和三級(jí)結(jié)構(gòu),是否符合分子設(shè)計(jì)的預(yù)期結(jié)構(gòu)。(5)定性或定量計(jì)算優(yōu)化所得到的突變體結(jié)構(gòu)是否具有所要求的性質(zhì)能否成功地進(jìn)行分子設(shè)計(jì),需要實(shí)驗(yàn)數(shù)據(jù)的驗(yàn)證新蛋白質(zhì)的功能是否達(dá)到預(yù)期目標(biāo)。按照改造部位的多寡將蛋白質(zhì)的分子設(shè)計(jì)分為三類:(1)“小改”通過基因突變或化學(xué)修飾等方法改變個(gè)別氨基酸或刪除

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論