藥物分子設(shè)計(jì)第九講_第1頁
藥物分子設(shè)計(jì)第九講_第2頁
藥物分子設(shè)計(jì)第九講_第3頁
藥物分子設(shè)計(jì)第九講_第4頁
藥物分子設(shè)計(jì)第九講_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、藥物分子設(shè)計(jì)第九講1蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)(一一)Protein Structure Prediction (I)藥物分子設(shè)計(jì)第九講2Protein Structure Prediction From Sequence to Native Structure藥物分子設(shè)計(jì)第九講3Protein Structure PredictionPSI-BLAST藥物分子設(shè)計(jì)第九講4Protein Structure Prediction藥物分子設(shè)計(jì)第九講5Multiple Sequence Alignment Tools ClustalW Multiple sequence alignments r

2、eveal: conservation of individual residues conservation of regions differences within protein families藥物分子設(shè)計(jì)第九講6 Tools HMMer Profile For each position along the sequence, tabulate how often each type of amino acid occur (include . for gap) The pro always of size Nx21, no matter how many sequences ar

3、e considered藥物分子設(shè)計(jì)第九講7Protein Structure Prediction藥物分子設(shè)計(jì)第九講8Secondary Structure Prediction Given a protein sequence a1a2aN, secondary structure prediction aims at defining the state of each amino acid ai as being either H (helix), E (extended strand), or O (other) (Some methods have 4 states: H, E,

4、T for turns, and O for other). The quality of secondary structure prediction is measured with a Qindex (Qhelix, Qstrand, Qcoil) or Q3. Q3 is the percent of residues that match “reality” (X-ray structure). 藥物分子設(shè)計(jì)第九講9Secondary Structure PredictionAmino acid sequenceActual Secondary StructureQ3=22/29=7

5、6%Q3=22/29=76%ALHEASGPSVILFGSDVTVPPASNAEQAKhhhhhooooeeeeoooeeeooooohhhhhohhhooooeeeeoooooeeeooohhhhhhhhhhhoooohhhhooohhhooooohhhhh(useful prediction)(terrible prediction) Q3 for random prediction is 33% Secondary structure assignment in real proteins is uncertain to about 10%. Therefore, a “perfect”

6、 prediction would have Q3=90%.Limitations of Q3 (Q3 = Npredicted 100%/ Nobserved) 藥物分子設(shè)計(jì)第九講10Secondary Structure Prediction Chou-Fasman Method Start by computing amino acids propensities to belong to a given type of secondary structure: Propensities 1 mean that the residue type i is likely to be fou

7、nd in the corresponding secondary structure type.)()/()()/()()/(iPTurniPiPBetaiPiPHelixiP藥物分子設(shè)計(jì)第九講11 Chou-Fasman Method參數(shù)值P、P和Pt是分別在原有相應(yīng)值的基礎(chǔ)上乘以100得到 Secondary Structure Prediction藥物分子設(shè)計(jì)第九講12Secondary Structure Prediction Chou-Fasman Method Helix prediction 沿著蛋白質(zhì)序列尋找沿著蛋白質(zhì)序列尋找 螺旋核,相鄰的螺旋核,相鄰的6 6個(gè)殘基中如果有

8、至個(gè)殘基中如果有至少少4 4個(gè)殘基傾向于形成個(gè)殘基傾向于形成 螺旋,即有螺旋,即有4 4個(gè)殘基對(duì)應(yīng)的個(gè)殘基對(duì)應(yīng)的P P 100100,則認(rèn)為是螺旋核。則認(rèn)為是螺旋核。 然后從螺旋核向兩端延伸,直至四肽片段然后從螺旋核向兩端延伸,直至四肽片段P P 的平均值小于的平均值小于100100為止。按上述方式找到的片段長(zhǎng)度大于為止。按上述方式找到的片段長(zhǎng)度大于5 5,并且,并且P P 的平的平均值大于均值大于P P 的平均值,那么這個(gè)片段的二級(jí)結(jié)構(gòu)就被預(yù)測(cè)的平均值,那么這個(gè)片段的二級(jí)結(jié)構(gòu)就被預(yù)測(cè)為為 螺旋。此外,不容許螺旋。此外,不容許ProPro在螺旋內(nèi)部出現(xiàn),但可出現(xiàn)在在螺旋內(nèi)部出現(xiàn),但可出現(xiàn)在C

9、C末端以及末端以及N N端的前三位,這也用于終止螺旋的延伸。端的前三位,這也用于終止螺旋的延伸。藥物分子設(shè)計(jì)第九講13Secondary Structure Prediction Chou-Fasman Method Strand Prediction 如果相鄰如果相鄰6 6個(gè)殘基中若有個(gè)殘基中若有4 4個(gè)傾向于形成個(gè)傾向于形成折疊,即有折疊,即有4 4個(gè)殘個(gè)殘基對(duì)應(yīng)的基對(duì)應(yīng)的P P 100100,則認(rèn)為是折疊核。,則認(rèn)為是折疊核。 折疊核向兩端延伸直至折疊核向兩端延伸直至4 4個(gè)殘基個(gè)殘基P P 的平均值小于的平均值小于100100為止。為止。若延伸后片段的若延伸后片段的P P 的平均值大于

10、的平均值大于105105,并且,并且P P 的平均值大的平均值大于于P P 的平均值,則該片段被預(yù)測(cè)為的平均值,則該片段被預(yù)測(cè)為折疊。折疊。藥物分子設(shè)計(jì)第九講14Secondary Structure Prediction Chou-Fasman Method Turn Prediction 轉(zhuǎn)角的模型為四肽組合模型,要考慮每個(gè)位置上殘基的組轉(zhuǎn)角的模型為四肽組合模型,要考慮每個(gè)位置上殘基的組合概率,即特定殘基在四肽模型中各個(gè)位置的概率。合概率,即特定殘基在四肽模型中各個(gè)位置的概率。 在計(jì)算過程中,對(duì)于從第在計(jì)算過程中,對(duì)于從第i i個(gè)殘基開始的連續(xù)個(gè)殘基開始的連續(xù)4 4個(gè)殘基的片個(gè)殘基的片段,

11、將上述概率相乘,根據(jù)計(jì)算結(jié)果判斷是否是轉(zhuǎn)角。如段,將上述概率相乘,根據(jù)計(jì)算結(jié)果判斷是否是轉(zhuǎn)角。如果果f f(i)(i)f f(i+1)(i+1)f f(i+2)(i+2)f f(i+3)(i+3)大于大于7.57.51010-5-5,四肽,四肽片段片段P Pt t的平均值大于的平均值大于100100,并且,并且P Pt t 的均值同時(shí)大于的均值同時(shí)大于P P 的均的均值以及值以及P P 的均值,則可以預(yù)測(cè)這樣連續(xù)的的均值,則可以預(yù)測(cè)這樣連續(xù)的4 4個(gè)殘基形成轉(zhuǎn)個(gè)殘基形成轉(zhuǎn)角。角。藥物分子設(shè)計(jì)第九講15Secondary Structure Prediction Chou-Fasman Meth

12、od Conflict 假如預(yù)測(cè)出的螺旋區(qū)域和折疊區(qū)域存在重疊,則按照重疊假如預(yù)測(cè)出的螺旋區(qū)域和折疊區(qū)域存在重疊,則按照重疊區(qū)域區(qū)域P P 均值和均值和P P 均值的相對(duì)大小進(jìn)行預(yù)測(cè),若均值的相對(duì)大小進(jìn)行預(yù)測(cè),若P P 的均值的均值大于大于P P 的均值,則預(yù)測(cè)為螺旋;反之,預(yù)測(cè)為折疊。的均值,則預(yù)測(cè)為螺旋;反之,預(yù)測(cè)為折疊。 藥物分子設(shè)計(jì)第九講16Secondary Structure Prediction GOR Method 是一種基于信息論和貝葉斯統(tǒng)計(jì)學(xué)的方法是一種基于信息論和貝葉斯統(tǒng)計(jì)學(xué)的方法 GOR將蛋白質(zhì)序列當(dāng)作一連串的信息值來處理將蛋白質(zhì)序列當(dāng)作一連串的信息值來處理 GOR方法

13、不僅考慮被預(yù)測(cè)位置本身氨基酸殘基種類的影響,方法不僅考慮被預(yù)測(cè)位置本身氨基酸殘基種類的影響,而且考慮相鄰殘基種類對(duì)該位置構(gòu)象的影響而且考慮相鄰殘基種類對(duì)該位置構(gòu)象的影響 藥物分子設(shè)計(jì)第九講17Secondary Structure Prediction GOR Method 通過對(duì)已知二級(jí)結(jié)構(gòu)的蛋白樣本集進(jìn)行分析,計(jì)算出中心殘通過對(duì)已知二級(jí)結(jié)構(gòu)的蛋白樣本集進(jìn)行分析,計(jì)算出中心殘基的二級(jí)結(jié)構(gòu)分別為螺旋、折疊和轉(zhuǎn)角時(shí)每種氨基酸出現(xiàn)在基的二級(jí)結(jié)構(gòu)分別為螺旋、折疊和轉(zhuǎn)角時(shí)每種氨基酸出現(xiàn)在窗口中各個(gè)位置的頻率,從而產(chǎn)生一個(gè)窗口中各個(gè)位置的頻率,從而產(chǎn)生一個(gè)17172020的得分矩陣。的得分矩陣。然后利用

14、矩陣中的值來計(jì)算待預(yù)測(cè)的序列中每個(gè)殘基形成螺然后利用矩陣中的值來計(jì)算待預(yù)測(cè)的序列中每個(gè)殘基形成螺旋、折疊或者轉(zhuǎn)角的概率。旋、折疊或者轉(zhuǎn)角的概率。 藥物分子設(shè)計(jì)第九講18Secondary Structure Prediction GOR Method 首先考慮兩個(gè)事件首先考慮兩個(gè)事件S S和和R R的條件概率的條件概率P P( (S S| |R R) ),即在,即在R R發(fā)生的條件發(fā)生的條件下,下,S S發(fā)生的概率發(fā)生的概率P P( (S S, ,R R) )是同時(shí)觀察到是同時(shí)觀察到S S 和和R R 的聯(lián)合概率的聯(lián)合概率, ,而而P P( (R R) )是是R R 的出現(xiàn)概的出現(xiàn)概率。率。

15、在二級(jí)結(jié)構(gòu)預(yù)測(cè)過程中,在二級(jí)結(jié)構(gòu)預(yù)測(cè)過程中,S S 表示特殊的二級(jí)結(jié)構(gòu)類型,表示特殊的二級(jí)結(jié)構(gòu)類型,R R 代代表氨基酸殘基,表氨基酸殘基,P P( (S S| |R R) )就是殘基就是殘基R R 處于二級(jí)結(jié)構(gòu)類型處于二級(jí)結(jié)構(gòu)類型S S 的概的概率。率。P P( (S S) )是在統(tǒng)計(jì)過程中觀察到二級(jí)結(jié)構(gòu)類型是在統(tǒng)計(jì)過程中觀察到二級(jí)結(jié)構(gòu)類型S S 的概率。的概率。 Statistics: helices 29.7%, strands 19.7%, turns 12.2%, coils 38.3%藥物分子設(shè)計(jì)第九講19Secondary Structure Prediction Lim Met

16、hod 氨基酸的理化性質(zhì)對(duì)二級(jí)結(jié)構(gòu)影響較大氨基酸的理化性質(zhì)對(duì)二級(jí)結(jié)構(gòu)影響較大 在進(jìn)行結(jié)構(gòu)預(yù)測(cè)時(shí)考慮氨基酸殘基的物理化學(xué)性質(zhì)。如疏水在進(jìn)行結(jié)構(gòu)預(yù)測(cè)時(shí)考慮氨基酸殘基的物理化學(xué)性質(zhì)。如疏水性、極性、側(cè)鏈基團(tuán)的大小等,根據(jù)殘基各方面的性質(zhì)及殘性、極性、側(cè)鏈基團(tuán)的大小等,根據(jù)殘基各方面的性質(zhì)及殘基之間的組合預(yù)測(cè)可能形成的二級(jí)結(jié)構(gòu)?;g的組合預(yù)測(cè)可能形成的二級(jí)結(jié)構(gòu)。 “疏水性疏水性”是氨基酸的一種重要性質(zhì),疏水性的氨基酸傾向是氨基酸的一種重要性質(zhì),疏水性的氨基酸傾向于遠(yuǎn)離周圍水分子,將自己包埋進(jìn)蛋白質(zhì)的內(nèi)部。于遠(yuǎn)離周圍水分子,將自己包埋進(jìn)蛋白質(zhì)的內(nèi)部。藥物分子設(shè)計(jì)第九講20Secondary Struc

17、ture Prediction Lim Method Helix prediction 在一段序列中發(fā)現(xiàn)第在一段序列中發(fā)現(xiàn)第i、i+3、i+4位(如位(如1、4、5)是疏水)是疏水殘基時(shí),這一片段就被預(yù)測(cè)為螺旋;殘基時(shí),這一片段就被預(yù)測(cè)為螺旋; 當(dāng)發(fā)現(xiàn)第當(dāng)發(fā)現(xiàn)第i、i+1、i+4位(如位(如7,8,11)為疏水殘基時(shí),)為疏水殘基時(shí),這一片段也被預(yù)測(cè)為螺旋。這一片段也被預(yù)測(cè)為螺旋。藥物分子設(shè)計(jì)第九講21Secondary Structure Prediction Lim Method Strand prediction 對(duì)于折疊,也存在著一些特征的親疏水殘基間隔模式,埋對(duì)于折疊,也存在著一些特

18、征的親疏水殘基間隔模式,埋藏的藏的折疊通常由連續(xù)的疏水殘基組成,一側(cè)暴露的折疊折疊通常由連續(xù)的疏水殘基組成,一側(cè)暴露的折疊則通常具有親水則通常具有親水-疏水的兩殘基重復(fù)模式。疏水的兩殘基重復(fù)模式。 原則上,通過在序列中搜尋特殊的親疏水殘基間隔模式,就可原則上,通過在序列中搜尋特殊的親疏水殘基間隔模式,就可以預(yù)測(cè)螺旋和折疊。以預(yù)測(cè)螺旋和折疊。 藥物分子設(shè)計(jì)第九講22Secondary Structure Prediction Neural Network 用于蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的基本神經(jīng)網(wǎng)絡(luò)模型為三層的前饋用于蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的基本神經(jīng)網(wǎng)絡(luò)模型為三層的前饋網(wǎng)絡(luò),包括輸入層、隱含層以及輸出層。網(wǎng)

19、絡(luò),包括輸入層、隱含層以及輸出層。藥物分子設(shè)計(jì)第九講23 Neural Network 預(yù)測(cè)結(jié)果是窗口所取的輸入樣本中心的殘基所在位置的二級(jí)預(yù)測(cè)結(jié)果是窗口所取的輸入樣本中心的殘基所在位置的二級(jí)結(jié)構(gòu)。結(jié)構(gòu)。 例如:例如: Pattern LSADQISTVQASFDK Target H 沿蛋白質(zhì)的氨基酸序列依次取一定大小的窗口,將窗口內(nèi)的沿蛋白質(zhì)的氨基酸序列依次取一定大小的窗口,將窗口內(nèi)的序列片段進(jìn)行編碼,窗口包括中心氨基酸序列片段進(jìn)行編碼,窗口包括中心氨基酸殘基及左右殘基及左右m個(gè)(共個(gè)(共2m+1個(gè))殘基,每一個(gè)殘基用個(gè))殘基,每一個(gè)殘基用21個(gè)神經(jīng)元編碼,因此,輸入個(gè)神經(jīng)元編碼,因此,輸入

20、層共有層共有21(2m+1)個(gè)神經(jīng)元。個(gè)神經(jīng)元。 例如:例如:Alanine 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 輸出層有輸出層有3個(gè)神經(jīng)元,分別對(duì)應(yīng)于窗口中心殘基的個(gè)神經(jīng)元,分別對(duì)應(yīng)于窗口中心殘基的H、E、C三三態(tài)。結(jié)果由三個(gè)輸出中值最大的那個(gè)決定。態(tài)。結(jié)果由三個(gè)輸出中值最大的那個(gè)決定。 例如:輸出值為(例如:輸出值為(0.2,0.1,0.1),則認(rèn)為是螺旋結(jié)構(gòu)。編),則認(rèn)為是螺旋結(jié)構(gòu)。編碼為:碼為:1 0 0 Secondary Structure Prediction藥物分子設(shè)計(jì)第九講24 Neural Network PHDsec (Pro neural network system from Heidelberg)Secondary Structure Prediction藥物分子設(shè)計(jì)第九講25 Neural Network PHDsec (Pro neural network system from Heidelberg) Input藥物分子設(shè)計(jì)第九講26 Neural Network PHDsec

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論