藥物分子設(shè)計(jì)第九講

上傳人：d*** IP屬地：廣東上傳時(shí)間：2021-10-10 格式：PPT 頁數(shù)：29 大?。?91.50KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩24頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、藥物分子設(shè)計(jì)第九講1蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)(一一)Protein Structure Prediction (I)藥物分子設(shè)計(jì)第九講2Protein Structure Prediction From Sequence to Native Structure藥物分子設(shè)計(jì)第九講3Protein Structure PredictionPSI-BLAST藥物分子設(shè)計(jì)第九講4Protein Structure Prediction藥物分子設(shè)計(jì)第九講5Multiple Sequence Alignment Tools ClustalW Multiple sequence alignments r

2、eveal: conservation of individual residues conservation of regions differences within protein families藥物分子設(shè)計(jì)第九講6 Tools HMMer Profile For each position along the sequence, tabulate how often each type of amino acid occur (include . for gap) The pro always of size Nx21, no matter how many sequences ar

3、e considered藥物分子設(shè)計(jì)第九講7Protein Structure Prediction藥物分子設(shè)計(jì)第九講8Secondary Structure Prediction Given a protein sequence a1a2aN, secondary structure prediction aims at defining the state of each amino acid ai as being either H (helix), E (extended strand), or O (other) (Some methods have 4 states: H, E,

4、T for turns, and O for other). The quality of secondary structure prediction is measured with a Qindex (Qhelix, Qstrand, Qcoil) or Q3. Q3 is the percent of residues that match “reality” (X-ray structure). 藥物分子設(shè)計(jì)第九講9Secondary Structure PredictionAmino acid sequenceActual Secondary StructureQ3=22/29=7

5、6%Q3=22/29=76%ALHEASGPSVILFGSDVTVPPASNAEQAKhhhhhooooeeeeoooeeeooooohhhhhohhhooooeeeeoooooeeeooohhhhhhhhhhhoooohhhhooohhhooooohhhhh(useful prediction)(terrible prediction) Q3 for random prediction is 33% Secondary structure assignment in real proteins is uncertain to about 10%. Therefore, a “perfect”

6、 prediction would have Q3=90%.Limitations of Q3 (Q3 = Npredicted 100%/ Nobserved) 藥物分子設(shè)計(jì)第九講10Secondary Structure Prediction Chou-Fasman Method Start by computing amino acids propensities to belong to a given type of secondary structure: Propensities 1 mean that the residue type i is likely to be fou

7、nd in the corresponding secondary structure type.)()/()()/()()/(iPTurniPiPBetaiPiPHelixiP藥物分子設(shè)計(jì)第九講11 Chou-Fasman Method參數(shù)值P、P和Pt是分別在原有相應(yīng)值的基礎(chǔ)上乘以100得到 Secondary Structure Prediction藥物分子設(shè)計(jì)第九講12Secondary Structure Prediction Chou-Fasman Method Helix prediction 沿著蛋白質(zhì)序列尋找沿著蛋白質(zhì)序列尋找螺旋核，相鄰的螺旋核，相鄰的6 6個(gè)殘基中如果有

8、至個(gè)殘基中如果有至少少4 4個(gè)殘基傾向于形成個(gè)殘基傾向于形成螺旋，即有螺旋，即有4 4個(gè)殘基對(duì)應(yīng)的個(gè)殘基對(duì)應(yīng)的P P 100100，則認(rèn)為是螺旋核。則認(rèn)為是螺旋核。然后從螺旋核向兩端延伸，直至四肽片段然后從螺旋核向兩端延伸，直至四肽片段P P 的平均值小于的平均值小于100100為止。按上述方式找到的片段長(zhǎng)度大于為止。按上述方式找到的片段長(zhǎng)度大于5 5，并且，并且P P 的平的平均值大于均值大于P P 的平均值，那么這個(gè)片段的二級(jí)結(jié)構(gòu)就被預(yù)測(cè)的平均值，那么這個(gè)片段的二級(jí)結(jié)構(gòu)就被預(yù)測(cè)為為螺旋。此外，不容許螺旋。此外，不容許ProPro在螺旋內(nèi)部出現(xiàn)，但可出現(xiàn)在在螺旋內(nèi)部出現(xiàn)，但可出現(xiàn)在C

9、C末端以及末端以及N N端的前三位，這也用于終止螺旋的延伸。端的前三位，這也用于終止螺旋的延伸。藥物分子設(shè)計(jì)第九講13Secondary Structure Prediction Chou-Fasman Method Strand Prediction 如果相鄰如果相鄰6 6個(gè)殘基中若有個(gè)殘基中若有4 4個(gè)傾向于形成個(gè)傾向于形成折疊，即有折疊，即有4 4個(gè)殘個(gè)殘基對(duì)應(yīng)的基對(duì)應(yīng)的P P 100100，則認(rèn)為是折疊核。，則認(rèn)為是折疊核。折疊核向兩端延伸直至折疊核向兩端延伸直至4 4個(gè)殘基個(gè)殘基P P 的平均值小于的平均值小于100100為止。為止。若延伸后片段的若延伸后片段的P P 的平均值大于

10、的平均值大于105105，并且，并且P P 的平均值大的平均值大于于P P 的平均值，則該片段被預(yù)測(cè)為的平均值，則該片段被預(yù)測(cè)為折疊。折疊。藥物分子設(shè)計(jì)第九講14Secondary Structure Prediction Chou-Fasman Method Turn Prediction 轉(zhuǎn)角的模型為四肽組合模型，要考慮每個(gè)位置上殘基的組轉(zhuǎn)角的模型為四肽組合模型，要考慮每個(gè)位置上殘基的組合概率，即特定殘基在四肽模型中各個(gè)位置的概率。合概率，即特定殘基在四肽模型中各個(gè)位置的概率。在計(jì)算過程中，對(duì)于從第在計(jì)算過程中，對(duì)于從第i i個(gè)殘基開始的連續(xù)個(gè)殘基開始的連續(xù)4 4個(gè)殘基的片個(gè)殘基的片段，

11、將上述概率相乘，根據(jù)計(jì)算結(jié)果判斷是否是轉(zhuǎn)角。如段，將上述概率相乘，根據(jù)計(jì)算結(jié)果判斷是否是轉(zhuǎn)角。如果果f f(i)(i)f f(i+1)(i+1)f f(i+2)(i+2)f f(i+3)(i+3)大于大于7.57.51010-5-5，四肽，四肽片段片段P Pt t的平均值大于的平均值大于100100，并且，并且P Pt t 的均值同時(shí)大于的均值同時(shí)大于P P 的均的均值以及值以及P P 的均值，則可以預(yù)測(cè)這樣連續(xù)的的均值，則可以預(yù)測(cè)這樣連續(xù)的4 4個(gè)殘基形成轉(zhuǎn)個(gè)殘基形成轉(zhuǎn)角。角。藥物分子設(shè)計(jì)第九講15Secondary Structure Prediction Chou-Fasman Meth

12、od Conflict 假如預(yù)測(cè)出的螺旋區(qū)域和折疊區(qū)域存在重疊，則按照重疊假如預(yù)測(cè)出的螺旋區(qū)域和折疊區(qū)域存在重疊，則按照重疊區(qū)域區(qū)域P P 均值和均值和P P 均值的相對(duì)大小進(jìn)行預(yù)測(cè)，若均值的相對(duì)大小進(jìn)行預(yù)測(cè)，若P P 的均值的均值大于大于P P 的均值，則預(yù)測(cè)為螺旋；反之，預(yù)測(cè)為折疊。的均值，則預(yù)測(cè)為螺旋；反之，預(yù)測(cè)為折疊。藥物分子設(shè)計(jì)第九講16Secondary Structure Prediction GOR Method 是一種基于信息論和貝葉斯統(tǒng)計(jì)學(xué)的方法是一種基于信息論和貝葉斯統(tǒng)計(jì)學(xué)的方法 GOR將蛋白質(zhì)序列當(dāng)作一連串的信息值來處理將蛋白質(zhì)序列當(dāng)作一連串的信息值來處理 GOR方法

13、不僅考慮被預(yù)測(cè)位置本身氨基酸殘基種類的影響，方法不僅考慮被預(yù)測(cè)位置本身氨基酸殘基種類的影響，而且考慮相鄰殘基種類對(duì)該位置構(gòu)象的影響而且考慮相鄰殘基種類對(duì)該位置構(gòu)象的影響藥物分子設(shè)計(jì)第九講17Secondary Structure Prediction GOR Method 通過對(duì)已知二級(jí)結(jié)構(gòu)的蛋白樣本集進(jìn)行分析，計(jì)算出中心殘通過對(duì)已知二級(jí)結(jié)構(gòu)的蛋白樣本集進(jìn)行分析，計(jì)算出中心殘基的二級(jí)結(jié)構(gòu)分別為螺旋、折疊和轉(zhuǎn)角時(shí)每種氨基酸出現(xiàn)在基的二級(jí)結(jié)構(gòu)分別為螺旋、折疊和轉(zhuǎn)角時(shí)每種氨基酸出現(xiàn)在窗口中各個(gè)位置的頻率，從而產(chǎn)生一個(gè)窗口中各個(gè)位置的頻率，從而產(chǎn)生一個(gè)17172020的得分矩陣。的得分矩陣。然后利用

14、矩陣中的值來計(jì)算待預(yù)測(cè)的序列中每個(gè)殘基形成螺然后利用矩陣中的值來計(jì)算待預(yù)測(cè)的序列中每個(gè)殘基形成螺旋、折疊或者轉(zhuǎn)角的概率。旋、折疊或者轉(zhuǎn)角的概率。藥物分子設(shè)計(jì)第九講18Secondary Structure Prediction GOR Method 首先考慮兩個(gè)事件首先考慮兩個(gè)事件S S和和R R的條件概率的條件概率P P( (S S| |R R) )，即在，即在R R發(fā)生的條件發(fā)生的條件下，下，S S發(fā)生的概率發(fā)生的概率P P( (S S, ,R R) )是同時(shí)觀察到是同時(shí)觀察到S S 和和R R 的聯(lián)合概率的聯(lián)合概率, ,而而P P( (R R) )是是R R 的出現(xiàn)概的出現(xiàn)概率。率。

15、在二級(jí)結(jié)構(gòu)預(yù)測(cè)過程中，在二級(jí)結(jié)構(gòu)預(yù)測(cè)過程中，S S 表示特殊的二級(jí)結(jié)構(gòu)類型，表示特殊的二級(jí)結(jié)構(gòu)類型，R R 代代表氨基酸殘基，表氨基酸殘基，P P( (S S| |R R) )就是殘基就是殘基R R 處于二級(jí)結(jié)構(gòu)類型處于二級(jí)結(jié)構(gòu)類型S S 的概的概率。率。P P( (S S) )是在統(tǒng)計(jì)過程中觀察到二級(jí)結(jié)構(gòu)類型是在統(tǒng)計(jì)過程中觀察到二級(jí)結(jié)構(gòu)類型S S 的概率。的概率。 Statistics: helices 29.7%, strands 19.7%, turns 12.2%, coils 38.3%藥物分子設(shè)計(jì)第九講19Secondary Structure Prediction Lim Met

16、hod 氨基酸的理化性質(zhì)對(duì)二級(jí)結(jié)構(gòu)影響較大氨基酸的理化性質(zhì)對(duì)二級(jí)結(jié)構(gòu)影響較大在進(jìn)行結(jié)構(gòu)預(yù)測(cè)時(shí)考慮氨基酸殘基的物理化學(xué)性質(zhì)。如疏水在進(jìn)行結(jié)構(gòu)預(yù)測(cè)時(shí)考慮氨基酸殘基的物理化學(xué)性質(zhì)。如疏水性、極性、側(cè)鏈基團(tuán)的大小等，根據(jù)殘基各方面的性質(zhì)及殘性、極性、側(cè)鏈基團(tuán)的大小等，根據(jù)殘基各方面的性質(zhì)及殘基之間的組合預(yù)測(cè)可能形成的二級(jí)結(jié)構(gòu)?；g的組合預(yù)測(cè)可能形成的二級(jí)結(jié)構(gòu)。 “疏水性疏水性”是氨基酸的一種重要性質(zhì)，疏水性的氨基酸傾向是氨基酸的一種重要性質(zhì)，疏水性的氨基酸傾向于遠(yuǎn)離周圍水分子，將自己包埋進(jìn)蛋白質(zhì)的內(nèi)部。于遠(yuǎn)離周圍水分子，將自己包埋進(jìn)蛋白質(zhì)的內(nèi)部。藥物分子設(shè)計(jì)第九講20Secondary Struc

17、ture Prediction Lim Method Helix prediction 在一段序列中發(fā)現(xiàn)第在一段序列中發(fā)現(xiàn)第i、i+3、i+4位（如位（如1、4、5）是疏水）是疏水殘基時(shí)，這一片段就被預(yù)測(cè)為螺旋；殘基時(shí)，這一片段就被預(yù)測(cè)為螺旋；當(dāng)發(fā)現(xiàn)第當(dāng)發(fā)現(xiàn)第i、i+1、i+4位（如位（如7，8，11）為疏水殘基時(shí)，）為疏水殘基時(shí)，這一片段也被預(yù)測(cè)為螺旋。這一片段也被預(yù)測(cè)為螺旋。藥物分子設(shè)計(jì)第九講21Secondary Structure Prediction Lim Method Strand prediction 對(duì)于折疊，也存在著一些特征的親疏水殘基間隔模式，埋對(duì)于折疊，也存在著一些特

18、征的親疏水殘基間隔模式，埋藏的藏的折疊通常由連續(xù)的疏水殘基組成，一側(cè)暴露的折疊折疊通常由連續(xù)的疏水殘基組成，一側(cè)暴露的折疊則通常具有親水則通常具有親水-疏水的兩殘基重復(fù)模式。疏水的兩殘基重復(fù)模式。原則上，通過在序列中搜尋特殊的親疏水殘基間隔模式，就可原則上，通過在序列中搜尋特殊的親疏水殘基間隔模式，就可以預(yù)測(cè)螺旋和折疊。以預(yù)測(cè)螺旋和折疊。藥物分子設(shè)計(jì)第九講22Secondary Structure Prediction Neural Network 用于蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的基本神經(jīng)網(wǎng)絡(luò)模型為三層的前饋用于蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)的基本神經(jīng)網(wǎng)絡(luò)模型為三層的前饋網(wǎng)絡(luò)，包括輸入層、隱含層以及輸出層。網(wǎng)

19、絡(luò)，包括輸入層、隱含層以及輸出層。藥物分子設(shè)計(jì)第九講23 Neural Network 預(yù)測(cè)結(jié)果是窗口所取的輸入樣本中心的殘基所在位置的二級(jí)預(yù)測(cè)結(jié)果是窗口所取的輸入樣本中心的殘基所在位置的二級(jí)結(jié)構(gòu)。結(jié)構(gòu)。例如：例如： Pattern LSADQISTVQASFDK Target H 沿蛋白質(zhì)的氨基酸序列依次取一定大小的窗口，將窗口內(nèi)的沿蛋白質(zhì)的氨基酸序列依次取一定大小的窗口，將窗口內(nèi)的序列片段進(jìn)行編碼，窗口包括中心氨基酸序列片段進(jìn)行編碼，窗口包括中心氨基酸殘基及左右殘基及左右m個(gè)（共個(gè)（共2m+1個(gè)）殘基，每一個(gè)殘基用個(gè)）殘基，每一個(gè)殘基用21個(gè)神經(jīng)元編碼，因此，輸入個(gè)神經(jīng)元編碼，因此，輸入

20、層共有層共有21(2m+1)個(gè)神經(jīng)元。個(gè)神經(jīng)元。例如：例如：Alanine 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 輸出層有輸出層有3個(gè)神經(jīng)元，分別對(duì)應(yīng)于窗口中心殘基的個(gè)神經(jīng)元，分別對(duì)應(yīng)于窗口中心殘基的H、E、C三三態(tài)。結(jié)果由三個(gè)輸出中值最大的那個(gè)決定。態(tài)。結(jié)果由三個(gè)輸出中值最大的那個(gè)決定。例如：輸出值為（例如：輸出值為（0.2，0.1，0.1），則認(rèn)為是螺旋結(jié)構(gòu)。編），則認(rèn)為是螺旋結(jié)構(gòu)。編碼為：碼為：1 0 0 Secondary Structure Prediction藥物分子設(shè)計(jì)第九講24 Neural Network PHDsec (Pro neural network system from Heidelberg)Secondary Structure Prediction藥物分子設(shè)計(jì)第九講25 Neural Network PHDsec (Pro neural network system from Heidelberg) Input藥物分子設(shè)計(jì)第九講26 Neural Network PHDsec

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

藥物分子設(shè)計(jì)第九講

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

藥物分子設(shè)計(jì)第九講

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔