




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班結(jié)構(gòu)生物信息學(xué)結(jié)構(gòu)生物信息學(xué)蛋白質(zhì)二級結(jié)構(gòu)預(yù)測蛋白質(zhì)二級結(jié)構(gòu)預(yù)測生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班Outline背景簡介蛋白質(zhì)二級結(jié)構(gòu)預(yù)測算法蛋白質(zhì)二級結(jié)構(gòu)常用軟件生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班蛋白質(zhì)二級結(jié)構(gòu)預(yù)測蛋白質(zhì)蛋白質(zhì) 序列:序列: 二級結(jié)構(gòu):二級結(jié)構(gòu):QLMGERIRARRKKLK STHHHHHHHHHHHHT 由蛋白質(zhì)二級結(jié)構(gòu)統(tǒng)計分析得到的規(guī)則可用于全新蛋白質(zhì)設(shè)計或蛋白質(zhì)突變體的設(shè)計; 當(dāng)序列同源性較低時,二級結(jié)構(gòu)的指認(rèn)有助于確定蛋白質(zhì)間結(jié)構(gòu)與功能的關(guān)系; 同源蛋白質(zhì)模建中,二級結(jié)構(gòu)預(yù)測有助于建立正確的序列比對關(guān)系; 基于二級結(jié)構(gòu)片段堆積的三級結(jié)構(gòu)預(yù)
2、測中正確的二級結(jié)構(gòu)預(yù)測是第一步;背景簡介生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班蛋白質(zhì)二級結(jié)構(gòu)預(yù)測蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的基本依據(jù)是:每一段相鄰的氨基酸殘基具有形成一定二級結(jié)構(gòu)的每一段相鄰的氨基酸殘基具有形成一定二級結(jié)構(gòu)的傾向。傾向。二級結(jié)構(gòu)預(yù)測問題:模式分類和識別問題模式分類和識別問題二級結(jié)構(gòu)預(yù)測的目標(biāo):l判斷每一段中心的殘基是否處于螺旋、折疊、轉(zhuǎn)角(或其它狀態(tài))之一的二級結(jié)構(gòu)態(tài)。l蛋白質(zhì)中約85%的氨基酸殘基處于三種基本二級結(jié)構(gòu)狀態(tài)背景簡介生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班蛋白質(zhì)二級結(jié)構(gòu)預(yù)測蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的基本策略:背景簡介相似序列 相似結(jié)構(gòu)QLMGERIRARRKKLKQLMGAERIRARRKK
3、LK生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班蛋白質(zhì)二級結(jié)構(gòu)預(yù)測蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的基本策略:背景簡介模式分類螺旋提取樣本提取樣本聚類分析聚類分析學(xué)習(xí)分類規(guī)則學(xué)習(xí)分類規(guī)則預(yù)測預(yù)測.-Gly-Ala-Glu-Phe-.生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班蛋白質(zhì)二級結(jié)構(gòu)預(yù)測基本方法第一代是基于單個氨基酸殘基統(tǒng)計分析l從有限的數(shù)據(jù)集中提取各種殘基形成特定二級結(jié)構(gòu)的傾向,以此作為二級結(jié)構(gòu)預(yù)測的依據(jù)。第二代預(yù)測方法是基于氨基酸片段的統(tǒng)計分析l統(tǒng)計的對象是氨基酸片段l片段的長度通常為11-21l片段體現(xiàn)了中心殘基所處的環(huán)境l在預(yù)測中心殘基的二級結(jié)構(gòu)時,以殘基在特定環(huán)境形成特定二級結(jié)構(gòu)的傾向作為預(yù)測依據(jù)背景簡介生物信息學(xué)
4、培訓(xùn)班生物信息學(xué)培訓(xùn)班蛋白質(zhì)二級結(jié)構(gòu)預(yù)測基本方法第一/二代算法可以歸為幾類 (1)基于統(tǒng)計信息 (2)基于物理化學(xué)性質(zhì) (3)基于序列模式 (4)基于多層神經(jīng)網(wǎng)絡(luò) (5)基于多元統(tǒng)計 (6)基于機(jī)器學(xué)習(xí)的專家規(guī)則 (7)最鄰近算法背景簡介生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班蛋白質(zhì)二級結(jié)構(gòu)預(yù)測基本方法第三代是基于同源進(jìn)化信息和長程信息l通過序列比對可以得到蛋白質(zhì)序列的進(jìn)化信息,得到蛋白質(zhì)家族中的特定殘基替換模式;l通過序列的比對也可以得到長程信息l使二級結(jié)構(gòu)預(yù)測的準(zhǔn)確程度有了比較大的提高,特別是對折疊的預(yù)測準(zhǔn)確率有較大的提高,預(yù)測結(jié)果與實驗觀察趨于一致。背景簡介生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班Out
5、line背景簡介蛋白質(zhì)二級結(jié)構(gòu)預(yù)測算法蛋白質(zhì)二級結(jié)構(gòu)常用軟件生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 - 經(jīng)驗參數(shù)法經(jīng)驗參數(shù)法基本依據(jù):l蛋白質(zhì)二級結(jié)構(gòu)的組成規(guī)律性比較強(qiáng)l三種基本二級結(jié)構(gòu)平均占氨基酸殘基的85%l某些蛋白質(zhì)二級結(jié)構(gòu)構(gòu)成有傾向性u有些蛋白質(zhì)中含有大量的螺旋 (如血紅蛋白和肌紅蛋白)u有些蛋白質(zhì)的二級結(jié)構(gòu)以折疊為主(免疫球蛋白)l每種氨基酸出現(xiàn)在各種二級結(jié)構(gòu)中傾向或者頻率是不同的uGlu主要出現(xiàn)在螺旋中uAsp和Gly主要分布在轉(zhuǎn)角中uPro也常出現(xiàn)在轉(zhuǎn)角中,但是絕不會出現(xiàn)在螺旋中預(yù)測算法生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 - 經(jīng)驗參數(shù)法經(jīng)驗參數(shù)法:l由Ch
6、ou 和Fasman在70年代提出來l是一種基于單個氨基酸殘基統(tǒng)計的經(jīng)驗預(yù)測方法。通過統(tǒng)計分析,獲得的每個殘基出現(xiàn)于特定二級結(jié)構(gòu)構(gòu)象的傾向性因子,進(jìn)而利用這些傾向性因子預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)預(yù)測算法生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 - 經(jīng)驗參數(shù)法經(jīng)驗參數(shù)法:l傾向性因子:傾向性因子:一個氨基酸殘基的構(gòu)象傾向性因子定義為預(yù)測算法/ (, , )iiiPA Tic t - 螺旋-折疊;c -轉(zhuǎn)角;t - 無規(guī)卷曲所有被統(tǒng)計殘基處于構(gòu)象態(tài)i的比例殘基A處于構(gòu)象態(tài)i 的比例大于1.0表示該殘基傾向于形成二級結(jié)構(gòu)構(gòu)象i生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 - 經(jīng)驗參數(shù)法預(yù)測算法
7、生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 - 經(jīng)驗參數(shù)法經(jīng)驗參數(shù)法:l基本思想是在序列中尋找規(guī)則二級結(jié)構(gòu)的成核位點和終止位點l掃描輸入的氨基酸序列,利用一組規(guī)則發(fā)現(xiàn)可能成為特定二級結(jié)構(gòu)成核區(qū)域的短序列,然后對于成核區(qū)域進(jìn)行擴(kuò)展,不斷擴(kuò)大成核區(qū)域,直到傾向性因子小于1.0為止l規(guī)則:u螺旋規(guī)則 u折疊規(guī)則 u轉(zhuǎn)角規(guī)則 u重疊規(guī)則預(yù)測算法延伸 成核區(qū) 延伸生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 - 經(jīng)驗參數(shù)法經(jīng)驗參數(shù)法 - 螺旋規(guī)則:l沿蛋白質(zhì)序列尋找螺旋核u相鄰的6個殘基中如果有至少4個殘基傾向于形成螺旋,則認(rèn)為是螺旋核。l從螺旋核向兩端延伸u直至四肽片段的螺旋傾向性因子的平均
8、值P1.03,則預(yù)測為螺旋。 預(yù)測算法延伸 成核區(qū) 延伸生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 - 經(jīng)驗參數(shù)法經(jīng)驗參數(shù)法 折疊規(guī)則:l沿蛋白質(zhì)序列尋找折疊核u相鄰的6個殘基中如果有至少4個殘基傾向于形成折疊,則認(rèn)為是折疊核。l從螺旋核向兩端延伸u直至四肽片段的螺旋傾向性因子的平均值P1.05,則預(yù)測為折疊預(yù)測算法延伸 成核區(qū) 延伸生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 - 經(jīng)驗參數(shù)法經(jīng)驗參數(shù)法 轉(zhuǎn)角規(guī)則:l轉(zhuǎn)角的模型為四肽u四肽片段Pt的平均值大于100uPt的均值同時大于P 的均值以及P 的均值l則可以預(yù)測這樣連續(xù)的4個氨基酸形成轉(zhuǎn)角預(yù)測算法54321105 . 7jjj
9、jffff生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 - 經(jīng)驗參數(shù)法經(jīng)驗參數(shù)法 重疊規(guī)則:l對于螺旋和折疊的重疊區(qū)域,按P 和P 的相對大小進(jìn)行預(yù)測l若P 大于P ,則預(yù)測為螺旋;l反之,預(yù)測為折疊。預(yù)測算法生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 - GOR算法是一種基于信息論和貝葉斯統(tǒng)計學(xué)的方法;GOR將蛋白質(zhì)序列當(dāng)作一連串的信息值來處理;GOR方法不僅考慮被預(yù)測位置本身氨基酸殘基種類的影響,而且考慮相鄰殘基種類對該位置構(gòu)象的影響。 預(yù)測算法序列窗口 中心殘基窗口中各個殘基對中心殘基二級結(jié)構(gòu)的支持程度生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 - GOR算法定義信息為:
10、lP(S|R):兩個事件S和R的條件概率,即在R發(fā)生的條件下,S發(fā)生的概率l若S和R無關(guān),則 I(S; R)=0l若R的發(fā)生有利于S的發(fā)生,則I(S; R)0l若R的發(fā)生不利于S的發(fā)生,則I(S; R)0 I(S; R)在二級結(jié)構(gòu)預(yù)測中的含義lR代表中心氨基酸及其所處環(huán)境lS代表二級結(jié)構(gòu)類型lI(S; R)代表中心氨基酸處于S的信息值預(yù)測算法)(/ )|(log);(SPRSPRSI生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 - GOR算法例子:l假定數(shù)據(jù)庫中有1830個殘基, 780個處于螺旋態(tài),1050個處于非螺旋態(tài);l庫中共有390個丙氨酸(A),有240個A處于螺旋態(tài),其余150
11、個 A 處于非螺旋態(tài)。預(yù)測算法390/150390/2401830/10501830/780, ,AHAHHHffff,(; )log(/log(/) log(240/390)/(150/390) + log(1050/1830)/(780/1830) 0.7650H AH AHHIH Affff)生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 立體化學(xué)方法立體化學(xué)方法,基于氨基酸疏水性的預(yù)測方法:l氨基酸的理化性質(zhì)對二級結(jié)構(gòu)影響較大l在進(jìn)行結(jié)構(gòu)預(yù)測時考慮氨基酸殘基的物理化學(xué)性質(zhì),如疏水性、極性、側(cè)鏈基團(tuán)的大小等;l根據(jù)殘基各方面的性質(zhì)及殘基之間的組合預(yù)測可能形成的二級結(jié)構(gòu)。lLim等人對螺
12、旋和折疊歸納出了一套預(yù)測模式:l螺旋的輪狀結(jié)構(gòu)特征,輪的一側(cè)通常處于蛋白質(zhì)的疏水核心,另一側(cè)則常處于親水表面。l螺旋中親疏水氨基酸殘基的出現(xiàn)位置也就有一定的規(guī)律性,親水殘基多出現(xiàn)在親水側(cè)面,而疏水殘基則多出現(xiàn)在疏水側(cè)面,反映在序列上就是一些特征的親疏水殘基間隔模式預(yù)測算法生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 立體化學(xué)方法立體化學(xué)方法 - Lim方法:l螺旋的形成規(guī)律:u在一段序列中發(fā)現(xiàn)第i、i+3、i+4位(如1、4、5)是疏水殘基時,這一片段就被預(yù)測為螺旋;u當(dāng)發(fā)現(xiàn)第i、i+1、i+4位(如7,8,11)為疏水殘基時,這一片段也被預(yù)測為螺旋。l折疊的形成規(guī)律:u埋藏的折疊通常由連
13、續(xù)的疏水殘基組成,一側(cè)暴露的折疊則通常具有親水-疏水的兩殘基重復(fù)模式l原則上,通過在序列中搜尋特殊的親疏水殘基間隔模式,就可以預(yù)測螺旋和折疊預(yù)測算法生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 立體化學(xué)方法立體化學(xué)方法 -點模式方法:l將20種氨基酸殘基分為親水、疏水以及兩性殘基三類;l用八殘基片段表征親疏水間隔模式;l一個二進(jìn)制位代表一個殘基,疏水為1,親水為0,共8位;l八殘基片段的親疏水模式可用0255的數(shù)值來表示l螺旋的特征模式對應(yīng)的值為: 9,12,13,17,201,205,217,219,237l折疊的特征模式: 由連續(xù)的1或交替的01構(gòu)成預(yù)測算法生物信息學(xué)培訓(xùn)班生物信息學(xué)培
14、訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 立體化學(xué)方法立體化學(xué)方法 滑動窗口法:l直接計算序列片段的疏水性和疏水矩,并根據(jù)定量計算結(jié)果預(yù)測該片段對應(yīng)的二級結(jié)構(gòu);預(yù)測算法生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 同源分析法將待預(yù)測的片段與數(shù)據(jù)庫中已知二級結(jié)構(gòu)的片段進(jìn)行相似性比較,利用打分矩陣計算出相似性得分,根據(jù)相似性得分以及數(shù)據(jù)庫中的構(gòu)象態(tài),構(gòu)建出待預(yù)測片段的二級結(jié)構(gòu)該方法對數(shù)據(jù)庫中同源序列的存在非常敏感,若數(shù)據(jù)庫中有相似性大于30%的序列,則預(yù)測準(zhǔn)確率可大大上升預(yù)測算法生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 同源分析法預(yù)測算法假設(shè)已知二級結(jié)構(gòu)的氨基酸片段假設(shè)已知二級結(jié)構(gòu)的氨基酸片段T=STNG
15、IYWT的二級結(jié)構(gòu)為的二級結(jié)構(gòu)為CHHHHHT H代表代表 螺旋,螺旋, T代表轉(zhuǎn)角,代表轉(zhuǎn)角, C代表無規(guī)卷曲代表無規(guī)卷曲待預(yù)測二級結(jié)構(gòu)的氨基酸片段待預(yù)測二級結(jié)構(gòu)的氨基酸片段U=ATSGVFL序列比對:序列比對:T = S T N G I Y WU = A T S G V F L直接將直接將T的構(gòu)象態(tài)賦予的構(gòu)象態(tài)賦予U 生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 同源分析法更為合理的方法:l是將待預(yù)測二級結(jié)構(gòu)的蛋白質(zhì)U與多個同源序列進(jìn)行多重比對,對于U的每個殘基位置,其構(gòu)象態(tài)由多個同源序列對應(yīng)位置的構(gòu)象態(tài)決定,或取出現(xiàn)次數(shù)最多的構(gòu)象態(tài),或?qū)Ω鞣N可能的構(gòu)象態(tài)給出得分值。預(yù)測算法生物信息學(xué)
16、培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 神經(jīng)網(wǎng)絡(luò)法人工神經(jīng)網(wǎng)絡(luò)是一種復(fù)雜的信息處理模型,將蛋白質(zhì)序列看作是由各種氨基酸字符組成的字符序列,將氨基酸殘基片段作為輸入的一串語言字符,二級結(jié)構(gòu)即為對應(yīng)的輸出。神經(jīng)網(wǎng)絡(luò)可以有效地學(xué)習(xí)蛋白質(zhì)二級結(jié)構(gòu)形成的復(fù)雜規(guī)律或模式,提取更多的信息,并利用所掌握的信息進(jìn)行預(yù)測。利用神經(jīng)網(wǎng)絡(luò)方法可以提高二級結(jié)構(gòu)預(yù)測準(zhǔn)確率。預(yù)測算法生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 神經(jīng)網(wǎng)絡(luò)法二級結(jié)構(gòu)預(yù)測的人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測算法l輸入層用于接收蛋白質(zhì)窗口序列數(shù)據(jù)u沿蛋白質(zhì)的氨基酸序列依次取一定大小的窗口,將窗口內(nèi)的序列片段進(jìn)行編碼l輸出層有3個神經(jīng)元,分別對應(yīng)于窗口中心殘
17、基的H、E、C三態(tài)生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 神經(jīng)網(wǎng)絡(luò)法二級結(jié)構(gòu)預(yù)測的人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測算法生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 綜合方法綜合方法不僅包括各種預(yù)測方法的綜合,而且也包括結(jié)構(gòu)實驗結(jié)果、序列對比結(jié)果、蛋白質(zhì)結(jié)構(gòu)分類預(yù)測結(jié)果等信息的綜合。l多個程序同時預(yù)測,綜合評判一致結(jié)果l序列比對與二級結(jié)構(gòu)預(yù)測l雙重預(yù)測u首先預(yù)測蛋白質(zhì)的結(jié)構(gòu)類型u然后再預(yù)測二級結(jié)構(gòu)預(yù)測算法生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 進(jìn)化信息最早認(rèn)為:二級結(jié)構(gòu)主要是由局部氨基酸所決定蛋白質(zhì)序列家族中氨基酸的替換模式是高度特異的,如何利用這樣的進(jìn)化信息是二級結(jié)構(gòu)預(yù)測的關(guān)鍵蛋白
18、質(zhì)二級結(jié)構(gòu)預(yù)測軟件系統(tǒng)PHDl形成同源序列的多重對比排列l(wèi)將多重比對的統(tǒng)計結(jié)果送到一個神經(jīng)網(wǎng)絡(luò)中計算預(yù)測算法生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 進(jìn)化信息蛋白質(zhì)二級結(jié)構(gòu)預(yù)測軟件系統(tǒng)PHD預(yù)測算法整個網(wǎng)絡(luò)模型包括兩個層次:l第一層網(wǎng)絡(luò)進(jìn)行序列到結(jié)構(gòu)的映射l第二層網(wǎng)絡(luò)是一個結(jié)構(gòu)到結(jié)構(gòu)的映射,作用是對前一層網(wǎng)絡(luò)的輸出進(jìn)行校正生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 進(jìn)化信息蛋白質(zhì)二級結(jié)構(gòu)預(yù)測軟件系統(tǒng)PHD預(yù)測算法第一層網(wǎng)絡(luò)的輸入包括兩個部分:l序列的局部信息,取自窗口內(nèi)w個氨基酸殘基l整個序列的全局信息生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 進(jìn)化信息蛋白質(zhì)二級結(jié)構(gòu)預(yù)測軟
19、件系統(tǒng)PHD預(yù)測算法l取多重序列比對的w列,計算序列局部統(tǒng)計數(shù)據(jù)以及序列全局?jǐn)?shù)據(jù)。l局部數(shù)據(jù)有24個( 20種氨基酸,”空缺”,插入,刪除,保守程度);l全局?jǐn)?shù)據(jù)有32個生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 進(jìn)化信息蛋白質(zhì)二級結(jié)構(gòu)預(yù)測軟件系統(tǒng)PHD預(yù)測算法l第一層網(wǎng)絡(luò)輸出:窗口中心殘基二級結(jié)構(gòu)的狀態(tài),螺旋(H),折疊(E),其它(L)。l第二層網(wǎng)絡(luò)輸入:第一層網(wǎng)絡(luò)的輸出,全局信息以及局部的保守信息生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測方法 進(jìn)化信息蛋白質(zhì)二級結(jié)構(gòu)預(yù)測軟件系統(tǒng)PHD預(yù)測算法l序列多重比對的統(tǒng)計結(jié)果,反映了蛋白質(zhì)家族的共同特征l提取的結(jié)構(gòu)保守的信息。反映了在進(jìn)化過
20、程中,哪些部分的結(jié)構(gòu)容易發(fā)生變化,哪些部分對蛋白質(zhì)的功能非常重要l多重序列比對所攜帶的進(jìn)化信息暗示了蛋白質(zhì)中長程相互作用生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班Outline背景簡介蛋白質(zhì)二級結(jié)構(gòu)預(yù)測算法蛋白質(zhì)二級結(jié)構(gòu)常用軟件生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班蛋白質(zhì)二級結(jié)構(gòu)預(yù)測軟件介紹常用軟件常用軟件PredictProtein/Jpredhttp:/pbio.dundee.ac.uk/www-jpred/index.htmlPSIPREDhttp:/bioinf.cs.ucl.ac.uk/psipred/PREDATORhttp:/ PredictPro
21、tein 提供的功能提供的功能常用軟件l數(shù)據(jù)庫搜索:u多序列一致性分析(MaxHom)u功能性模體分析(ProSite)u區(qū)段復(fù)雜性分析(SEG)u蛋白質(zhì)結(jié)構(gòu)域分析(PRODOM)u基于預(yù)測線程的折疊結(jié)構(gòu)識別(AGAPE)l預(yù)測內(nèi)容:u二級結(jié)構(gòu)(PHDsec,PROFsec)u殘基可溶性(PHDacc,PROFacc)u跨膜螺旋區(qū)及拓?fù)鋵W(xué)PHDhtmPHDtopologyu球狀蛋白(GLOBE)u卷曲螺旋(COILS)u二硫鍵(CYSPRED)u結(jié)構(gòu)轉(zhuǎn)換(ASP)生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班蛋白質(zhì)二級結(jié)構(gòu)預(yù)測軟件介紹PredictProtein PredictProtein 的總流程的總流
22、程常用軟件生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班蛋白質(zhì)二級結(jié)構(gòu)預(yù)測軟件介紹PredictProtein PredictProtein 的序列分析流程的序列分析流程常用軟件生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班PredictProteinPredictProtein實例實例常用軟件輸入預(yù)測的蛋白質(zhì)序列生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班PredictProteinPredictProtein實例實例常用軟件生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班PredictProteinPredictProtein實例實例常用軟件蛋白質(zhì)序列點擊預(yù)測生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班PredictProteinPredictProtei
23、n實例實例常用軟件生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班PredictProteinPredictProtein實例實例常用軟件生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班PredictProteinPredictProtein實例實例常用軟件PROFsec :二級結(jié)構(gòu)PROFacc:殘基可溶性ASP:結(jié)構(gòu)轉(zhuǎn)換PHDhtm:跨膜螺旋區(qū)ISIS:相互作用位點生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班PredictProteinPredictProtein實例實例常用軟件PROFsec :二級結(jié)構(gòu)PROFacc:殘基可溶性ASP:結(jié)構(gòu)轉(zhuǎn)換PHDhtm:跨膜螺旋區(qū)ISIS:相互作用位點生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)
24、測軟件二級結(jié)構(gòu)預(yù)測軟件 - Jpred- Jpred常用軟件JpredJpred:http:/pbio.dundee.ac.uk/www-jpred/index.htmll一種互動式的蛋白質(zhì)二級結(jié)構(gòu)網(wǎng)絡(luò)預(yù)測服務(wù)器。它允許提交單一序列或者同一家族的多重序列,利用序列的進(jìn)化信息通過六種二級結(jié)構(gòu)預(yù)測算法(DSC、 PHD、 NNSSP、PREDATOR、ZPRED、 MULPRED )給出結(jié)果。它的最終結(jié)果是基于六種結(jié)果的一致性的基礎(chǔ)上的。生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測軟件二級結(jié)構(gòu)預(yù)測軟件 - PSIpred- PSIpred常用軟件PSIpredPSIpred: http:/bioi
25、nf.cs.ucl.ac.uk/psipred/l英國Barton實驗室開發(fā)的基于神經(jīng)網(wǎng)絡(luò)算法的蛋白質(zhì)二級結(jié)構(gòu)預(yù)測軟件,有效率可達(dá)73%。PSIpred是英國David.T.Jones實驗室開發(fā)的基于神經(jīng)網(wǎng)絡(luò)算法的蛋白質(zhì)二級結(jié)構(gòu)預(yù)測軟件。它可以在分析PSI-BLAST計算結(jié)果基礎(chǔ)上進(jìn)行結(jié)構(gòu)預(yù)測,有效率可達(dá)78% 。生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測軟件二級結(jié)構(gòu)預(yù)測軟件 - PSIpred- PSIpred常用軟件PSIpredPSIpred: http:/bioinf.cs.ucl.ac.uk/psipred/生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測軟件二級結(jié)構(gòu)預(yù)測軟件 SOPM
26、A常用軟件SOPMA: SOPMA: http:/pbil.ibcp.fr/htm/index.php?page=pbil_ibcp_ Webservers.htmll法國里昂的CNRS(Centre National dela Recherche Scientifique)使用獨特的方法進(jìn)行蛋白質(zhì)二級結(jié)構(gòu)預(yù)測。l使用5種相互獨立的方法進(jìn)行預(yù)測,并將結(jié)果匯集整理成一個“一致預(yù)測結(jié)果”。這5種方法包括:GOR、同源預(yù)測、雙重預(yù)測、PHD和SOPMA方法。lSOPMA這種自優(yōu)化的預(yù)測方法建立了已知二級結(jié)構(gòu)序列的次級數(shù)據(jù)庫,庫中的每個蛋白質(zhì)都經(jīng)過基于相似性的二級結(jié)構(gòu)預(yù)測。然后用次級庫中得到的信息去對
27、查詢序列進(jìn)行二級結(jié)構(gòu)預(yù)測生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測軟件二級結(jié)構(gòu)預(yù)測軟件 SOPMA常用軟件SOPMA: SOPMA: http:/pbil.ibcp.fr/htm/index.php?page=pbil_ibcp_ Webservers.html生物信息學(xué)培訓(xùn)班生物信息學(xué)培訓(xùn)班二級結(jié)構(gòu)預(yù)測軟件二級結(jié)構(gòu)預(yù)測軟件 COILS常用軟件COILS :/software/COILS_form.htmll卷曲螺旋預(yù)測方法,將序列與已知的平行雙鏈卷曲螺旋數(shù)據(jù)庫進(jìn)行比較,得到相似性得分,并據(jù)此算出序列形成卷曲螺旋的概率。lCOILS算法將查詢序列在一個由已知包含卷曲螺旋蛋白結(jié)構(gòu)的數(shù)據(jù)庫中進(jìn)行搜索。l程序也將查詢序列與包含球狀蛋白序列的PDB次
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 知識產(chǎn)權(quán)共有與品牌授權(quán)及市場推廣合作協(xié)議
- 政認(rèn)識民法典課件-2024-2025學(xué)年統(tǒng)編版道德與法治七年級下冊
- 醫(yī)學(xué)減肥健康宣教
- 《應(yīng)對地震安全:教育課件》
- 服務(wù)基本禮儀培訓(xùn)
- 《IPv6解決方案》課件
- 《臨床用藥管理與策略》課件
- 信息機(jī)房安全培訓(xùn)課件
- 《臨床護(hù)理操作規(guī)程》課件
- 《慢性心力衰竭治療》課件
- 新技術(shù)、新工藝、對提高工程質(zhì)量、縮短工期、降低造價的可行性
- 金屬礦床地下開采復(fù)習(xí)題及答案
- GB 5009.34-2022食品安全國家標(biāo)準(zhǔn)食品中二氧化硫的測定
- 教學(xué)課件《斷裂力學(xué)》
- 慢阻肺的管理課件
- 電工基本知識培訓(xùn)資料課件
- 北師大版《相遇問題》公開課課件
- 鄰補(bǔ)角、對頂角、同位角、內(nèi)錯角、同旁內(nèi)角經(jīng)典習(xí)題-一對一專用
- HP系列培訓(xùn)手冊
- 畢業(yè)論文-原油電脫水方法與機(jī)理的研究
- 陜西省2022年普通高中學(xué)業(yè)水平考試(真題)
評論
0/150
提交評論