蛋白質(zhì)結(jié)構(gòu)與功能預(yù)測ppt課件_第1頁
蛋白質(zhì)結(jié)構(gòu)與功能預(yù)測ppt課件_第2頁
蛋白質(zhì)結(jié)構(gòu)與功能預(yù)測ppt課件_第3頁
蛋白質(zhì)結(jié)構(gòu)與功能預(yù)測ppt課件_第4頁
蛋白質(zhì)結(jié)構(gòu)與功能預(yù)測ppt課件_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、蛋白質(zhì)結(jié)構(gòu)與功能預(yù)測蛋白質(zhì)結(jié)構(gòu)與功能預(yù)測1.2實(shí)習(xí)一實(shí)習(xí)一基因組數(shù)據(jù)注釋和功能分析基因組數(shù)據(jù)注釋和功能分析實(shí)習(xí)二實(shí)習(xí)二核苷酸序列分析核苷酸序列分析實(shí)習(xí)三實(shí)習(xí)三芯片的基本數(shù)據(jù)處理和分析芯片的基本數(shù)據(jù)處理和分析實(shí)習(xí)四實(shí)習(xí)四蛋白質(zhì)結(jié)構(gòu)與功能分析蛋白質(zhì)結(jié)構(gòu)與功能分析實(shí)習(xí)五實(shí)習(xí)五蛋白質(zhì)組學(xué)數(shù)據(jù)分析蛋白質(zhì)組學(xué)數(shù)據(jù)分析實(shí)習(xí)六實(shí)習(xí)六系統(tǒng)生物學(xué)軟件實(shí)習(xí)系統(tǒng)生物學(xué)軟件實(shí)習(xí)實(shí)習(xí)課程內(nèi)容實(shí)習(xí)課程內(nèi)容基因組學(xué)基因組學(xué)轉(zhuǎn)錄物組學(xué)轉(zhuǎn)錄物組學(xué)蛋白質(zhì)組學(xué)蛋白質(zhì)組學(xué)系統(tǒng)生物學(xué)系統(tǒng)生物學(xué)3DNA sequenceProtein sequenceProtein structureProtein function4蛋白質(zhì)序列分析蛋白質(zhì)

2、序列分析蛋白質(zhì)一級序列蛋白質(zhì)一級序列蛋白質(zhì)基本理化性質(zhì)分析蛋白質(zhì)基本理化性質(zhì)分析蛋白質(zhì)親疏水性分析蛋白質(zhì)親疏水性分析跨膜區(qū)結(jié)構(gòu)預(yù)測跨膜區(qū)結(jié)構(gòu)預(yù)測翻譯后修飾位點(diǎn)預(yù)測翻譯后修飾位點(diǎn)預(yù)測蛋白質(zhì)二級結(jié)構(gòu)蛋白質(zhì)二級結(jié)構(gòu)蛋白質(zhì)二級結(jié)構(gòu)預(yù)測蛋白質(zhì)二級結(jié)構(gòu)預(yù)測蛋白質(zhì)序列信號位點(diǎn)分析蛋白質(zhì)序列信號位點(diǎn)分析蛋白質(zhì)超二級結(jié)構(gòu)蛋白質(zhì)超二級結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu)域分析蛋白質(zhì)結(jié)構(gòu)域分析蛋白質(zhì)三級結(jié)構(gòu)蛋白質(zhì)三級結(jié)構(gòu)蛋白質(zhì)三維結(jié)構(gòu)模擬蛋白質(zhì)三維結(jié)構(gòu)模擬蛋白質(zhì)序列分析主要內(nèi)容蛋白質(zhì)序列分析主要內(nèi)容5蛋白質(zhì)結(jié)構(gòu)預(yù)測過程ORF翻譯實(shí)驗(yàn)數(shù)據(jù)蛋白質(zhì)序列蛋白質(zhì)理化性質(zhì)和一級結(jié)構(gòu)數(shù)據(jù)庫搜索結(jié)構(gòu)域匹配已知結(jié)構(gòu)的同源蛋白?三維結(jié)構(gòu)模型可用的折疊模型?

3、同源建模有二級結(jié)構(gòu)預(yù)測無串線法有從頭預(yù)測無6ExPASy(Expert Protein Analysis System)Tools()()7一、蛋白質(zhì)理化性質(zhì)分析 使用工具:Protparam二、跨膜區(qū)分析 使用工具:Tmpred三、二級結(jié)構(gòu)分析 使用工具:PredictProtein Server四、結(jié)構(gòu)域分析 使用工具:InterProScan五、蛋白質(zhì)三級結(jié)構(gòu)分析 使用工具:SWISS-MODEL/SWISS-PdbViewer數(shù)據(jù): C:ZCNIshixi4protein.txt 課程安排課程安排8一、蛋白質(zhì)基本理化性質(zhì)分析一、蛋白質(zhì)基本理化性質(zhì)分析 蛋白質(zhì)理化性質(zhì)是蛋白質(zhì)研究的基礎(chǔ)蛋

4、白質(zhì)的基本性質(zhì):相對分子質(zhì)量 氨基酸組成等電點(diǎn)(PI) 消光系數(shù)半衰期 不穩(wěn)定系數(shù)總平均親水性 實(shí)驗(yàn)方法:相對分子質(zhì)量的測定、等電點(diǎn)實(shí)驗(yàn)、沉降實(shí)驗(yàn)缺點(diǎn):費(fèi)時(shí)、耗資基于實(shí)驗(yàn)經(jīng)驗(yàn)值的計(jì)算機(jī)分析方法9工具工具網(wǎng)站網(wǎng)站備注備注AACompldent利用未知蛋白質(zhì)的氨基酸組成確認(rèn)具有相同組成的已知蛋白C o m p u t e pI/Mw計(jì)算蛋白質(zhì)序列的等電點(diǎn)和分子量ProtParam對氨基酸序列多個(gè)物理和化學(xué)參數(shù)(分子量、等電點(diǎn)、吸光系數(shù)等)進(jìn)行計(jì)算PeptideMass計(jì)算相應(yīng)肽段的pI和分子量SAPS利用蛋白質(zhì)序列統(tǒng)計(jì)分析方法給出待測蛋白的物理化學(xué)信息蛋白質(zhì)理化性質(zhì)分析工具蛋白質(zhì)理化性質(zhì)分析工具1

5、0AACompIdent PeptideMass11ProtparamProtparam基于蛋白質(zhì)序列的組分分析氨基酸親疏水性等分析為高級結(jié)構(gòu)預(yù)測提供參考Expasy 開發(fā)的針對蛋白質(zhì)基本理化性質(zhì)的分析: Protparam 工具 計(jì)算以下物理化學(xué)性質(zhì):計(jì)算以下物理化學(xué)性質(zhì):相對分子質(zhì)量 氨基酸組成等電點(diǎn)(PI) 消光系數(shù)半衰期 不穩(wěn)定系數(shù)總平均親水性 12主要選項(xiàng)主要選項(xiàng)/參數(shù)參數(shù)如果分析SWISS-PORT和TrEMBL數(shù)據(jù)庫中序列 直接填寫Swiss-Prot/TrEMBL AC號(accession number)如果分析新序列: 直接在搜索框中粘貼氨基酸序列輸入輸入Swiss-Pro

6、t/TrEMBL AC號號打開打開protein.txt,將蛋白質(zhì)序列將蛋白質(zhì)序列粘貼在搜索框中粘貼在搜索框中13輸入Swiss-Prot/TrEMBL AC號分不同的功能域肽段輸出結(jié)果輸出結(jié)果 功能域功能域用戶自定義區(qū)段用戶自定義區(qū)段14返回結(jié)果返回結(jié)果氨基酸數(shù)目氨基酸數(shù)目相對分子質(zhì)量相對分子質(zhì)量理論理論 pI 值值氨基酸組成氨基酸組成正正/負(fù)電荷殘基數(shù)負(fù)電荷殘基數(shù)15消光系數(shù)消光系數(shù)半衰期半衰期原子組成原子組成分子式分子式總原子數(shù)總原子數(shù)16不穩(wěn)定系數(shù)不穩(wěn)定系數(shù)脂肪系數(shù)脂肪系數(shù)總平均親水性總平均親水性40 unstable17練習(xí)一:練習(xí)一:ProtparamProtparam數(shù)據(jù):C:Z

7、CNIshixi4protein.txt18(a)-Type I membrane protein(b)-Type II membrane protein(c)-Multipass transmembrane proteins(d)-Lipid chain-anchored membrane proteins(e)-GPI-anchored membrane proteins二、蛋白質(zhì)跨膜區(qū)分析二、蛋白質(zhì)跨膜區(qū)分析19螺旋跨膜區(qū)主要是由20-30個(gè)疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)組成親水殘基往往出現(xiàn)在疏水殘基之間,對功能有重要的作用基于親/疏水量和蛋白質(zhì)膜區(qū)每個(gè)

8、氨基酸的統(tǒng)計(jì)學(xué)分布偏好性量蛋白質(zhì)跨膜區(qū)特性蛋白質(zhì)跨膜區(qū)特性20跨膜蛋白序列跨膜蛋白序列“邊界邊界”原則原則 -Landolt Marticorena et al., 1993胞外末端Asp(天冬氨酸)、Ser(絲氨酸)和Pro(脯氨酸)胞外-內(nèi)分界區(qū)域Trp(色氨酸)跨膜區(qū)Leu(亮氨酸)、Ile(異亮氨酸)、Val(纈氨酸)、Met(甲硫氨酸)、Phe(苯丙氨酸)、Trp(色氨酸)、Cys(半胱氨酸)、Ala(丙氨酸)、Pro(脯氨酸)和Gly(甘氨酸)胞內(nèi)-外分界區(qū)域Tyr(絡(luò)氨酸)、Trp(色氨酸)和Phe(苯丙氨酸)胞內(nèi)末端Lys(賴氨酸)和Arg(精氨酸)21常用蛋白質(zhì)跨膜區(qū)域分析工

9、具常用蛋白質(zhì)跨膜區(qū)域分析工具工具工具網(wǎng)站網(wǎng)站備注備注DAS用Dense Alignment Surface(DAS)算法來預(yù)測無同源家族的蛋白跨膜區(qū)HMMTOP由Enzymology研究所開發(fā)的蛋白質(zhì)跨膜區(qū)和拓?fù)浣Y(jié)構(gòu)預(yù)測程序SOSUI由Nagoya大學(xué)開發(fā)一個(gè)具有圖形顯示跨膜區(qū)的程序TMAP基于多序列比對來預(yù)測跨膜區(qū)的程序TMHMM基于HMM方法的蛋白質(zhì)跨膜區(qū)預(yù)測工具TMpred基于對TMbase數(shù)據(jù)庫的統(tǒng)計(jì)分析來預(yù)測蛋白質(zhì)跨膜區(qū)和跨膜方向TopPred是一個(gè)位于法國的蛋白質(zhì)拓?fù)浣Y(jié)構(gòu)預(yù)測程序22TMpredTMpred工具工具:依靠跨膜蛋白數(shù)據(jù)庫Tmbase預(yù)測跨膜區(qū)和跨膜方向23主要參數(shù)主要

10、參數(shù)/ /選項(xiàng)選項(xiàng)序列在線提交形式: 直接貼入蛋白序列 填寫SwissProt/TrEMBL/EMBL/EST的ID或AC輸出格輸出格式式最短和最長的跨膜螺旋疏水區(qū)長最短和最長的跨膜螺旋疏水區(qū)長度度輸入序列名(可選)輸入序列名(可選)選擇序列的格式選擇序列的格式貼入貼入protein.txt蛋白質(zhì)蛋白質(zhì)序列序列24輸出結(jié)果輸出結(jié)果包含四個(gè)部分 可能的跨膜螺旋區(qū) 相關(guān)性列表可能的跨膜螺旋區(qū)可能的跨膜螺旋區(qū)相關(guān)性列表相關(guān)性列表位置位置分值分值 片段中點(diǎn)位置片段中點(diǎn)位置25 跨膜拓?fù)淠P图皥D示跨膜拓?fù)淠P图皥D示建議的跨膜拓?fù)淠P徒ㄗh的跨膜拓?fù)淠P兔恳晃恢糜?jì)算分值每一位置計(jì)算分值最優(yōu)拓最優(yōu)拓?fù)浣Y(jié)構(gòu)撲結(jié)

11、構(gòu)26TMHMM2728練習(xí)二:練習(xí)二:TMpred數(shù)據(jù):C:ZCNIshixi4protein.txt29三、蛋白質(zhì)二級結(jié)構(gòu)預(yù)測三、蛋白質(zhì)二級結(jié)構(gòu)預(yù)測 基本的二級結(jié)構(gòu) 螺旋,折疊, 轉(zhuǎn)角,無規(guī)則卷曲(coils)以及模序(motif)等蛋白質(zhì)局部結(jié)構(gòu)組件 分析方法: 基于統(tǒng)計(jì)和機(jī)器學(xué)習(xí)方法進(jìn)行預(yù)測 Chou-Fasman算法 GOR算法 多序列列線預(yù)測 基于神經(jīng)網(wǎng)絡(luò)的序列預(yù)測 基于已有知識的預(yù)測方法(knowledge based method) 混合方法(hybrid system method)30工具工具網(wǎng)站網(wǎng)站備注備注BCM SearchLauncher 包括了常見的蛋白質(zhì)結(jié)構(gòu)分析程

12、序入口,一般分析可以以此服務(wù)器作為起點(diǎn)HNN基于神經(jīng)網(wǎng)絡(luò)的分析工具,含序列到結(jié)構(gòu)過程和結(jié)構(gòu)到結(jié)構(gòu)處理Jpred基于Jnet神經(jīng)網(wǎng)絡(luò)的分析程序,并采用PSI-BLAST來構(gòu)建序列Profile進(jìn)行預(yù)測,對于序列較短、結(jié)構(gòu)單一的蛋白預(yù)測較好nnPredict預(yù)測蛋白質(zhì)序列中潛在的亮氨酸拉鏈結(jié)構(gòu)和卷曲螺旋NNSSP基于雙層前反饋神經(jīng)網(wǎng)絡(luò)為算法,還考慮到蛋白質(zhì)結(jié)構(gòu)分類信息PREDATOR預(yù)測時(shí)考慮了氨基酸殘基間的氫鍵蛋白質(zhì)二級結(jié)構(gòu)分析工具蛋白質(zhì)二級結(jié)構(gòu)分析工具31工具工具網(wǎng)站網(wǎng)站備注備注PredictProtein提供多項(xiàng)蛋白質(zhì)性質(zhì)分析,并有較好準(zhǔn)確性Prof基于多重序列比對預(yù)測工具PSIpred提供

13、跨膜蛋白拓?fù)浣Y(jié)構(gòu)預(yù)測和蛋白profile折疊結(jié)構(gòu)識別工具SOPMA可以比較各種分析方法得到的結(jié)果,也可輸出 “一致性結(jié)果”SSPRED基于數(shù)據(jù)庫搜索相似蛋白并構(gòu)建多重序列比對蛋白質(zhì)二級結(jié)構(gòu)分析工具蛋白質(zhì)二級結(jié)構(gòu)分析工具3233PredictProteinPredictProteinPredictProtein可以獲得功能預(yù)測、二級結(jié)構(gòu)、基序、二硫鍵結(jié)構(gòu)、結(jié)構(gòu)域等許多蛋白質(zhì)序列的結(jié)構(gòu)信息該方法的平均準(zhǔn)確率超過72%,最佳殘基預(yù)測準(zhǔn)確率達(dá)90%以上。因此,被視為蛋白質(zhì)二級結(jié)構(gòu)預(yù)測的標(biāo)準(zhǔn)34PredictProtein提交界面提交界面可展開可展開選項(xiàng)選項(xiàng)3535PredictProtein提交界面詳

14、解提交界面詳解提交郵件提交郵件地 址 ( 必地 址 ( 必填)填)蛋白名稱蛋白名稱(可選)(可選)分 析 方分 析 方法法361D序列預(yù)測PROFsec(默認(rèn))基于輪廓(profile)的神經(jīng)網(wǎng)絡(luò)算法預(yù)測蛋白質(zhì)二級結(jié)構(gòu)PROFacc(默認(rèn))基于輪廓(profile)的神經(jīng)網(wǎng)絡(luò)算法預(yù)測殘基溶劑可及性PHDhtm(默認(rèn))基于多序列比對預(yù)測跨膜區(qū)位置和拓?fù)浣Y(jié)構(gòu)ASP(默認(rèn))識別二級結(jié)構(gòu)中構(gòu)型變化的氨基酸COILS(默認(rèn))識別卷曲螺旋PROFtmb識別革蘭氏陰性菌膜Beta桶蛋白結(jié)構(gòu)序列基序識別ProSite(默認(rèn))搜索序列中保守基序SEG(默認(rèn))過濾序列中低復(fù)雜區(qū)域PredictNLS(默認(rèn))基于實(shí)

15、驗(yàn)數(shù)據(jù)預(yù)測序列核定位區(qū)域二硫鍵識別DISULFIND(默認(rèn))識別序列中二硫鍵位置折疊子識別AGAPE基于折疊結(jié)構(gòu)識別遠(yuǎn)源蛋白序列殘基接觸預(yù)測PROFcon預(yù)測單鏈中原子殘基接觸性結(jié)構(gòu)域預(yù)測ProDom(默認(rèn))基于序列同源性來預(yù)測蛋白質(zhì)結(jié)構(gòu)域分析方法程序詳解分析方法程序詳解3737跨膜螺旋預(yù)測(跨膜螺旋預(yù)測(PHDhtm)高級)高級選項(xiàng)選項(xiàng)Ambivalent序列識別(序列識別(ASP)高級選)高級選項(xiàng)項(xiàng)CHOP結(jié)構(gòu)域分析工具高級結(jié)構(gòu)域分析工具高級選項(xiàng)選項(xiàng)3838比對內(nèi)容比對內(nèi)容從從SWISS-PROT數(shù)據(jù)庫返回?cái)?shù)據(jù)庫返回BLAST搜索結(jié)果搜索結(jié)果MaxHom參數(shù)選項(xiàng)參數(shù)選項(xiàng)最低序列最低序列比對

16、一致比對一致性性空位間隔罰空位間隔罰分分空位延伸罰空位延伸罰分分比對矩陣比對矩陣最大擊中值最大擊中值3939選擇保存分析結(jié)果選擇保存分析結(jié)果是否返回多序列比是否返回多序列比對結(jié)果對結(jié)果HTML結(jié)果形結(jié)果形式式AGAPE結(jié)結(jié)果果PROF/PHD結(jié)果結(jié)果形式形式以下拉框中所指定的以下拉框中所指定的輸入格式將待測序列輸入格式將待測序列粘貼此提交欄粘貼此提交欄40服務(wù)器運(yùn)行程序信服務(wù)器運(yùn)行程序信息息ProSite模體搜索結(jié)模體搜索結(jié)果果低復(fù)雜區(qū)域過濾程低復(fù)雜區(qū)域過濾程序序ProDom結(jié)構(gòu)域搜索結(jié)構(gòu)域搜索結(jié)果結(jié)果二硫鍵識別結(jié)二硫鍵識別結(jié)果果PHD程序信程序信息息PHD預(yù)測結(jié)預(yù)測結(jié)果果PROF預(yù)測結(jié)預(yù)測結(jié)

17、果果球狀蛋白預(yù)測球狀蛋白預(yù)測結(jié)果結(jié)果Ambivalent序列識別結(jié)果序列識別結(jié)果PredictProtein分析結(jié)果分析結(jié)果41PredictProtein分析結(jié)果分析結(jié)果PROSITE中的中的ID號號簡單描述簡單描述Motif模模式式提交序列中出提交序列中出現(xiàn)該現(xiàn)該Motif的位的位置置42PredictProtein分析結(jié)果分析結(jié)果43PredictProtein分析結(jié)果分析結(jié)果跨膜跨膜區(qū)區(qū)非跨膜區(qū)非跨膜區(qū)LoopHelixSheet44四、結(jié)構(gòu)域分析四、結(jié)構(gòu)域分析結(jié)構(gòu)域是蛋白序列的功能、結(jié)構(gòu)和進(jìn)化單元 分析方法 序列比對45基本類型 : 折疊折疊/折疊+折疊46工具工具網(wǎng)站網(wǎng)站備注備注C

18、DD通過比較目標(biāo)序列和一組位置特異性打分矩陣進(jìn)行RPS-BLAST來確定目標(biāo)序列中的保守結(jié)構(gòu)域HAMAP通過專家預(yù)測系統(tǒng)產(chǎn)生的微生物家族同源蛋白數(shù)據(jù)InterPro蛋白質(zhì)家族、結(jié)構(gòu)域和功能位點(diǎn)的聯(lián)合資源數(shù)據(jù)庫,整合了多個(gè)數(shù)據(jù)庫和工具的結(jié)果,并提供相應(yīng)的鏈接Pfam每個(gè)蛋白家族包含了多序列比對、pro和注釋文件ProDom從SWISS-PROT/TrEMBL數(shù)據(jù)庫中的非片段蛋白序列數(shù)據(jù)構(gòu)成,每條記錄包含一個(gè)同源結(jié)構(gòu)域多重比對和家族保守一致性序列SMART由EMBL建立,集成了大部分已知蛋白功能域數(shù)據(jù),注釋包括了功能類型、三維結(jié)構(gòu)、分類信息模體、結(jié)構(gòu)域數(shù)據(jù)庫模體、結(jié)構(gòu)域數(shù)據(jù)庫47工具工具網(wǎng)站網(wǎng)站備

19、注備注TIGRFAMs由TIGR實(shí)驗(yàn)室維護(hù)的蛋白質(zhì)家族和結(jié)構(gòu)域數(shù)據(jù)庫PRINTS蛋白質(zhì)模體指紋數(shù)據(jù)庫,提供了FingerPRINTScan、FPScan和GRAPHScan等指紋識別工具DOMO同源蛋白結(jié)構(gòu)域家族數(shù)據(jù)庫,有多個(gè)鏡像網(wǎng)站BLOCKS收錄了通過高度保守蛋白區(qū)域比對出的無空位片段eMOTIF由斯坦福大學(xué)維護(hù)。從B L O C K S + 數(shù) 據(jù) 庫 和PRINTS數(shù)據(jù)庫中收集了生物功能高度保守的高特異性蛋白序列模體、結(jié)構(gòu)域數(shù)據(jù)庫模體、結(jié)構(gòu)域數(shù)據(jù)庫48選擇需要的分析程序選擇需要的分析程序結(jié)果返回形式結(jié)果返回形式序列提交框序列提交框InterProScanInterProScan-49P

20、icture View其他數(shù)據(jù)庫中其他數(shù)據(jù)庫中的的AC號號保守區(qū)示意圖保守區(qū)示意圖ID名名50InterPro蛋白家族信息AC號,家族名號,家族名稱稱家族蛋白家族蛋白其他數(shù)據(jù)庫中的收錄其他數(shù)據(jù)庫中的收錄情況情況相關(guān)的其他家族相關(guān)的其他家族條目類型條目類型51InterPro蛋白家族信息生物體內(nèi)的信息生物體內(nèi)的信息說明說明結(jié)構(gòu)鏈結(jié)構(gòu)鏈接接數(shù)據(jù)庫鏈數(shù)據(jù)庫鏈接接52InterPro蛋白家族信息該家族蛋白該家族蛋白在不同種類在不同種類生物體中出生物體中出現(xiàn)情況現(xiàn)情況其他家族與其他家族與該家族的重該家族的重疊情況疊情況53練習(xí)四:練習(xí)四:InterProScan數(shù)據(jù):C:ZCNIshixi4protei

21、n.txt54五、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測五、蛋白質(zhì)三維結(jié)構(gòu)預(yù)測方法方法特點(diǎn)特點(diǎn)工具工具同源建模法( Homology/Comparative modelling )基于序列同源比對,對于序列相似度30的序列模擬比較有效,最常用的方法 SWISS-MODEL, CPHmodels 串線法/折疊識別法 (Threading/Fold recognition)“穿”入已知的各種蛋白質(zhì)折疊骨架內(nèi),適于對蛋白質(zhì)核心結(jié)構(gòu)進(jìn)行預(yù)測,計(jì)算量大THREADER,3D-PSSM從頭預(yù)測法( Ab initio/De novo methods )基于分子動力學(xué),尋找能量最低的構(gòu)象,計(jì)算量大,只能做小分子預(yù)測HMMSTR

22、/ ROSSETA55蛋白質(zhì)結(jié)構(gòu)預(yù)測精度蛋白質(zhì)結(jié)構(gòu)預(yù)測精度56同源建模法分析步驟: 多序列比對多序列比對 與已有晶體結(jié)構(gòu)的蛋白質(zhì)序列比對 確定是否有可以使用的模板確定是否有可以使用的模板 序列相似度30% 序列相似度30%,結(jié)合功能,蛋白質(zhì)一級序列、二級結(jié)構(gòu)或結(jié)構(gòu)域信息 構(gòu)建三維模型 三維模型準(zhǔn)確性檢驗(yàn) Whatcheck 程序 Ramachandran plot計(jì)算檢驗(yàn) 手工調(diào)整多序列比對,重新擬和,構(gòu)建新的模型5758常用數(shù)據(jù)庫常用數(shù)據(jù)庫數(shù)據(jù)庫數(shù)據(jù)庫網(wǎng)站網(wǎng)站備注備注PDB主要的蛋白質(zhì)三維結(jié)構(gòu)數(shù)據(jù)庫MMDBNCBI維護(hù)的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫Psdb從PDB和NRL-3D數(shù)據(jù)庫中衍生出的數(shù)據(jù)庫,含

23、二級結(jié)構(gòu)和三維結(jié)構(gòu)信息3DinSight整合了結(jié)構(gòu)、性質(zhì)(氨基酸組成、熱力學(xué)參數(shù)等)、生物學(xué)功能(突變點(diǎn),相互作用等)的綜合數(shù)據(jù)庫,F(xiàn)SSP根據(jù)結(jié)構(gòu)比對的蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫SCOP蛋白質(zhì)結(jié)構(gòu)分類數(shù)據(jù)庫,將已知結(jié)構(gòu)蛋白進(jìn)行有層次地分類CATH另一個(gè)有名的蛋白質(zhì)結(jié)構(gòu)和結(jié)構(gòu)域主要結(jié)構(gòu)分類庫MODBASE用同源比對法生成的模型結(jié)構(gòu)數(shù)據(jù)庫E n z y m e Structure從PDB數(shù)據(jù)庫中整理已知結(jié)構(gòu)的酶蛋白數(shù)據(jù)庫HSSP根據(jù)同源性到處的蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫59模板搜索與比對模板搜索與比對工具工具網(wǎng)站網(wǎng)站備注備注PSI-BLAST位置特異性疊代BLAST,可用來搜索遠(yuǎn)源家族序列FASTA3位于EBI

24、的序列比對工具SSEARCH采用Smith/Waterman法來進(jìn)行序列比對ClustalW多序列比對工具,位于EBIT-Coffee用多種方法(如ClustalW、DIalign等)來構(gòu)建多序列比對Multalin一個(gè)老牌的多序列比對工具Dali三維結(jié)構(gòu)比對網(wǎng)絡(luò)服務(wù)器VAST基于向量并列分析算法的三維結(jié)構(gòu)比對工具SAM-T99用HMM法搜索蛋白質(zhì)遠(yuǎn)源同源序列60同源建模法同源建模法工具工具網(wǎng)站網(wǎng)站備注備注S W I S S -MODEL完整建模程序,采用同源性鑒定來確定模板蛋白,用戶也可以自定義模板進(jìn)行分析CPHmodels基于神經(jīng)網(wǎng)絡(luò)的同源建模工具,用戶只需提交序列,無高級選項(xiàng)EsyPre

25、d3D采用神經(jīng)網(wǎng)絡(luò)來提高同源建模準(zhǔn)確性的預(yù)測工具3Djigsaw根據(jù)同源已知結(jié)構(gòu)蛋白來建模的預(yù)測工具M(jìn)ODELLER一個(gè)廣泛使用的同源建模軟件,需要用戶對腳本有一定的了解61串線法串線法工具工具網(wǎng)站網(wǎng)站備注備注3D-PSSM第一個(gè)運(yùn)用1D-3D序列profile來預(yù)測蛋白質(zhì)折疊結(jié)構(gòu)的網(wǎng)絡(luò)服務(wù)器Fugue以序列結(jié)構(gòu)比對搜索數(shù)據(jù)庫來預(yù)測蛋白質(zhì)折疊HHpred基于HMM-HMM比對搜索多個(gè)數(shù)據(jù)庫來預(yù)測給定序列的的折疊結(jié)構(gòu)LOOPP學(xué)習(xí)、觀察和輸出蛋白質(zhì)模式和結(jié)構(gòu)工具THREADER一個(gè)老牌的線索分析軟件,對搜索遠(yuǎn)源蛋白序列較敏感PROSPECT蛋白質(zhì)結(jié)構(gòu)預(yù)測和評價(jià)工具包,能以一種非常簡單的方式運(yùn)行,

26、對于高級用戶,也提供了很多的可選項(xiàng)123D+結(jié)合了序列概形,二級結(jié)構(gòu)信息和接觸勢能來將待測蛋白“穿入”一系列結(jié)構(gòu)來預(yù)測結(jié)構(gòu)SAM-T02基于HMM方法的蛋白質(zhì)結(jié)構(gòu)預(yù)測62SWISS-MODEL/SWISS-PdbViewSWISS-MODEL工具工具同源建模方法與PDB數(shù)據(jù)庫已知結(jié)構(gòu)的蛋白質(zhì)序列比對進(jìn)行預(yù)測63一步模式一步模式比對模式比對模式優(yōu)化模式優(yōu)化模式64主要參數(shù)主要參數(shù)/ /選項(xiàng)選項(xiàng)粘貼粘貼protein.txt中中一條蛋白質(zhì)序列一條蛋白質(zhì)序列輸入用戶輸入用戶Email(選填)(選填)65輸出結(jié)果輸出結(jié)果下載下載pdbpdb格式文件格式文件66與模板與模板序列比序列比對結(jié)果,對結(jié)果,并

27、顯示并顯示二級結(jié)二級結(jié)構(gòu)區(qū)域構(gòu)區(qū)域比對結(jié)果比對結(jié)果67模型評估模型評估68練習(xí)五:SWISS-MODEL數(shù)據(jù):C:ZCNIshixi4SWISS-MODEL.txt參考:69工具工具網(wǎng)站網(wǎng)站備注備注S w i s s -PdbViewer一個(gè)界面非常友好的工具,可以分析蛋白質(zhì)的結(jié)構(gòu)性質(zhì),比較活性位點(diǎn)或突變點(diǎn)Jmol一個(gè)基于Java語言開發(fā)的三維觀察工具,大多是作為一個(gè)內(nèi)嵌式網(wǎng)頁工具快速游覽結(jié)構(gòu)數(shù)據(jù)庫數(shù)據(jù)MolMol免費(fèi)的PDB三維分子觀察軟件,可以通過處理生成很漂亮的圖形文件PyMol一個(gè)基于開源的三維觀察工具,有很多額外的插件來提升功能Rasmol很有名的三維觀察軟件,操作界面簡介,用命令行實(shí)現(xiàn)多種功能VMD用內(nèi)建的腳本來瀏覽、分析三維結(jié)構(gòu),還可以以動畫的形

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論