蛋白質(zhì)序列分析及結構預測第一講_第1頁
蛋白質(zhì)序列分析及結構預測第一講_第2頁
蛋白質(zhì)序列分析及結構預測第一講_第3頁
蛋白質(zhì)序列分析及結構預測第一講_第4頁
蛋白質(zhì)序列分析及結構預測第一講_第5頁
已閱讀5頁,還剩68頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、生物信息學生物信息學謝文海謝文海 講師講師 第第五五章章 蛋白質(zhì)蛋白質(zhì)序列序列分析及結構預測分析及結構預測一、蛋白質(zhì)的結構一、蛋白質(zhì)的結構二、蛋白質(zhì)數(shù)據(jù)庫介紹二、蛋白質(zhì)數(shù)據(jù)庫介紹三、蛋白質(zhì)序列分析三、蛋白質(zhì)序列分析四、蛋白質(zhì)結構四、蛋白質(zhì)結構預測預測五、蛋白質(zhì)五、蛋白質(zhì)功能預測功能預測從多條免疫球蛋白序列中提取的從多條免疫球蛋白序列中提取的8 8個片段的多重比對個片段的多重比對疏水氨基酸色氨酸半胱氨酸保守結構域免疫球蛋白恒定區(qū)免疫球蛋白可變區(qū)回顧1.human beta globin (人(人珠蛋白)珠蛋白)2.horse beta globin (馬(馬珠蛋白)珠蛋白)3.human alp

2、ha globin (人(人珠蛋白)珠蛋白)4.horse alpha globin (馬(馬珠蛋白)珠蛋白)5.cyanohaemoglobin (藍血紅蛋白)(藍血紅蛋白)6. whale myoglobin (鯨肌紅蛋白)(鯨肌紅蛋白)7.Leghaemoglobin (豆血紅蛋白)(豆血紅蛋白)通過珠蛋白的比通過珠蛋白的比較構建系統(tǒng)發(fā)育較構建系統(tǒng)發(fā)育樹判斷生物進化樹判斷生物進化分歧時間分歧時間回顧DNA 序列蛋白序列蛋白結構功能結構是蛋白行使功能的前提蛋白質(zhì)的結構主要分為四級蛋白質(zhì)的結構主要分為四級, 一級結構、二級結構、三級結構以及四級結一級結構、二級結構、三級結構以及四級結構構。一

3、級結構一級結構:蛋白質(zhì)多肽鏈中氨基酸殘基的排列順序蛋白質(zhì)多肽鏈中氨基酸殘基的排列順序MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTE二級結構:主要由氫鍵維系的結構(二級結構:主要由氫鍵維系的結構(-螺旋螺旋、-折疊折疊)指指多肽多肽鏈中主鏈原子的局部空間排布即構象,不涉及側(cè)鏈部分的構象鏈中主鏈原子的局部空間排布即構象,不涉及側(cè)鏈部分的構象。螺旋、螺旋、 折疊折疊、 轉(zhuǎn)角、無規(guī)卷曲轉(zhuǎn)角、無規(guī)卷曲 、螺旋組合(螺旋組合()折疊組合(折疊組合()和)和螺旋螺旋折疊組合(折疊組合()螺旋螺旋(helix)的結構特征為:的結構特征為:(1)主鏈骨架圍繞中心軸盤繞

4、形成右手螺旋;)主鏈骨架圍繞中心軸盤繞形成右手螺旋;(2)螺旋每上升一圈是)螺旋每上升一圈是3.6個氨基酸殘基,螺距為個氨基酸殘基,螺距為0.54nm;(3)相鄰螺旋圈之間形成許多氫鍵;)相鄰螺旋圈之間形成許多氫鍵;(4)側(cè)鏈基團位于螺旋的外側(cè))側(cè)鏈基團位于螺旋的外側(cè)。Ala、Glu、Leu、Met 促進形成促進形成 Pro、 Gly、Tyr、Ser不利于形成不利于形成(1)若干條肽鏈或肽段平行或反平行排列成片;)若干條肽鏈或肽段平行或反平行排列成片;(2)所有肽鍵的)所有肽鍵的C=O和和NH形成鏈間氫鍵;形成鏈間氫鍵;(3)側(cè)鏈基團分別交替位于片層的上、下方。)側(cè)鏈基團分別交替位于片層的上、

5、下方。 折疊折疊(sheets) 的結構特征為:的結構特征為:a.反反平行和平行的多個平行和平行的多個折疊鏈形成一個完整折疊鏈形成一個完整折疊結構的氫鍵示意圖折疊結構的氫鍵示意圖;b.來自來自人人pi型谷胱甘肽型谷胱甘肽-S-轉(zhuǎn)硫酶中單個亞基中連續(xù)主鏈的部分轉(zhuǎn)硫酶中單個亞基中連續(xù)主鏈的部分折疊結構折疊結構(2DGQ.pdb)側(cè)面視側(cè)面視圖,可見轉(zhuǎn)角圖,可見轉(zhuǎn)角(turn); c.來自來自人人pi型谷胱甘肽型谷胱甘肽-S-轉(zhuǎn)硫酶一個亞基中連續(xù)主鏈的部分轉(zhuǎn)硫酶一個亞基中連續(xù)主鏈的部分折疊結構頂部視圖,可見轉(zhuǎn)角折疊結構頂部視圖,可見轉(zhuǎn)角(turn);d.來自來自人信號傳遞蛋白人信號傳遞蛋白SMAD4

6、(1DD1.pdb)的一個亞基中部分的一個亞基中部分折疊結構頂部視圖,可見到大折疊結構頂部視圖,可見到大的環(huán)區(qū)的環(huán)區(qū)(loop)。 多肽鏈多肽鏈180回折部分,通常由四個氨基酸殘基構成,借回折部分,通常由四個氨基酸殘基構成,借1. 4殘基殘基之間形成的氫鍵維系。之間形成的氫鍵維系。 Asp、Asn、Ser、Thr、Gln 、Pro 常出現(xiàn)在常出現(xiàn)在轉(zhuǎn)角轉(zhuǎn)角轉(zhuǎn)角的結構特征為:轉(zhuǎn)角的結構特征為:來自來自人細胞珠蛋白人細胞珠蛋白(2DC3.pdb)的兩段的兩段螺旋由螺旋由轉(zhuǎn)角連接,用粗樹枝狀顯轉(zhuǎn)角連接,用粗樹枝狀顯示了兩段螺旋末端的脯氨酸。示了兩段螺旋末端的脯氨酸。無規(guī)卷曲無規(guī)卷曲的結構特征為:的結

7、構特征為: 無規(guī)卷曲的特點為在主鏈骨架上無規(guī)則盤繞,其構象狀態(tài)仍遵循物理無規(guī)卷曲的特點為在主鏈骨架上無規(guī)則盤繞,其構象狀態(tài)仍遵循物理化學原理,但波動性較大,對溫度變化敏感;實驗測定三級結構時往化學原理,但波動性較大,對溫度變化敏感;實驗測定三級結構時往往無法識別無規(guī)卷曲往無法識別無規(guī)卷曲(缺失其座標缺失其座標),即使有座標則其溫度因子也較高,即使有座標則其溫度因子也較高。無規(guī)卷曲同。無規(guī)卷曲同環(huán)的區(qū)分主要是其長度和其形狀的波動性。環(huán)的區(qū)分主要是其長度和其形狀的波動性。 超二級結構超二級結構(supersecondary structure)指位于同一主鏈的多個二級指位于同一主鏈的多個二級結構組

8、裝形成的特定組裝體,可直接作為三級結構的或結構域的組成單元結構組裝形成的特定組裝體,可直接作為三級結構的或結構域的組成單元,是從蛋白質(zhì)二級結構形成三級結構的一個過渡結構形式,也稱為立體結,是從蛋白質(zhì)二級結構形成三級結構的一個過渡結構形式,也稱為立體結構形成的模體。構形成的模體。 (1)轉(zhuǎn)角或轉(zhuǎn)角或環(huán)等連接連續(xù)四個環(huán)等連接連續(xù)四個螺旋形成的四螺旋形成的四螺旋捆;螺旋捆;(2)中部固定位置含有亮氨酸及其他疏水側(cè)鏈氨基酸殘基、在螺旋兩端)中部固定位置含有亮氨酸及其他疏水側(cè)鏈氨基酸殘基、在螺旋兩端含有強親水側(cè)鏈氨基酸的含有強親水側(cè)鏈氨基酸的螺旋組成的亮氨酸拉鏈螺旋組成的亮氨酸拉鏈(Leucine zi

9、pper);(3)一條主鏈中相鄰七個兩親)一條主鏈中相鄰七個兩親螺旋通過過度結構形成的七次穿膜螺旋螺旋通過過度結構形成的七次穿膜螺旋組;組;(4)連續(xù)主鏈中兩段)連續(xù)主鏈中兩段螺旋連接三段螺旋連接三段折疊鏈形成的折疊鏈形成的Rossmann折疊;折疊;(5)轉(zhuǎn)角連接轉(zhuǎn)角連接a螺旋構成的螺旋構成的a-螺旋螺旋-轉(zhuǎn)角轉(zhuǎn)角-螺旋;螺旋;(6)環(huán)連接環(huán)連接螺旋構成的螺旋構成的螺旋螺旋-環(huán)環(huán)-螺旋等。螺旋等。(7)-折疊都為超二級結構。折疊都為超二級結構。 二級結構進一步折疊形成的結構域三級結構三級結構:蛋白質(zhì)的多肽鏈在各種二級結構的基礎上再進一步盤曲或蛋白質(zhì)的多肽鏈在各種二級結構的基礎上再進一步盤曲或

10、折迭形成具有一定規(guī)律的三維空間結構,稱為蛋白質(zhì)的三級結構折迭形成具有一定規(guī)律的三維空間結構,稱為蛋白質(zhì)的三級結構(tertiary structure)。蛋白質(zhì)三級結構的穩(wěn)定主要靠次級鍵,包括)。蛋白質(zhì)三級結構的穩(wěn)定主要靠次級鍵,包括氫鍵、疏水鍵、鹽鍵以及范德華力(氫鍵、疏水鍵、鹽鍵以及范德華力(Van der Wasls力)等。力)等。四級結構四級結構:具有二條或二條以上獨立三級結構的多肽鏈組成的蛋白具有二條或二條以上獨立三級結構的多肽鏈組成的蛋白質(zhì),其多肽鏈間通過次級鍵相互組合而形成的空間結構稱為蛋白質(zhì),其多肽鏈間通過次級鍵相互組合而形成的空間結構稱為蛋白質(zhì)的四級結構(質(zhì)的四級結構(qua

11、rternary structure)。其中,每個具有獨立)。其中,每個具有獨立三級結構的多肽鏈單位稱為亞基(三級結構的多肽鏈單位稱為亞基(subunit)。)。蛋白質(zhì)的一級結構決定了蛋白質(zhì)的二級、三級、四級結構蛋白質(zhì)的一級結構決定了蛋白質(zhì)的二級、三級、四級結構如如PIR、SWISS-PROT、NCBI , 這些數(shù)據(jù)庫的這些數(shù)據(jù)庫的數(shù)據(jù)主要以蛋白質(zhì)的序列為主數(shù)據(jù)主要以蛋白質(zhì)的序列為主, 并賦予相應的注釋并賦予相應的注釋; 如如PROSITE、Pfam, 這些數(shù)據(jù)庫主要這些數(shù)據(jù)庫主要收集了蛋白質(zhì)的保守結構域和功能域的特征序列收集了蛋白質(zhì)的保守結構域和功能域的特征序列; 如如PDB 等等, 這些數(shù)

12、據(jù)庫主要以蛋白質(zhì)的結構測這些數(shù)據(jù)庫主要以蛋白質(zhì)的結構測量數(shù)據(jù)為主量數(shù)據(jù)為主; 如如SCOP、CATH、FSSP 等等, 這其中有以序列這其中有以序列比較為基礎的序列分類數(shù)據(jù)庫以及以結構比較為基礎的結構分類數(shù)據(jù)比較為基礎的序列分類數(shù)據(jù)庫以及以結構比較為基礎的結構分類數(shù)據(jù)庫之分。庫之分。依據(jù)蛋白質(zhì)的結構層次依據(jù)蛋白質(zhì)的結構層次, 將蛋白質(zhì)數(shù)據(jù)庫分為將蛋白質(zhì)數(shù)據(jù)庫分為: 蛋白質(zhì)數(shù)據(jù)庫蛋白質(zhì)數(shù)據(jù)庫r 這些數(shù)據(jù)庫種類有差別這些數(shù)據(jù)庫種類有差別, 但內(nèi)部是相互聯(lián)系的但內(nèi)部是相互聯(lián)系的.r 每個數(shù)據(jù)庫都有指針指向其他數(shù)據(jù)庫每個數(shù)據(jù)庫都有指針指向其他數(shù)據(jù)庫, 而且數(shù)而且數(shù)據(jù)庫之間的序列以及相應的結構是共享的據(jù)

13、庫之間的序列以及相應的結構是共享的, 同一同一種蛋白質(zhì)依次會出現(xiàn)在不同的數(shù)據(jù)庫種蛋白質(zhì)依次會出現(xiàn)在不同的數(shù)據(jù)庫.r這樣的數(shù)據(jù)溝通有助于更深層地挖掘蛋白質(zhì)的這樣的數(shù)據(jù)溝通有助于更深層地挖掘蛋白質(zhì)的內(nèi)在生物信息內(nèi)在生物信息, 這些數(shù)據(jù)庫是融序列信息的索取、這些數(shù)據(jù)庫是融序列信息的索取、處理、存儲、輸出于一身的。處理、存儲、輸出于一身的。(1)PIR(protein information resource, PIR)和和PSD (protein sequence database, PSD) /pirwww PIR-PSD 是一個綜合全面的、非冗余的

14、、專業(yè)注釋的、分類完整的蛋白是一個綜合全面的、非冗余的、專業(yè)注釋的、分類完整的蛋白質(zhì)序列數(shù)據(jù)庫。質(zhì)序列數(shù)據(jù)庫。PIR-PSD 的序列來自于將的序列來自于將GenBank/ EMBL/ DDBJ 三大三大數(shù)據(jù)庫的編碼序列的翻譯而成的蛋白質(zhì)序列、發(fā)表的文獻中的序列和用數(shù)據(jù)庫的編碼序列的翻譯而成的蛋白質(zhì)序列、發(fā)表的文獻中的序列和用戶直接提交的序列。戶直接提交的序列。(2)SWISS-PROT/ TrEMBL數(shù)據(jù)庫數(shù)據(jù)庫 /swissprot數(shù)據(jù)庫由蛋白質(zhì)序列條目構成數(shù)據(jù)庫由蛋白質(zhì)序列條目構成, 每個條目包含蛋白質(zhì)序列、引用文獻信每個條目包含蛋白質(zhì)序列、引用文獻信息息、分類

15、學、分類學信息、注釋等信息、注釋等, 注釋中包括蛋白質(zhì)的功能、轉(zhuǎn)錄后修飾位點、注釋中包括蛋白質(zhì)的功能、轉(zhuǎn)錄后修飾位點、特殊特殊位點和位點和區(qū)域、二級結構、四級結構、與其他序列的相似性、序列區(qū)域、二級結構、四級結構、與其他序列的相似性、序列殘缺與疾病的關系殘缺與疾病的關系、序列、序列變異體等信息。變異體等信息。模體數(shù)據(jù)庫模體數(shù)據(jù)庫(1)PROSITE 蛋白質(zhì)家族及結構域數(shù)據(jù)庫蛋白質(zhì)家族及結構域數(shù)據(jù)庫( /prosite/ ) PROSITE 數(shù)據(jù)庫收集了有顯著生物學意義的蛋白質(zhì)位點序列、蛋白質(zhì)特征序列譜庫以及序列模型, 并能依據(jù)這些特征屬性快速可靠地鑒定出一個未知功能

16、蛋白質(zhì)序列屬于哪個蛋白質(zhì)家族, 即使在蛋白質(zhì)序列相似性很低的情況下, 也可以通過搜索隱含的功能結構模體(motif)來鑒定, 因此是有效的序列分析數(shù)據(jù)庫。 PROSITE 中涉及的序列模式包括酶的催化位點、配體結合位點、金屬離子結合位點、二硫鍵、小分子或者蛋白質(zhì)結合區(qū)域等, 此外PROSITE 還包括由多序列比對構建的序列表譜( profile) , 能更敏感地發(fā)現(xiàn)序列中的信息。PROSITE同時數(shù)據(jù)庫提供了序列分析工具同時數(shù)據(jù)庫提供了序列分析工具: ScanProsite 是用于搜索所提交的序列數(shù)據(jù)是否包是用于搜索所提交的序列數(shù)據(jù)是否包含含 PROSITE 數(shù)據(jù)庫中的序列模式或者數(shù)據(jù)庫中的序

17、列模式或者SWISS-PROT 數(shù)據(jù)庫中已提交的序列模式數(shù)據(jù)庫中已提交的序列模式; MotifScan 用于查找未知序列中所有可能的已知結用于查找未知序列中所有可能的已知結構組件構組件, 數(shù)據(jù)庫包括數(shù)據(jù)庫包括PROSITE序列表譜、序列表譜、PROSITE 模式、模式、Pfam 收集的隱馬爾可夫模式收集的隱馬爾可夫模式( HMM)。(2) PRINTS Fingerprint Database www.bioinf.man.ac.uk/dbrowser/PRINTS/ 這個數(shù)據(jù)庫包含1 500 個蛋白質(zhì)指紋圖譜, 編碼9 136 個單一模體。(3) BLOCKS ( www.blocks.fh

18、/ )BLOCKS 是通過一些高度保守的蛋白質(zhì)區(qū)域比對出來的無空位的片段。模體數(shù)據(jù)庫模體數(shù)據(jù)庫蛋白質(zhì)結構域數(shù)據(jù)庫蛋白質(zhì)結構域數(shù)據(jù)庫 (1 ) 蛋白質(zhì)家族序列比對以及隱馬爾可夫模式數(shù)據(jù)庫蛋白質(zhì)家族序列比對以及隱馬爾可夫模式數(shù)據(jù)庫Pfam( protein families database of alignments and HMMs)Pfam 是蛋白質(zhì)家族序列比對以及隱馬爾可夫模式數(shù)據(jù)庫,其網(wǎng)址是: www.sanger.ac.uk/Software/Pfam/index.shtml。 (2) 蛋白質(zhì)結構域數(shù)據(jù)庫蛋白質(zhì)結構域數(shù)據(jù)庫ProDom http:/prodes.toulo

19、use.inra.fr/prodom/doc/prodom.html (3) SMART SMART 是一個簡單的結構研究工具, 可對可轉(zhuǎn)移的遺傳因子進行鑒定和注解, 以及分析結構域結構, 可以檢測出500 多個參與信號傳導、胞外和染色體相關蛋白質(zhì)的結構域家族, 對這些結構域又在系統(tǒng)進化樹分布、功能分類、三級結構和重要的功能殘基方面做了注解。 http:/smart.embl-heidelberg.de/PDB( protein data bank , PDB) /pdb/PDB 包括了蛋白質(zhì)、核酸、蛋白質(zhì)-核酸復合體以及病毒等生物大分子結構數(shù)據(jù), 主要是蛋

20、白質(zhì)結構數(shù)據(jù), 這些數(shù)據(jù)來源于幾乎全世界所有從事生物大分子結構研究的研究機構, 并由結構生物學合作研究協(xié)會(RCSB) 維護和注釋。(1) CATH 數(shù)據(jù)庫數(shù)據(jù)庫 www.biochem.ucl.ac.uk/bsm/cathnew/index.html(2) SCOP 蛋白質(zhì)結構分類數(shù)據(jù)庫蛋白質(zhì)結構分類數(shù)據(jù)庫( structural classification of protein database,SCOP) scop.mrclmb.cam.ac.uk/scop/index.html蛋白質(zhì)序列分析蛋白質(zhì)序列分析蛋白質(zhì)一級序列蛋白質(zhì)一級序列蛋白質(zhì)基本理化性質(zhì)分析蛋白質(zhì)基本理化性質(zhì)分析蛋白質(zhì)親

21、疏水性分析蛋白質(zhì)親疏水性分析跨膜區(qū)結構預測跨膜區(qū)結構預測卷曲螺旋預測卷曲螺旋預測翻譯后修飾位點預測翻譯后修飾位點預測蛋白質(zhì)二級結構蛋白質(zhì)二級結構蛋白質(zhì)二級結構預測蛋白質(zhì)二級結構預測蛋白質(zhì)序列信號位點分析蛋白質(zhì)序列信號位點分析蛋白質(zhì)超二級結構蛋白質(zhì)超二級結構蛋白質(zhì)結構域分析蛋白質(zhì)結構域分析蛋白質(zhì)三級結構蛋白質(zhì)三級結構蛋白質(zhì)三維結構模擬蛋白質(zhì)三維結構模擬蛋白質(zhì)分類蛋白質(zhì)分類蛋白質(zhì)家族分析蛋白質(zhì)家族分析蛋白質(zhì)理化性質(zhì)是蛋白質(zhì)研究的基礎蛋白質(zhì)理化性質(zhì)是蛋白質(zhì)研究的基礎 蛋白質(zhì)的基本性質(zhì):蛋白質(zhì)的基本性質(zhì):相對分子質(zhì)量相對分子質(zhì)量 氨基酸組成氨基酸組成等電點(等電點(PIPI) 消光系數(shù)消光系數(shù)半衰期半

22、衰期 不穩(wěn)定系數(shù)不穩(wěn)定系數(shù)總平均親水性總平均親水性 實驗實驗方法:方法: 相對分子質(zhì)量的測定、等電點實驗、沉降實驗相對分子質(zhì)量的測定、等電點實驗、沉降實驗 缺點:費時、耗資缺點:費時、耗資基于實驗經(jīng)驗值的計算機分析方法基于實驗經(jīng)驗值的計算機分析方法1.1.蛋白質(zhì)基本理化性質(zhì)分析蛋白質(zhì)基本理化性質(zhì)分析 基于一級序列的組分分析基于一級序列的組分分析氨基酸親疏水性等分析為高級結構預測提供參考氨基酸親疏水性等分析為高級結構預測提供參考 Expasy 開發(fā)的針對蛋白質(zhì)基本理化性質(zhì)的分析:開發(fā)的針對蛋白質(zhì)基本理化性質(zhì)的分析: Protparam 工具工具 /tool

23、s/protparam.html相對分子質(zhì)量相對分子質(zhì)量 氨基酸組成氨基酸組成等電點(等電點(PI) 消光系數(shù)消光系數(shù)半衰期半衰期 不穩(wěn)定系數(shù)不穩(wěn)定系數(shù)總平均親水性總平均親水性 工具工具網(wǎng)站網(wǎng)站備注備注AACompldent/tools/aacomp/利用未知蛋白質(zhì)的氨基酸組利用未知蛋白質(zhì)的氨基酸組成確認具有相同組成的已知成確認具有相同組成的已知蛋白蛋白Compute pI/Mw/tools/pi_tool.html計算蛋白質(zhì)序列的等電點和計算蛋白質(zhì)序列的等電點和分子量分子量ProtParam/to

24、ols/protparam.html對氨基酸序列多個物理和化對氨基酸序列多個物理和化學參數(shù)(分子量、等電點、學參數(shù)(分子量、等電點、吸光系數(shù)等)進行計算吸光系數(shù)等)進行計算PeptideMass/tools/peptide-mass.html計算相應肽段的計算相應肽段的pI和分子量和分子量SAPSh t t p : / / w w w . i s r e c . i s b -sib.ch/software/SAPS_form.html利用蛋白質(zhì)序列統(tǒng)計分析方利用蛋白質(zhì)序列統(tǒng)計分析方法給出待測蛋白的物理化學法給出待測蛋白的物理化學信息信息蛋白質(zhì)理化性質(zhì)分析工具蛋

25、白質(zhì)理化性質(zhì)分析工具AACompIdent PeptideMass Protparam 工具 /tools/protparam.html計算以下物理化學性質(zhì):計算以下物理化學性質(zhì): 相對分子質(zhì)量 理論 pI 值 氨基酸組成 原子組成 消光系數(shù) 半衰期 不穩(wěn)定系數(shù) 脂肪系數(shù) 總平均親水性主要選項主要選項/參數(shù)參數(shù)序列在線提交形式: 如果分析SWISS-PORT和TrEMBL數(shù)據(jù)庫中序列 直接填寫Swiss-Prot/TrEMBL AC號(accession number) 如果分析新序列: 直接在搜索框中粘貼氨基酸序列輸入輸入Swiss-Prot/TrEM

26、BL AC號號打開打開protein.txt,將蛋白質(zhì)序列將蛋白質(zhì)序列粘貼在搜索框中粘貼在搜索框中 輸入Swiss-Prot/TrEMBL AC號分不同的功能域肽段輸出結果輸出結果 功能功能域域用戶自定義區(qū)用戶自定義區(qū)段段點擊不同功能域或是以直接粘貼氨基酸序列的方式得到以下結果點擊不同功能域或是以直接粘貼氨基酸序列的方式得到以下結果氨基酸數(shù)目氨基酸數(shù)目相對分子質(zhì)量相對分子質(zhì)量理論理論 pI 值值氨基酸組成氨基酸組成正正/負電荷殘基數(shù)負電荷殘基數(shù)37消光系數(shù)消光系數(shù)半衰期半衰期原子組成原子組成分子式分子式總原子數(shù)總原子數(shù)不穩(wěn)定系數(shù)不穩(wěn)定系數(shù)脂肪系數(shù)脂肪系數(shù)總平均親水總平均親水性性40 unsta

27、ble(a)-Type I membrane protein(b)-Type II membrane protein(c)-Multipass transmembrane proteins(d)-Lipid chain-anchored membrane proteins(e)-GPI-anchored membrane proteins2 2、蛋白質(zhì)、蛋白質(zhì)親疏水性親疏水性/ /跨膜區(qū)分析跨膜區(qū)分析3 3、蛋白質(zhì)、蛋白質(zhì)親疏水性分析親疏水性分析氨基酸側(cè)鏈的疏水性用從各氨基酸減去甘氨酸疏水性之值來表示,蛋白質(zhì)的疏水性在保持蛋白質(zhì)三級結構的形成和穩(wěn)定中起著重要作用。疏水作用是蛋白質(zhì)折疊的主要驅(qū)動

28、力分析蛋白質(zhì)氨基酸親疏水性是了解蛋白質(zhì)折疊的第一步氨基酸疏水分析為蛋白質(zhì)二級結構預測提供佐證可用于分析蛋白質(zhì)相互作用位點-抗原位點預測(預測準確率達56%)是分析蛋白質(zhì)跨膜區(qū)重要一步海參溶菌酶親水性海參溶菌酶親水性/疏水性分析疏水性分析Score 0,表示疏水性; Score 0,表示親水性 螺旋跨膜區(qū)主要是由螺旋跨膜區(qū)主要是由20-30個疏水性氨基酸(個疏水性氨基酸(Leu、Ile、Val、Met、Gly、Ala等)組成等)組成 親水殘基往往出現(xiàn)在疏水殘基之間,對功能有重要的親水殘基往往出現(xiàn)在疏水殘基之間,對功能有重要的作用作用 基于親基于親/疏水量和蛋白質(zhì)膜區(qū)每個氨基酸的統(tǒng)計學分布疏水量和

29、蛋白質(zhì)膜區(qū)每個氨基酸的統(tǒng)計學分布偏好性量偏好性量 TMpred/software/TMPRED_form.html SOSUI- http:/bp.nuap.nagoya-u.ac.jp/sosui/ 4 4、蛋白質(zhì)、蛋白質(zhì)跨膜區(qū)分析跨膜區(qū)分析常用蛋白質(zhì)跨膜區(qū)域分析工具常用蛋白質(zhì)跨膜區(qū)域分析工具工具工具網(wǎng)站網(wǎng)站備注備注DAShttp:/www.sbc.su.se/miklos/DAS/用用Dense Alignment Surface(DAS)算法來預測無同源)算法來預測無同源家族的蛋白跨膜區(qū)家族的蛋白跨膜區(qū)HMMTOPhttp:/www.enzi

30、m.hu/hmmtop/由由Enzymology研究所開發(fā)研究所開發(fā)的蛋白質(zhì)跨膜區(qū)和拓撲結構的蛋白質(zhì)跨膜區(qū)和拓撲結構預測程序預測程序SOSUIhttp:/bp.nuap.nagoya-u.ac.jp/sosui/由由Nagoya大學開發(fā)一個具大學開發(fā)一個具有圖形顯示跨膜區(qū)的程序有圖形顯示跨膜區(qū)的程序TMAPhttp:/bioinfo.limbo.ifm.liu.se/tmap/基于多序列比對來預測跨膜基于多序列比對來預測跨膜區(qū)的程序區(qū)的程序TMHMMhttp:/www.cbs.dtu.dk/services/TMHMM-2.0基于基于HMM方法的蛋白質(zhì)跨方法的蛋白質(zhì)跨膜區(qū)預測工具膜區(qū)預測工具T

31、Mpred/software/TMPRED_form.html基于對基于對TMbase數(shù)據(jù)庫的統(tǒng)數(shù)據(jù)庫的統(tǒng)計分析來預測蛋白質(zhì)跨膜區(qū)計分析來預測蛋白質(zhì)跨膜區(qū)和跨膜方向和跨膜方向TopPredhttp:/bioweb.pasteur.fr/seqanal/interfaces/toppred.html是一個位于法國的蛋白質(zhì)拓是一個位于法國的蛋白質(zhì)拓撲結構預測程序撲結構預測程序TMHMM ProtScale工具工具 /tools/protscale.html 氨基酸標度氨基酸標度 表示氨基酸在某種實驗狀態(tài)下相對其他氨

32、基酸在某些性表示氨基酸在某種實驗狀態(tài)下相對其他氨基酸在某些性質(zhì)的差異,如疏水性、親水性等質(zhì)的差異,如疏水性、親水性等 收集收集56多個文獻中提供的氨基酸標度多個文獻中提供的氨基酸標度 默認值以默認值以Hphob. Kyte & Doolittle做疏水性分析做疏水性分析 特異性氨基酸標度,如特異性氨基酸標度,如Hopp & Woods(1981)針對抗原片)針對抗原片段定位;段定位;Accessible residues(1979)針對氨基酸溶劑可及)針對氨基酸溶劑可及性定位;性定位;Chou & Fasman (1978)針對氨基酸二級結構疏)針對氨基酸二級結構疏水性

33、分析水性分析5 5、蛋白質(zhì)、蛋白質(zhì)親疏水性分析親疏水性分析主要選項主要選項/ /參數(shù)參數(shù)序列在線提交形式:序列在線提交形式:如果分析如果分析SWISS-PORT和和TrEMBL數(shù)據(jù)庫中序列數(shù)據(jù)庫中序列 直接填寫直接填寫Swiss-Prot/TrEMBL AC號號(accession number) 如果分析新序列:如果分析新序列: 直接在搜索框中粘貼氨基酸序列直接在搜索框中粘貼氨基酸序列輸入輸入Swiss-Prot/TrEMBL AC號號打開打開protein.txt,將一條蛋白質(zhì)序列將一條蛋白質(zhì)序列粘貼在搜索框中粘貼在搜索框中計算窗口(計算窗口(7-11)相對權重值相對權重值 權重值變化趨勢

34、權重值變化趨勢 氨基酸標度氨基酸標度是否歸一化是否歸一化輸出結果輸出結果 輸入Swiss-Prot/TrEMBL AC號分不同的功能域肽段功能功能域域用戶自定義區(qū)用戶自定義區(qū)段段所用氨基所用氨基酸標度信酸標度信息息分析所用分析所用參數(shù)信息參數(shù)信息輸出結果輸出結果圖形結果圖形結果 文本結果文本結果 序列序列 參數(shù)參數(shù) 每個位置每個位置 的得分的得分(3 3) 跨膜區(qū)分析跨膜區(qū)分析蛋白質(zhì)含有跨膜區(qū)提示它可能作為膜受體起作用,也可蛋白質(zhì)含有跨膜區(qū)提示它可能作為膜受體起作用,也可能是定位在膜上的錨定蛋白或離子通道蛋白。能是定位在膜上的錨定蛋白或離子通道蛋白。例例,使用,使用TMHMM Server v

35、.2.0TMHMM Server v.2.0在線分析在線分析http:/www.cbs.dtu.dk/services/TMHMM/http:/www.cbs.dtu.dk/services/TMHMM/鋁激活蘋果酸的轉(zhuǎn)運蛋白鋁激活蘋果酸的轉(zhuǎn)運蛋白(TaALMT1)跨膜結構分析跨膜結構分析6 6、跨、跨膜區(qū)分析膜區(qū)分析 TMpred工具工具:/software/TMPRED_form.html 預測跨膜區(qū)和跨膜方向 依靠跨膜蛋白數(shù)據(jù)庫Tmbase主要參數(shù)主要參數(shù)/ /選項選項 序列在線提交形式:序列在線提交形式: 直接貼入蛋白序列直接貼入蛋白序列

36、填寫填寫SwissProt/TrEMBL/EMBL/EST的的ID或或AC輸出格式輸出格式最短和最長的跨膜螺旋疏水區(qū)長度最短和最長的跨膜螺旋疏水區(qū)長度輸入序列名(可選)輸入序列名(可選)選擇序列的格式選擇序列的格式貼入貼入protein.txt蛋白蛋白質(zhì)序列質(zhì)序列輸出結果輸出結果 包含四個部分包含四個部分 可能的跨膜螺旋區(qū)可能的跨膜螺旋區(qū) 相關性列表相關性列表可能的跨膜螺旋區(qū)可能的跨膜螺旋區(qū)相關性列表相關性列表位置位置分值分值 片段中點位置片段中點位置 跨膜拓撲模型及圖示建議的跨膜拓撲模型建議的跨膜拓撲模型每一位置計算分值每一位置計算分值最優(yōu)拓最優(yōu)拓撲結構撲結構 SOSUI工具工具: - ht

37、tp:/bp.nuap.nagoya-u.ac.jp/sosui/ 以圖形方式返回結果,需要Java Applet程序輸入氨基酸單字母輸入氨基酸單字母運行運行平均疏水值平均疏水值預測的跨模螺旋區(qū)預測的跨模螺旋區(qū)域域兩種跨膜兩種跨膜Helix預測區(qū)域的螺旋示意預測區(qū)域的螺旋示意圖圖平均疏水值平均疏水值預測的跨模螺旋區(qū)預測的跨模螺旋區(qū)域域兩種跨膜兩種跨膜Helix59親疏水輪親疏水輪廓廓跨膜蛋白序列跨膜蛋白序列“邊界邊界”原則原則 -Landolt Marticorena et al., 1993 胞外末端Asp、Ser和Pro 胞外-內(nèi)分界區(qū)域Trp 跨膜區(qū)Leu、Ile、Val、Met、Phe

38、、Trp、Cys、Ala、Pro和Gly 胞內(nèi)-外分界區(qū)域Tyr、Trp和Phe 胞內(nèi)末端Lys和Arg 兩股或兩股以上螺旋相互纏繞而形成超螺旋結構 存在于多種天然蛋白質(zhì)中,如轉(zhuǎn)錄因子、結構蛋白、膜蛋白中,在生物體內(nèi)執(zhí)行著代謝調(diào)控、分子運動、膜通道、分子識別等重要的生物功能,637 7、蛋白質(zhì)、蛋白質(zhì)卷曲螺旋域分析卷曲螺旋域分析 典型的有亮氨酸拉鏈,存在7殘基 重復結構(heptad repeat),以a,b, c,d,e,f,g位置表示,其中a和d位置為疏水性氨基酸,而其他位置 殘 基為親水性 蛋白質(zhì)中由蛋白質(zhì)中由2-72-7條條螺旋鏈相互纏繞形成類似麻花狀結構螺旋鏈相互纏繞形成類似麻花狀結

39、構的總稱;的總稱; 主要存在形式是主要存在形式是2-52-5條相互纏繞形成的平行或反平行同寡條相互纏繞形成的平行或反平行同寡聚體或異寡聚體;聚體或異寡聚體; 是控制蛋白質(zhì)寡聚化的元件,轉(zhuǎn)錄因子、骨架蛋白、動是控制蛋白質(zhì)寡聚化的元件,轉(zhuǎn)錄因子、骨架蛋白、動力蛋白、膜蛋白、酶等;力蛋白、膜蛋白、酶等; 七肽重復區(qū)。七肽重復區(qū)。蛋白質(zhì)卷曲螺旋域分析蛋白質(zhì)卷曲螺旋域分析工具工具網(wǎng)站網(wǎng)站備注備注Coils /software/COILS_form.html主流的預測螺旋卷曲工具主流的預測螺旋卷曲工具Paircoil2http:/groups.csail.mi

40、/cb/paircoil2/paircoil2.html由由MIT大學開發(fā)的基于殘大學開發(fā)的基于殘基配對概率算法的預測工基配對概率算法的預測工具具PEPCOILhttp:/bioweb.pasteur.fr/seqanal/interfaces/pepcoil.html由由EMBOSS維護的預測卷維護的預測卷曲螺旋程序,同曲螺旋程序,同Coils類似類似S O C K E T serverhttp:/www.lifesci.sussex.ac.uk/research/woolfson/html/coiledcoils/socket/server.html一個分析蛋白質(zhì)結構中卷一個分析蛋白質(zhì)結構中卷曲螺旋的工具,其輸入數(shù)曲螺旋的工具,其輸入數(shù)據(jù)格式為蛋白質(zhì)結構數(shù)據(jù)據(jù)格式為蛋白質(zhì)結構數(shù)據(jù)TRESPASSERhttp:/comp.chem.nottingham.ac.uk/cgi-bin/trespasser/trespasser.cgi由由Nottingham大學開發(fā)的大學開發(fā)的亮氨酸拉鏈結構識別工具亮氨酸拉鏈結構識別工具2ZIPhttp:/2zip.molgen.mpg.de/index.html預測蛋白質(zhì)序列中潛在的預測蛋白質(zhì)序列中潛在的亮氨酸拉鏈結構和卷曲螺亮氨酸拉鏈結構和卷曲螺旋旋 蛋白質(zhì)卷曲螺旋預測

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論