




已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
生物信息學 謝文海講iewenhai 第五章蛋白質序列分析及結構預測 一 蛋白質的結構二 蛋白質數(shù)據(jù)庫介紹三 蛋白質序列分析四 蛋白質結構預測五 蛋白質功能預測 從多條免疫球蛋白序列中提取的8個片段的多重比對 回顧 humanbetaglobin 人 珠蛋白 horsebetaglobin 馬 珠蛋白 humanalphaglobin 人 珠蛋白 horsealphaglobin 馬 珠蛋白 cyanohaemoglobin 藍血紅蛋白 whalemyoglobin 鯨肌紅蛋白 Leghaemoglobin 豆血紅蛋白 通過珠蛋白的比較構建系統(tǒng)發(fā)育樹判斷生物進化分歧時間 回顧 結構是蛋白行使功能的前提 一 蛋白質的結構 蛋白質的結構主要分為四級 一級結構 二級結構 三級結構以及四級結構 一級結構 蛋白質多肽鏈中氨基酸殘基的排列順序 MTYKLILNGKTKGETTTEAVDAATAEKVFQYANDNGVDGEWTYTE 蛋白質二級結構 二級結構 主要由氫鍵維系的結構 螺旋 折疊 指多肽鏈中主鏈原子的局部空間排布即構象 不涉及側鏈部分的構象 螺旋 折疊 轉角 無規(guī)卷曲 螺旋組合 折疊組合 和 螺旋 折疊組合 螺旋 helix 的結構特征為 1 主鏈骨架圍繞中心軸盤繞形成右手螺旋 2 螺旋每上升一圈是3 6個氨基酸殘基 螺距為0 54nm 3 相鄰螺旋圈之間形成許多氫鍵 4 側鏈基團位于螺旋的外側 Ala Glu Leu Met促進形成Pro Gly Tyr Ser不利于形成 人細胞珠蛋白 2DC3 pdb 的第121到140位殘基對應的a 螺旋側面和頂部 N端 視圖 1 若干條肽鏈或肽段平行或反平行排列成片 2 所有肽鍵的C O和N H形成鏈間氫鍵 3 側鏈基團分別交替位于片層的上 下方 折疊 sheets 的結構特征為 反平行和平行的多個 折疊鏈形成一個完整 折疊結構的氫鍵示意圖 來自人pi型谷胱甘肽 S 轉硫酶中單個亞基中連續(xù)主鏈的部分 折疊結構 2DGQ pdb 側面視圖 可見轉角 turn 來自人pi型谷胱甘肽 S 轉硫酶一個亞基中連續(xù)主鏈的部分 折疊結構頂部視圖 可見轉角 turn 來自人信號傳遞蛋白SMAD4 1DD1 pdb 的一個亞基中部分 折疊結構頂部視圖 可見到大的環(huán)區(qū) loop 多肽鏈180 回折部分 通常由四個氨基酸殘基構成 借1 4殘基之間形成的氫鍵維系 Asp Asn Ser Thr Gln Pro常出現(xiàn)在 轉角 轉角的結構特征為 來自人細胞珠蛋白 2DC3 pdb 的兩段 螺旋由 轉角連接 用粗樹枝狀顯示了兩段螺旋末端的脯氨酸 無規(guī)卷曲的結構特征為 無規(guī)卷曲的特點為在主鏈骨架上無規(guī)則盤繞 其構象狀態(tài)仍遵循物理化學原理 但波動性較大 對溫度變化敏感 實驗測定三級結構時往往無法識別無規(guī)卷曲 缺失其座標 即使有座標則其溫度因子也較高 無規(guī)卷曲同 環(huán)的區(qū)分主要是其長度和其形狀的波動性 超二級結構的主要類型和特征超二級結構 supersecondarystructure 指位于同一主鏈的多個二級結構組裝形成的特定組裝體 可直接作為三級結構的或結構域的組成單元 是從蛋白質二級結構形成三級結構的一個過渡結構形式 也稱為立體結構形成的模體 1 轉角或 環(huán)等連接連續(xù)四個 螺旋形成的四 螺旋捆 2 中部固定位置含有亮氨酸及其他疏水側鏈氨基酸殘基 在螺旋兩端含有強親水側鏈氨基酸的 螺旋組成的亮氨酸拉鏈 Leucinezipper 3 一條主鏈中相鄰七個兩親 螺旋通過過度結構形成的七次穿膜螺旋組 4 連續(xù)主鏈中兩段 螺旋連接三段 折疊鏈形成的Rossmann折疊 5 轉角連接a螺旋構成的a 螺旋 轉角 螺旋 6 環(huán)連接 螺旋構成的 螺旋 環(huán) 螺旋等 7 折疊都為超二級結構 超二級結構的主要類型 蛋白質三級結構 二級結構進一步折疊形成的結構域 三級結構 蛋白質的多肽鏈在各種二級結構的基礎上再進一步盤曲或折迭形成具有一定規(guī)律的三維空間結構 稱為蛋白質的三級結構 tertiarystructure 蛋白質三級結構的穩(wěn)定主要靠次級鍵 包括氫鍵 疏水鍵 鹽鍵以及范德華力 VanderWasls力 等 四級結構 具有二條或二條以上獨立三級結構的多肽鏈組成的蛋白質 其多肽鏈間通過次級鍵相互組合而形成的空間結構稱為蛋白質的四級結構 quarternarystructure 其中 每個具有獨立三級結構的多肽鏈單位稱為亞基 subunit 蛋白質的一級結構決定了蛋白質的二級 三級 四級結構 1 蛋白質序列數(shù)據(jù)庫 如PIR SWISS PROT NCBI 這些數(shù)據(jù)庫的數(shù)據(jù)主要以蛋白質的序列為主 并賦予相應的注釋 2 蛋白質模體及結構域數(shù)據(jù)庫 如PROSITE Pfam 這些數(shù)據(jù)庫主要收集了蛋白質的保守結構域和功能域的特征序列 3 蛋白質結構數(shù)據(jù)庫 如PDB等 這些數(shù)據(jù)庫主要以蛋白質的結構測量數(shù)據(jù)為主 4 蛋白質分類數(shù)據(jù)庫 如SCOP CATH FSSP等 這其中有以序列比較為基礎的序列分類數(shù)據(jù)庫以及以結構比較為基礎的結構分類數(shù)據(jù)庫之分 依據(jù)蛋白質的結構層次 將蛋白質數(shù)據(jù)庫分為 二 蛋白質數(shù)據(jù)庫 蛋白質數(shù)據(jù)庫特征 這些數(shù)據(jù)庫種類有差別 但內部是相互聯(lián)系的 每個數(shù)據(jù)庫都有指針指向其他數(shù)據(jù)庫 而且數(shù)據(jù)庫之間的序列以及相應的結構是共享的 同一種蛋白質依次會出現(xiàn)在不同的數(shù)據(jù)庫 這樣的數(shù)據(jù)溝通有助于更深層地挖掘蛋白質的內在生物信息 這些數(shù)據(jù)庫是融序列信息的索取 處理 存儲 輸出于一身的 1 蛋白質序列數(shù)據(jù)庫 1 PIR proteininformationresource PIR 和PSD proteinsequencedatabase PSD http pir georgetown edu pirwwwPIR PSD是一個綜合全面的 非冗余的 專業(yè)注釋的 分類完整的蛋白質序列數(shù)據(jù)庫 PIR PSD的序列來自于將GenBank EMBL DDBJ三大數(shù)據(jù)庫的編碼序列的翻譯而成的蛋白質序列 發(fā)表的文獻中的序列和用戶直接提交的序列 2 SWISS PROT TrEMBL數(shù)據(jù)庫www expasy org swissprot 數(shù)據(jù)庫由蛋白質序列條目構成 每個條目包含蛋白質序列 引用文獻信息 分類學信息 注釋等 注釋中包括蛋白質的功能 轉錄后修飾位點 特殊位點和區(qū)域 二級結構 四級結構 與其他序列的相似性 序列殘缺與疾病的關系 序列變異體等信息 2 模體以及結構域數(shù)據(jù)庫 模體數(shù)據(jù)庫 1 PROSITE蛋白質家族及結構域數(shù)據(jù)庫 www expasy org prosite PROSITE數(shù)據(jù)庫收集了有顯著生物學意義的蛋白質位點序列 蛋白質特征序列譜庫以及序列模型 并能依據(jù)這些特征屬性快速可靠地鑒定出一個未知功能蛋白質序列屬于哪個蛋白質家族 即使在蛋白質序列相似性很低的情況下 也可以通過搜索隱含的功能結構模體 motif 來鑒定 因此是有效的序列分析數(shù)據(jù)庫 PROSITE中涉及的序列模式包括酶的催化位點 配體結合位點 金屬離子結合位點 二硫鍵 小分子或者蛋白質結合區(qū)域等 此外PROSITE還包括由多序列比對構建的序列表譜 profile 能更敏感地發(fā)現(xiàn)序列中的信息 PROSITE同時數(shù)據(jù)庫提供了序列分析工具 ScanProsite是用于搜索所提交的序列數(shù)據(jù)是否包含PROSITE數(shù)據(jù)庫中的序列模式或者SWISS PROT數(shù)據(jù)庫中已提交的序列模式 MotifScan用于查找未知序列中所有可能的已知結構組件 數(shù)據(jù)庫包括PROSITE序列表譜 PROSITE模式 Pfam收集的隱馬爾可夫模式 HMM 2 PRINTSFingerprintDatabasewww bioinf man ac uk dbrowser PRINTS 這個數(shù)據(jù)庫包含1500個蛋白質指紋圖譜 編碼9136個單一模體 3 BLOCKS www blocks fhcrc org BLOCKS是通過一些高度保守的蛋白質區(qū)域比對出來的無空位的片段 模體數(shù)據(jù)庫 蛋白質結構域數(shù)據(jù)庫 1 蛋白質家族序列比對以及隱馬爾可夫模式數(shù)據(jù)庫Pfam proteinfamiliesdatabaseofalignmentsandHMMs Pfam是蛋白質家族序列比對以及隱馬爾可夫模式數(shù)據(jù)庫 其網址是 www sanger ac uk Software Pfam index shtml 2 蛋白質結構域數(shù)據(jù)庫ProDomhttp prodes toulouse inra fr prodom doc prodom html 3 SMARTSMART是一個簡單的結構研究工具 可對可轉移的遺傳因子進行鑒定和注解 以及分析結構域結構 可以檢測出500多個參與信號傳導 胞外和染色體相關蛋白質的結構域家族 對這些結構域又在系統(tǒng)進化樹分布 功能分類 三級結構和重要的功能殘基方面做了注解 http smart embl heidelberg de 3 蛋白質結構數(shù)據(jù)庫 PDB proteindatabank PDB http www rcsb org pdb PDB包括了蛋白質 核酸 蛋白質 核酸復合體以及病毒等生物大分子結構數(shù)據(jù) 主要是蛋白質結構數(shù)據(jù) 這些數(shù)據(jù)來源于幾乎全世界所有從事生物大分子結構研究的研究機構 并由結構生物學合作研究協(xié)會 RCSB 維護和注釋 4 蛋白質結構分類數(shù)據(jù)庫 1 CATH數(shù)據(jù)庫www biochem ucl ac uk bsm cathnew index html 2 SCOP蛋白質結構分類數(shù)據(jù)庫 structuralclassificationofproteindatabase SCOP scop mrclmb cam ac uk scop index html 三 蛋白質的序列分析 蛋白質理化性質是蛋白質研究的基礎蛋白質的基本性質 相對分子質量氨基酸組成等電點 PI 消光系數(shù)半衰期不穩(wěn)定系數(shù)總平均親水性 實驗方法 相對分子質量的測定 等電點實驗 沉降實驗缺點 費時 耗資基于實驗經驗值的計算機分析方法 1 蛋白質基本理化性質分析 基于一級序列的組分分析氨基酸親疏水性等分析為高級結構預測提供參考Expasy開發(fā)的針對蛋白質基本理化性質的分析 Protparam工具http www expasy org tools protparam html 相對分子質量氨基酸組成等電點 PI 消光系數(shù)半衰期不穩(wěn)定系數(shù)總平均親水性 蛋白質理化性質分析工具 AACompIdent PeptideMass Protparam工具http www expasy org tools protparam html計算以下物理化學性質 相對分子質量理論pI值氨基酸組成原子組成消光系數(shù)半衰期不穩(wěn)定系數(shù)脂肪系數(shù)總平均親水性 主要選項 參數(shù) 序列在線提交形式 如果分析SWISS PORT和TrEMBL數(shù)據(jù)庫中序列直接填寫Swiss Prot TrEMBLAC號 accessionnumber 如果分析新序列 直接在搜索框中粘貼氨基酸序列 輸入Swiss Prot TrEMBLAC號 分不同的功能域肽段 輸出結果 點擊不同功能域或是以直接粘貼氨基酸序列的方式得到以下結果 正 負電荷殘基數(shù) 37 原子組成 分子式 總原子數(shù) 不穩(wěn)定系數(shù) 脂肪系數(shù) 總平均親水性 40unstable a TypeImembraneprotein b TypeIImembraneprotein c Multipasstransmembraneproteins d Lipidchain anchoredmembraneproteins e GPI anchoredmembraneproteins 2 蛋白質親疏水性 跨膜區(qū)分析 3 蛋白質親疏水性分析 氨基酸側鏈的疏水性用從各氨基酸減去甘氨酸疏水性之值來表示 蛋白質的疏水性在保持蛋白質三級結構的形成和穩(wěn)定中起著重要作用 疏水作用是蛋白質折疊的主要驅動力分析蛋白質氨基酸親疏水性是了解蛋白質折疊的第一步氨基酸疏水分析為蛋白質二級結構預測提供佐證可用于分析蛋白質相互作用位點 抗原位點預測 預測準確率達56 是分析蛋白質跨膜區(qū)重要一步 海參溶菌酶親水性 疏水性分析 Score 0 表示疏水性 Score 0 表示親水性 螺旋跨膜區(qū)主要是由20 30個疏水性氨基酸 Leu Ile Val Met Gly Ala等 組成親水殘基往往出現(xiàn)在疏水殘基之間 對功能有重要的作用基于親 疏水量和蛋白質膜區(qū)每個氨基酸的統(tǒng)計學分布偏好性量TMpredhttp www ch embnet org software TMPRED form htmlSOSUI http bp nuap nagoya u ac jp sosui 4 蛋白質跨膜區(qū)分析 常用蛋白質跨膜區(qū)域分析工具 TMHMM ProtScale工具http ca expasy org tools protscale html氨基酸標度表示氨基酸在某種實驗狀態(tài)下相對其他氨基酸在某些性質的差異 如疏水性 親水性等收集56多個文獻中提供的氨基酸標度默認值以Hphob Kyte Doolittle做疏水性分析特異性氨基酸標度 如Hopp Woods 1981 針對抗原片段定位 Accessibleresidues 1979 針對氨基酸溶劑可及性定位 Chou Fasman 1978 針對氨基酸二級結構疏水性分析 5 蛋白質親疏水性分析 主要選項 參數(shù)序列在線提交形式 如果分析SWISS PORT和TrEMBL數(shù)據(jù)庫中序列直接填寫Swiss Prot TrEMBLAC號 accessionnumber 如果分析新序列 直接在搜索框中粘貼氨基酸序列 是否歸一化 輸出結果輸入Swiss Prot TrEMBLAC號 分不同的功能域肽段 所用氨基酸標度信息 分析所用參數(shù)信息 輸出結果 3 跨膜區(qū)分析蛋白質含有跨膜區(qū)提示它可能作為膜受體起作用 也可能是定位在膜上的錨定蛋白或離子通道蛋白 例 使用TMHMMServerv 2 0在線分析http www cbs dtu dk services TMHMM 鋁激活蘋果酸的轉運蛋白 TaALMT1 跨膜結構分析 6 跨膜區(qū)分析 TMpred工具 http www ch embnet org software TMPRED form html預測跨膜區(qū)和跨膜方向依靠跨膜蛋白數(shù)據(jù)庫Tmbase 主要參數(shù) 選項 序列在線提交形式 直接貼入蛋白序列填寫SwissProt TrEMBL EMBL EST的ID或AC 輸出結果 包含四個部分可能的跨膜螺旋區(qū)相關性列表 跨膜拓撲模型及圖示 SOSUI工具 http bp nuap nagoya u ac jp sosui 以圖形方式返回結果 需要JavaApplet程序 輸入氨基酸單字母 運行 平均疏水值 預測的跨模螺旋區(qū)域 兩種跨膜Helix 預測區(qū)域的螺旋示意圖 平均疏水值 預測的跨模螺旋區(qū)域 兩種跨膜Helix 59 親疏水輪廓 跨膜蛋白序列 邊界 原則 LandoltMarticorenaetal 1993 胞外末端 Asp Ser和Pro胞外 內分界區(qū)域 Trp跨膜區(qū) Leu Ile Val Met Phe Trp Cys Ala Pro和Gly胞內 外分界區(qū)域 Tyr Trp和Phe胞內末端 Lys和Arg 兩股或兩股以上 螺旋相互纏繞而形成超螺旋結構存在于多種天然蛋白質中 如轉錄因子 結構蛋白 膜蛋白中 在生物體內執(zhí)行著代謝調控 分子運動 膜通道 分子識別等重要的生物功能 63 7 蛋白質卷曲螺旋域分析 典型的有亮氨酸拉鏈 存在7殘基重復結構 heptadrepeat 以a b c d e f g位置表示 其中a和d位置為疏水性氨基酸 而其他位置殘基為親水性 蛋白質中由2 7條 螺旋鏈相互纏繞形成類似麻花狀結構的總稱 主要存在形式是2 5條相互纏繞形成的平行或反平行同寡聚體或異寡聚體 是控制蛋白質寡聚化的元件 轉錄因子 骨架蛋白 動力蛋白 膜蛋白 酶等
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 軟件開發(fā)流程面臨的挑戰(zhàn)試題及答案
- 企業(yè)文化與風險管理考題及答案
- 制定職業(yè)晉升的長期規(guī)劃計劃
- 2024年甘肅隴南事業(yè)單位招聘筆試真題
- VB最佳編程習慣與技巧試題及答案
- 2024年東莞市市場監(jiān)督管理局招聘筆試真題
- 移動設備安全性測試試題及答案
- 軟件工程項目管理中的挑戰(zhàn)試題及答案
- 未來市場競爭中的風險識別試題及答案
- 自然語言處理技術試題及答案
- 人工智能標準化白皮書
- 2021譯林版高中英語選擇性必修一課文翻譯
- 0720小罐茶品牌介紹
- 二級、三級電箱接線圖
- 2022年食品衛(wèi)生通則第三版(中文版)
- 頸椎功能障礙指數(shù),Neck Disabilitv Index,NDI
- 名著導讀《紅樓夢》PPT課件(完整版)
- 吉林省辦學基本標準手冊
- 4車道高速公路30米預應力混凝土簡支T梁橋上部結構設計_論文
- 2020年廣東省中考物理試卷分析
- 脫氨蒸氨工段操作規(guī)程
評論
0/150
提交評論