蛋白質(zhì)生物信息學(xué)_第1頁
蛋白質(zhì)生物信息學(xué)_第2頁
蛋白質(zhì)生物信息學(xué)_第3頁
蛋白質(zhì)生物信息學(xué)_第4頁
蛋白質(zhì)生物信息學(xué)_第5頁
已閱讀5頁,還剩44頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于蛋白質(zhì)生物信息學(xué)第一節(jié)生物信息學(xué)與蛋白質(zhì)工程一、生物信息學(xué)概述生物信息學(xué)是利用應(yīng)用數(shù)學(xué)、信息學(xué)、統(tǒng)計學(xué)和計算機(jī)科學(xué)的方法研究生物學(xué)的問題。1987年,林華安首創(chuàng)Bioinformation一詞,被譽為”世界生物信息之父”。第2頁,共49頁,2024年2月25日,星期天生物信息學(xué)分子生物學(xué)與信息技術(shù)(尤其是互聯(lián)網(wǎng)技術(shù))的結(jié)合體。研究材料和結(jié)果就是各種各樣的生物學(xué)數(shù)據(jù)研究工具是計算機(jī)研究方法包括對生物學(xué)數(shù)據(jù)的搜索(收集和篩選)、處理(編輯、整理、管理和顯示)及利用(計算、模擬)。概述第3頁,共49頁,2024年2月25日,星期天研究內(nèi)容1、生物信息的收集、存儲、管理與提供2、基因組序列信息的提取和分析3、功能基因組相關(guān)信息分析4、生物大分子結(jié)構(gòu)模擬和藥物設(shè)計5、生物信息分析的技術(shù)與方法研究第4頁,共49頁,2024年2月25日,星期天2001年2月,人類基因組工程測序的完成,使生物信息學(xué)走向了一個高潮。由于DNA自動測序技術(shù)的快速發(fā)展,DNA數(shù)據(jù)庫中的核酸序列公共數(shù)據(jù)量以每天106bp速度增長,生物信息迅速地膨脹成數(shù)據(jù)的海洋。毫無疑問,我們正從一個積累數(shù)據(jù)向解釋數(shù)據(jù)的時代轉(zhuǎn)變,數(shù)據(jù)量的巨大積累往往蘊含著潛在突破性發(fā)現(xiàn)的可能?!吧镄畔W(xué)”正是從這一前提產(chǎn)生的交叉學(xué)科。發(fā)展條件第5頁,共49頁,2024年2月25日,星期天核心內(nèi)容是研究如何通過對DNA序列的統(tǒng)計計算分析,更加深入地理解DNA序列,結(jié)構(gòu),演化及其與生物功能之間的關(guān)系。研究課題涉及到分子生物學(xué),分子演化及結(jié)構(gòu)生物學(xué),統(tǒng)計學(xué)及計算機(jī)科學(xué)等許多領(lǐng)域。第6頁,共49頁,2024年2月25日,星期天以數(shù)據(jù)(庫)為核心1數(shù)據(jù)庫的建立2生物學(xué)數(shù)據(jù)的檢索3生物學(xué)數(shù)據(jù)的處理4生物學(xué)數(shù)據(jù)的利用:計算生物學(xué)研究過程第7頁,共49頁,2024年2月25日,星期天由于生物信息學(xué)是基于分子生物學(xué)與多種學(xué)科交叉而成的新學(xué)科,現(xiàn)有的形勢仍表現(xiàn)為各種學(xué)科的簡單堆砌,相互之間的聯(lián)系并不是特別的緊密。在處理大規(guī)模數(shù)據(jù)方面,沒有行之有效的一般性方法;而對于大規(guī)模數(shù)據(jù)內(nèi)在的生成機(jī)制也沒有完全明了,這使得生物信息學(xué)的研究短期內(nèi)很難有突破性的結(jié)果。研究展望第8頁,共49頁,2024年2月25日,星期天要真正解決這一問題,最終不能從計算機(jī)科學(xué)得到,真正地解決可能還是得從生物學(xué)自身,從數(shù)學(xué)上的新思路來獲得本質(zhì)性的動力。毫無疑問,正如Dulbecco1986年所說:"DNA序列是人類的真諦,這個世界上發(fā)生的一切事情,都與這一序列息息相關(guān)"。但要完全破譯這一序列以及相關(guān)的內(nèi)容,我們還有相當(dāng)長的路要走。研究展望第9頁,共49頁,2024年2月25日,星期天二、生物信息學(xué)與蛋白質(zhì)工程(一)蛋白質(zhì)序列分析,預(yù)測其理化性質(zhì)、空間結(jié)構(gòu)及生物學(xué)功能(二)蛋白質(zhì)結(jié)構(gòu)預(yù)測理論分析法:在理論計算的基礎(chǔ)上預(yù)測統(tǒng)計分析法:建立序列-結(jié)構(gòu)的映射模型(三)蛋白質(zhì)功能預(yù)測P162(四)蛋白質(zhì)分子設(shè)計第10頁,共49頁,2024年2月25日,星期天三、生物信息學(xué)與蛋白質(zhì)組學(xué)1994、澳大利亞Wilkins和Willians提出蛋白質(zhì)組:由全部基因表達(dá)的全部蛋白質(zhì)及其存在方式,是一種細(xì)胞、組織或完整的生命體在特定時空上所擁有的全套蛋白質(zhì)蛋白質(zhì)組學(xué):以蛋白質(zhì)為研究對象,闡明某生物體全部蛋白質(zhì)的表達(dá)模式及功能模式生物信息學(xué)理論、技術(shù)方法和軟件等在蛋白質(zhì)組學(xué)相關(guān)數(shù)據(jù)庫的建立、應(yīng)用以及蛋白質(zhì)組分析等方面具有重要的應(yīng)用第11頁,共49頁,2024年2月25日,星期天生物信息學(xué)作為一門新的學(xué)科領(lǐng)域,把基因組DNA序列信息分析作為源頭,在獲得蛋白質(zhì)編碼區(qū)的信息后進(jìn)行蛋白質(zhì)空間結(jié)構(gòu)模擬和預(yù)測,然后依據(jù)特定蛋白質(zhì)的功能進(jìn)行必要的藥物設(shè)計。基因組信息學(xué),蛋白質(zhì)空間結(jié)構(gòu)模擬以及藥物設(shè)計構(gòu)成了生物信息學(xué)的3個重要組成部分。第12頁,共49頁,2024年2月25日,星期天第二節(jié)蛋白質(zhì)常用數(shù)據(jù)庫及應(yīng)用一次數(shù)據(jù)庫:實驗獲得的原始數(shù)據(jù)。簡單歸類整理、注釋。Genbank、Swiss-Prot、PDB二次數(shù)據(jù)庫:在一次數(shù)據(jù)庫、實驗數(shù)據(jù)和理論分析的基礎(chǔ)上,根據(jù)研究內(nèi)容的需要,對相關(guān)生物知識和信息進(jìn)一步分析整理。包括人類基因組圖譜庫GDB、轉(zhuǎn)錄因子和結(jié)合位點庫TRANSFAC、蛋白質(zhì)結(jié)構(gòu)家族分類庫SCOP等。第13頁,共49頁,2024年2月25日,星期天第二節(jié)、蛋白質(zhì)常用數(shù)據(jù)庫一、核酸數(shù)據(jù)庫NCBI的Genbank、EMBL、DDBJ等第14頁,共49頁,2024年2月25日,星期天二、蛋白質(zhì)數(shù)據(jù)庫(一)蛋白序列數(shù)據(jù)庫:SWISS-PROT、PIR、TreEMBL、UniProt、GenPept第15頁,共49頁,2024年2月25日,星期天(二)蛋白序列二次數(shù)據(jù)庫蛋白保守區(qū)域和功能位點數(shù)據(jù)庫,PROSITE、PRINTS、BLOCKS第16頁,共49頁,2024年2月25日,星期天(三)蛋白結(jié)構(gòu)數(shù)據(jù)庫三維結(jié)構(gòu)數(shù)據(jù)庫PBD、MMDB第17頁,共49頁,2024年2月25日,星期天全人源抗EGFR單克隆抗體紅色字體為信號肽,標(biāo)黃部分為可變區(qū)重鏈可變區(qū)(HV)DNA序列(423bp)ATGGATTTTCAGGTGCAGATTTTCAGCTTCCTGCTAATCAGTGCCTCAGTCATAATATCCAGAGGACAGGTGCAGCTGCAGGAGTCGGGCCCAGGACTGGTGAAGCCTTCGGAGACCCTGTCCCTCACCTGCACTGTCTCTGGTGGCTCCGTCAGCAGTGGTGATTACTACTGGACCTGGATTCGGCAGTCCCCAGGGAAGGGACTGGAGTGGATTGGACACATCTATTACAGTGGGAACACCAATTATAACCCCTCCCTCAAGAGCAGACTCACCATATCAATTGACACGTCCAAGACTCAGTTCTCCCTGAAGCTGAGTTCTGTGACCGCTGCGGACACGGCCATTTATTACTGTGTGCGAGATCGAGTGACTGGTGCTTTTGATATCTGGGGCCAAGGGACAATGGTCACCGTCTCTTCA

第18頁,共49頁,2024年2月25日,星期天ATGGATTTTCAGGTGCAGATTTTCAGCTTCCTGCTAATCAGTGCCTCAGTCATAATATCCAGAGGAGacatccagatgacccagtctccatcctccctgtctgcatctgtaggagacagagtcACCATCACTTGCCAGGCGAGTCAGGACATCAGCAACTATTTAAATTGGTATCAGCAGAAACCAGGGAAAGCCCCTAAACTCCTGATCTACGATGCATCCAATTTGGAAACAGGGGTCCCATCAAGGTTCAGTGGAAGTGGATCTGGGACAGATTTTACTTTCACCATCAGCAGCCTGCAGCCTGAAGATATTGCAACATATTTCTGTCAACACTTTGATCATCTCCCGCTCGCTTTCGGCGGAGGGACCAAGGTGGAGATCAAACGTACTGTGGCTGCACCATCTGTCTTCATCTTCCCGCCATCTGATGAGCAGTTGAAATCTGGAACTGCCTCTGTTGTGTGCCTGCTGAATAACTTCTATCCCAGAGAGGCCAAAGTACAGTGGAAGGTGGATAACGCCCTCCAATCGGGTAACTCCCAGGAGAGTGTCACAGAGCAGGACAGCAAGGACAGCACCTACAGCCTCAGCAGCACCCTGACGCTGAGCAAAGCAGACTACGAGAAACACAAAGTCTACGCCTGCGAAGTCACCCATCAGGGCCTGAGCTCGCCCGTCACAAAGAGCTTCAACAGGGGAGAGTGT輕鏈全長(L)DNA序列(708bp)第19頁,共49頁,2024年2月25日,星期天GGTGGTGGTGGCTCTGGCGGTGGTGGCTCTGGTGGCGGTGGTTCT連接肽(G4S)3蛋白質(zhì)分子設(shè)計:VH-L-LVHVLCLlinker第20頁,共49頁,2024年2月25日,星期天第21頁,共49頁,2024年2月25日,星期天利用DNAman對VH-L-L的限制性內(nèi)切酶位點分析,結(jié)果顯示VH-L-L有31個限制性酶切位點,最多的是Eco57Ⅰ、TthlllⅠ分別有三個酶切位點。第22頁,共49頁,2024年2月25日,星期天第23頁,共49頁,2024年2月25日,星期天利用生物信息學(xué)軟件DNAman將VH-L-L的核苷酸序列翻譯為氨基酸序列第24頁,共49頁,2024年2月25日,星期天

利用NCBI提供的ORFFinder預(yù)測VH-L-L的ORF,從預(yù)測結(jié)果看出VH-L-L是一段連續(xù)的較長的ORF,它可能是一個完整的編碼序列第25頁,共49頁,2024年2月25日,星期天

利用ProtParam對VH-L-L的氨基酸序列及基本理化性質(zhì)進(jìn)行了分析。結(jié)果顯示VH-L-L蛋白由392個氨基酸組成的穩(wěn)定蛋白,分子式為C1867H2894N494O596S11

,分子量42149.1,等電點5.98。理論推導(dǎo)半衰期為:30h(體外,哺乳動物的網(wǎng)織紅細(xì)胞內(nèi))、20h(體內(nèi),酵母細(xì)胞內(nèi))、10h(體內(nèi),大腸桿菌)。不穩(wěn)定參數(shù)是38.92,屬于穩(wěn)定蛋白。含的氨基酸如圖所示:Ser(S),Glu(G),Thr(T)最多,分別占15.1%,9.9%,7.7%;不含Pyl(0),Sec(U)??値д姾蓺埢?Asp+Glu)為32,負(fù)電荷殘基(Arg+Lys)為29??偟挠H水性平均系數(shù)-0.169,預(yù)測該蛋白屬于親水性蛋白。第26頁,共49頁,2024年2月25日,星期天第27頁,共49頁,2024年2月25日,星期天第28頁,共49頁,2024年2月25日,星期天蛋白質(zhì)的親疏水性是影響蛋白質(zhì)空間結(jié)構(gòu)的因素之一。利用ProtScale分析氨基酸親水性/疏水性,預(yù)測結(jié)果顯示該氨基酸序列中親水性和疏水性區(qū)域間隔存在,小部分為中性,在氨基酸序列20、170處出現(xiàn)了較高的疏水性,此處富含疏水性氨基酸。總體來說,親水氨基酸多于疏水氨基酸,因此可以認(rèn)為VH-L-L是親水性蛋白第29頁,共49頁,2024年2月25日,星期天第30頁,共49頁,2024年2月25日,星期天

利用Tmpred分析VH-L-L的跨膜區(qū),分析表明,該序列無跨膜區(qū),不是跨膜蛋白??梢灶A(yù)測該蛋白在膜外第31頁,共49頁,2024年2月25日,星期天利用NetPhos進(jìn)行磷酸化位點分析,結(jié)果顯示磷酸化位點主要包括絲氨酸Ser位點:28個,蘇氨酸Thr:5個,酪氨酸Tyr:3個第32頁,共49頁,2024年2月25日,星期天

利用TargetP對VH-L-L蛋白的亞細(xì)胞定位進(jìn)行預(yù)測,結(jié)果表明,VH-L-L是分泌到細(xì)胞周質(zhì)的蛋白第33頁,共49頁,2024年2月25日,星期天III 蛋白質(zhì)二級結(jié)構(gòu)預(yù)測蛋白質(zhì)序列:

二級結(jié)構(gòu):↓第34頁,共49頁,2024年2月25日,星期天1、二級結(jié)構(gòu)預(yù)測概述蛋白質(zhì)的二級結(jié)構(gòu)預(yù)測的基本依據(jù)是: 每一段相鄰的氨基酸殘基具有形成一定二級結(jié)構(gòu)的傾向。二級結(jié)構(gòu)預(yù)測問題是模式分類問題二級結(jié)構(gòu)預(yù)測的目標(biāo):判斷每一段中心的殘基是否處于

螺旋、

折疊、轉(zhuǎn)角(或其它狀態(tài))之一的二級結(jié)構(gòu)態(tài),即三態(tài)。

第35頁,共49頁,2024年2月25日,星期天蛋白質(zhì)結(jié)構(gòu)預(yù)測主要有兩大類方法:(1)理論分析方法通過理論計算(如分子力學(xué)、分子動力學(xué)計算)進(jìn)行結(jié)構(gòu)預(yù)測。(2)統(tǒng)計的方法對已知結(jié)構(gòu)的蛋白質(zhì)進(jìn)行統(tǒng)計分析,建立序列到結(jié)構(gòu)的映射模型,進(jìn)而對未知結(jié)構(gòu)的蛋白質(zhì)根據(jù)映射模型直接從氨基酸序列預(yù)測結(jié)構(gòu)。包括:經(jīng)驗性方法(Chou-Fasman)、結(jié)構(gòu)規(guī)律提取方法(神經(jīng)網(wǎng)絡(luò)方法)、同源模型化方法第36頁,共49頁,2024年2月25日,星期天經(jīng)驗參數(shù)法由Chou和Fasman在70年代提出.是一種基于單個氨基酸殘基統(tǒng)計的經(jīng)驗預(yù)測方法。 通過統(tǒng)計分析,獲得的每個殘基出現(xiàn)于特定二級結(jié)構(gòu)構(gòu)象的傾向性因子,進(jìn)而利用這些傾向性因子預(yù)測蛋白質(zhì)的二級結(jié)構(gòu)。

第37頁,共49頁,2024年2月25日,星期天經(jīng)驗參數(shù)法蛋白質(zhì)二級結(jié)構(gòu)的組成規(guī)律性比較強三種基本二級結(jié)構(gòu)平均占氨基酸殘基的85%各種二級結(jié)構(gòu)非均勻地分布在蛋白質(zhì)中第38頁,共49頁,2024年2月25日,星期天有些蛋白質(zhì)中含有大量的

螺旋如血紅蛋白和肌紅蛋白而一些蛋白質(zhì)中則不含或者僅含很少的

螺旋如鐵氧蛋白有些蛋白質(zhì)的二級結(jié)構(gòu)以

折疊為主如免疫球蛋白例:肽鏈Ala(A)-Glu(E)-Leu(L)-Met(M)傾向于形成

螺旋肽鏈Pro(P)-Gly(G)-Tyr(Y)-Ser(S)則不會形成

螺旋

第39頁,共49頁,2024年2月25日,星期天每種氨基酸出現(xiàn)在各種二級結(jié)構(gòu)中傾向或者頻率是不同的例如:Glu主要出現(xiàn)在

螺旋中

Asp和Gly主要分布在轉(zhuǎn)角中

Pro也常出現(xiàn)在轉(zhuǎn)角中,但是絕不會出現(xiàn)在

螺旋中可以根據(jù)每種氨基酸殘基形成二級結(jié)構(gòu)的傾向性或者統(tǒng)計規(guī)律進(jìn)行二級結(jié)構(gòu)預(yù)測第40頁,共49頁,2024年2月25日,星期天基本策略(1)

相似序列→相似結(jié)構(gòu)QLMGERIRARRKKLKQLMGAERIRARRKKLK結(jié)構(gòu)?第41頁,共49頁,2024年2月25日,星期天基本策略(2)

分類分析α螺旋提取樣本聚類分析學(xué)習(xí)分類規(guī)則預(yù)測….-Gly-Ala-Glu-Phe-….第42頁,共49頁,2024年2月

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論