




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、復(fù)旦大學(xué) 實驗五:蛋白質(zhì)序列分析實驗五:蛋白質(zhì)序列分析基因與蛋白質(zhì)組學(xué)數(shù)據(jù)分析基因與蛋白質(zhì)組學(xué)數(shù)據(jù)分析.2實驗項目五:蛋白質(zhì)序列分析實驗項目五:蛋白質(zhì)序列分析一、 實驗?zāi)康暮鸵螅?掌握蛋白質(zhì)基本性質(zhì)分析;基本理化性質(zhì)和疏水性分析。 掌握蛋白質(zhì)信號肽的預(yù)測,亞細胞定位的預(yù)測,跨膜結(jié)構(gòu)及卷曲螺旋結(jié)構(gòu)的預(yù)測。 了解基于motif、結(jié)構(gòu)位點、結(jié)構(gòu)功能域數(shù)據(jù)庫的蛋白質(zhì)功能預(yù)測 掌握基于序列同源性分析的蛋白質(zhì)功能預(yù)測。.3(一)蛋白質(zhì)基本理化性質(zhì)分析蛋白質(zhì)理化性質(zhì)是蛋白質(zhì)研究的基礎(chǔ) 蛋白質(zhì)的基本性質(zhì): 相對分子質(zhì)量 氨基酸組成 等電點(PI) 消光系數(shù) 半衰期 不穩(wěn)定系數(shù) 總平均親水性 實驗方法: 相對
2、分子質(zhì)量的測定、等電點實驗、沉降實驗 缺點:費時、耗資基于實驗經(jīng)驗值的計算機分析方法 軟件 Bioedit 網(wǎng)絡(luò)工具ProtParam, Compute PI.4基于一級序列的組分分析氨基酸親疏水性等分析為高級結(jié)構(gòu)預(yù)測提供參考ExPASy( Expert Protein Analysis System ) 開發(fā)的針對蛋白質(zhì)基本理化性質(zhì)的分析: Protparam 工具 .5蛋白質(zhì)理化性質(zhì)分析蛋白質(zhì)理化性質(zhì)分析 Protparam 工具工具 計算以下物理化學(xué)性質(zhì):計算以下物理化學(xué)性質(zhì): 相對分子質(zhì)量相對分子質(zhì)量 理論理論 pI pI 值值 氨基酸組成氨基酸組成 原子組成原子組成 消光系數(shù)消光系數(shù)
3、 半衰期半衰期 不穩(wěn)定系數(shù)不穩(wěn)定系數(shù) 脂肪系數(shù)脂肪系數(shù) 總平均親水性總平均親水性.6主要選項主要選項/參數(shù)參數(shù)序列在線提交形式:序列在線提交形式: 如果分析SWISS-PORT和TrEMBL數(shù)據(jù)庫中序列 直接填寫Swiss-Prot/TrEMBL AC號(accession number) 如果分析新序列: 直接在搜索框中粘貼氨基酸序列輸入Swiss-Prot/TrEMBL AC號打開protein.txt,將蛋白質(zhì)序列粘貼在搜索框中.7 輸入Swiss-Prot/TrEMBL AC號分不同的功能域肽段 以P02699為例輸出結(jié)果輸出結(jié)果 功能域用戶自定義區(qū)段.8點擊不同功能域得到以下結(jié)果點擊
4、不同功能域得到以下結(jié)果氨基酸數(shù)目相對分子質(zhì)量理論 pI 值氨基酸組成正/負電荷殘基數(shù).9消光系數(shù)半衰期原子組成分子式總原子數(shù).10不穩(wěn)定系數(shù)脂肪系數(shù)總平均親水性40 unstable.11(二)蛋白質(zhì)疏水性分析 疏水作用是蛋白質(zhì)折疊的主要驅(qū)動力 分析蛋白質(zhì)氨基酸親疏水性是了解蛋白質(zhì)折疊的第一步 氨基酸疏水分析為蛋白質(zhì)二級結(jié)構(gòu)預(yù)測提供佐證 是分析蛋白質(zhì)跨膜區(qū)重要一步.12 ProtScale工具 氨基酸標(biāo)度 表示氨基酸在某種實驗狀態(tài)下相對其他氨基酸在某些性質(zhì)的差異,如疏水性、親水性等 收集50多個文獻中提供的氨基酸標(biāo)度 默認值以Hphob. Kyte & Doolittle做疏水性分析
5、ProtScale能計算超過50種蛋白質(zhì)的特性。僅一項需要額外設(shè)定的參數(shù)是輸入框的寬度,該參數(shù)將指示系統(tǒng)每次運行計算和顯示的殘基數(shù),其缺省值為9。如果想考慮跨膜螺旋特性,該參數(shù)設(shè)置應(yīng)為20,因為一個跨膜螺旋通常有20個氨基酸長度蛋白質(zhì)親疏水性分析.13主要選項/參數(shù)序列在線提交形式:如果分析SWISS-PORT和TrEMBL數(shù)據(jù)庫中序列 直接填寫Swiss-Prot/TrEMBL AC號(accession number)如果分析新序列: 直接在搜索框中粘貼氨基酸序列以P02699為例輸入Swiss-Prot/TrEMBL AC號打開protein.txt,將一條蛋白質(zhì)序列粘貼在搜索框中.14
6、氨基酸標(biāo)度計算窗口(7-11)相對權(quán)重值 權(quán)重值變化趨勢 是否歸一化.15所用氨基酸所用氨基酸標(biāo)度信息標(biāo)度信息分析所用參分析所用參數(shù)信息數(shù)信息輸出結(jié)果輸出結(jié)果.16圖形結(jié)果圖形結(jié)果 文本結(jié)果文本結(jié)果 參數(shù)參數(shù) 每個位置每個位置 的得分的得分.三三 信號肽預(yù)測信號肽預(yù)測 蛋白質(zhì)合成后要運送到細胞中不同的部位,有的蛋白質(zhì)要通過內(nèi)質(zhì)網(wǎng)膜進入內(nèi)質(zhì)網(wǎng)腔內(nèi),最終成為分泌蛋白分泌蛋白。 分泌蛋白的N端都有一段約1535個氨基酸的疏水性肽段,其功能是引導(dǎo)蛋白質(zhì)多肽鏈穿過內(nèi)質(zhì)網(wǎng)膜進入腔內(nèi),稱為信號肽信號肽(signal peptide)。 按照氨基酸組成及其位置特征,可將信號肽分為4大類:分泌信號肽 2. 脂蛋
7、白信號肽3. Pilin-like信號肽4. 細菌素和細菌素信號肽蛋白質(zhì)序列分析. 信號肽主要由三個domain組成:N-region、H-regin和C-region. N-region為正電荷區(qū)域,至少含有一個精氨酸(R) 或賴氨酸(K). H-region為疏水核,一般長為1214個氨基酸. C-region包含信號肽酶(SPase)的剪切位點,在剪切位點的-1位和-3位上多為中性的丙氨酸,該區(qū)域也稱為富含丙氨酸區(qū)域. N H C N端 C端蛋白質(zhì)序列分析.19 常用工具 SignaIP() 通過神經(jīng)網(wǎng)絡(luò)方法的組合 預(yù)測信號肽的位置及相應(yīng)切點三三 信號肽的預(yù)測信號肽的預(yù)測.人的內(nèi)質(zhì)網(wǎng)駐留
8、蛋白信號肽預(yù)測 Q9BS26輸入序列的輸入序列的FASTA文件文件.21人的內(nèi)質(zhì)網(wǎng)駐留蛋白信號肽預(yù)測曲線顏色曲線顏色此處此處C值最大;值最大;S值陡峭;值陡峭;Y值最高峰。預(yù)測為信號值最高峰。預(yù)測為信號肽剪切位點肽剪切位點文本結(jié)果,文本結(jié)果,YES代表該蛋代表該蛋白包含信號肽白包含信號肽,剪切位點剪切位點位于位于29,30殘基處殘基處C score: 剪切位點分值剪切位點分值S score: 信號肽分值信號肽分值Y score: 綜合剪切位點分值綜合剪切位點分值.22四 蛋白質(zhì)亞細胞定位預(yù)測 亞細胞定位與蛋白質(zhì)的功能存在著非常重要的聯(lián)系。亞細胞定位預(yù)測基于如下原理:(1)不同的細胞器往往具有不
9、同的理化環(huán)境,它根據(jù)蛋白質(zhì)的結(jié)構(gòu)及表面理化特征,選擇性容納蛋白。(2)蛋白質(zhì)表面直接暴露于細胞器環(huán)境中,它由序列折疊過程決定,而后者取決于氨基酸組成。因此可以通過氨基酸組成進行亞細胞定位的預(yù)測。 推薦使用PSORT()II軟件對PDCD5蛋白的細胞內(nèi)定位進行預(yù)測。PSORT將動物蛋白質(zhì)定位于10個細胞器:(1)細胞漿,(2)細胞骨架,(3)內(nèi)質(zhì)網(wǎng),(4)胞外,(5)高爾基體,(6)溶酶體,(7)線粒體,(8)胞核,(9)過氧化物酶體(peroxisome)和(10)細胞膜。.23輸入蛋白質(zhì)序列輸入蛋白質(zhì)序列FASTA文件文件.24.25細胞外,細胞壁細胞外,細胞壁線粒體線粒體細胞骨架細胞骨架細
10、胞核細胞核.26五 跨膜區(qū)預(yù)測 各個物種的膜蛋白的比例差別不大,約四分之一的人類已知蛋白為膜蛋白。由于膜蛋白不溶于水,分離純化困難,不容易生長晶體,很難確定其結(jié)構(gòu)。因此,對膜蛋白的跨膜螺旋進行預(yù)測是生物信息學(xué)的重要應(yīng)用。 推薦使用TMHMM軟件(ICEs/TMHMM/)對蛋白進行跨膜預(yù)測。TMHMM綜合了跨膜區(qū)疏水性、電荷偏倚、螺旋長度和膜蛋白拓撲學(xué)限制等性質(zhì),采用隱馬氏模型(Hidden Markov Models),對跨膜區(qū)及膜內(nèi)外區(qū)進行整體的預(yù)測。TMHMM是目前最好的進行跨膜區(qū)預(yù)測的軟件,它尤其長于區(qū)分可溶性蛋白和膜蛋白,因此首選它來判定一個蛋白是否為膜蛋白。所有跨膜區(qū)預(yù)測軟件的準確性
11、都不超過52%,但86%的跨膜區(qū)可以通過不同的軟件進行正確預(yù)測。因此,綜合分析不同的軟件預(yù)測結(jié)果和疏水性圖以獲得更好的預(yù)測結(jié)果。.27輸入蛋白質(zhì)序列輸入蛋白質(zhì)序列FASTA文件文件鋁激活蘋果酸轉(zhuǎn)運蛋白的跨膜區(qū)預(yù)測鋁激活蘋果酸轉(zhuǎn)運蛋白的跨膜區(qū)預(yù)測.28跨膜區(qū)跨膜區(qū)起始氨起始氨基酸基酸終止氨終止氨基酸基酸文字結(jié)果文字結(jié)果.29跨膜區(qū)跨膜區(qū)膜外區(qū)膜外區(qū)膜內(nèi)區(qū)膜內(nèi)區(qū)圖形結(jié)果圖形結(jié)果.30 卷曲螺旋卷曲螺旋(coiled coil)是蛋白質(zhì)中由27條螺旋鏈纏繞成麻花狀結(jié)構(gòu)的總稱 存在于多種天然蛋白質(zhì)中,如轉(zhuǎn)錄因子、結(jié)構(gòu)蛋白、膜蛋白中,在生物體內(nèi)執(zhí)行著代謝調(diào)控、分子運動、膜通道、分子識別等重要的生物功能,
12、六六 蛋白質(zhì)卷曲螺旋域分析蛋白質(zhì)卷曲螺旋域分析 典型的有亮氨酸拉鏈,存在7殘基 重復(fù)結(jié)構(gòu)(heptad repeat),以a,b, c,d,e,f,g位置表示,其中a和d位置為疏水性氨基酸,而其他位置 殘 基為親水性. 卷曲螺旋 控制蛋白質(zhì)寡聚化的元件,存在于轉(zhuǎn)錄因子、蛋白融合多肽等 一種很簡單的三級結(jié)構(gòu),容易預(yù)測 常用工具 COILS - Prediction of Coiled Coil Regions in Proteins ().選擇滑動窗口大小選擇滑動窗口大小選擇打分矩陣選擇打分矩陣和權(quán)重和權(quán)重選擇輸入格式,選擇選擇輸入格式,選擇“SwissProtID or AC”查 詢 內(nèi) 容
13、, 輸 入查 詢 內(nèi) 容 , 輸 入Q9H2G9.3333圖形結(jié)果圖形結(jié)果.34預(yù)測為預(yù)測為卷曲螺卷曲螺旋的區(qū)旋的區(qū)域域.七七 結(jié)構(gòu)域分析結(jié)構(gòu)域分析 結(jié)構(gòu)域結(jié)構(gòu)域(structure domain)是在蛋白質(zhì)三級結(jié)構(gòu)中介于二級和三級結(jié)構(gòu)之間的可以明顯區(qū)分但又相對獨立的折疊單元,每個結(jié)構(gòu)域自身形成緊實的三維結(jié)構(gòu),可以獨立存在或折疊,但結(jié)構(gòu)域與結(jié)構(gòu)域之間關(guān)系較為松散。 結(jié)構(gòu)域通常由25300個氨基酸組成,不同蛋白質(zhì)結(jié)構(gòu)域數(shù)目或同一蛋白質(zhì)結(jié)構(gòu)域相似度差異較大蛋白質(zhì)序列分析. 常見的結(jié)構(gòu)域主要有5種: 全平行結(jié)構(gòu)域 反平行結(jié)構(gòu)域 +結(jié)構(gòu)域 /結(jié)構(gòu)域 其他折疊類型 結(jié)構(gòu)域是蛋白質(zhì)的功能、結(jié)構(gòu)和進化單元,
14、結(jié)構(gòu)域分析對于蛋白質(zhì)結(jié)構(gòu)的分類和預(yù)測有著重要作用。蛋白質(zhì)序列分析.七七 基于結(jié)構(gòu)域(模體)的蛋白質(zhì)功能預(yù)測基于結(jié)構(gòu)域(模體)的蛋白質(zhì)功能預(yù)測一類基因具有轉(zhuǎn)錄功能,一類基因具有轉(zhuǎn)錄功能, 且它們所編碼的蛋且它們所編碼的蛋白質(zhì)都具有白質(zhì)都具有Y結(jié)構(gòu)域(模體),蛋白質(zhì)結(jié)構(gòu)域(模體),蛋白質(zhì)B也具也具有有Y結(jié)構(gòu)域(模體),因而蛋白質(zhì)結(jié)構(gòu)域(模體),因而蛋白質(zhì)B的功能也的功能也應(yīng)該與基因轉(zhuǎn)錄相關(guān)。應(yīng)該與基因轉(zhuǎn)錄相關(guān)。蛋白質(zhì)蛋白質(zhì)B 轉(zhuǎn)錄活性轉(zhuǎn)錄活性轉(zhuǎn)錄活性轉(zhuǎn)錄活性. 蛋白質(zhì)模體或結(jié)構(gòu)域在氨基酸序列水平比其他區(qū)蛋白質(zhì)模體或結(jié)構(gòu)域在氨基酸序列水平比其他區(qū)域保守,通過對序列比對可以發(fā)現(xiàn)這些在進化上域保守,通過
15、對序列比對可以發(fā)現(xiàn)這些在進化上較為保守的區(qū)域;較為保守的區(qū)域; 蛋白質(zhì)蛋白質(zhì)模體模體或結(jié)構(gòu)域通常與該蛋白質(zhì)的功能直接或結(jié)構(gòu)域通常與該蛋白質(zhì)的功能直接相關(guān);相關(guān); 根據(jù)模體或結(jié)構(gòu)域信息可以對同源水平較低的蛋根據(jù)模體或結(jié)構(gòu)域信息可以對同源水平較低的蛋白質(zhì)的進行功能預(yù)測。白質(zhì)的進行功能預(yù)測?;诮Y(jié)構(gòu)域(模體)的蛋白質(zhì)功能預(yù)測基于結(jié)構(gòu)域(模體)的蛋白質(zhì)功能預(yù)測.七七 蛋白質(zhì)序列分析蛋白質(zhì)序列分析 蛋白質(zhì)家族、結(jié)構(gòu)域、位點及功能分析蛋白質(zhì)家族、結(jié)構(gòu)域、位點及功能分析綠膿假單胞菌綠膿假單胞菌 RpsA 層粘連蛋白受體層粘連蛋白受體.蛋白質(zhì)序列分析,蛋白質(zhì)序列分析, 保守結(jié)構(gòu)域以及功能分析保守結(jié)構(gòu)域以及功能
16、分析RNA結(jié)合結(jié)構(gòu)域結(jié)合結(jié)構(gòu)域核酸結(jié)合核酸結(jié)合.七七 基于同源序列的蛋白質(zhì)功能預(yù)測基于同源序列的蛋白質(zhì)功能預(yù)測蛋白質(zhì)蛋白質(zhì)A具有轉(zhuǎn)錄功能,蛋白質(zhì)具有轉(zhuǎn)錄功能,蛋白質(zhì)B與與A在氨在氨基酸序列上相似(直系同源),因而蛋白基酸序列上相似(直系同源),因而蛋白質(zhì)質(zhì)B也具有轉(zhuǎn)錄功能。也具有轉(zhuǎn)錄功能。AB轉(zhuǎn)錄活性轉(zhuǎn)錄活性 轉(zhuǎn)錄活性轉(zhuǎn)錄活性蛋白質(zhì)蛋白質(zhì)A蛋白質(zhì)蛋白質(zhì)B.42 至少80個氨基酸長度范圍內(nèi)具有25%以上的序列一致性才提示可能的顯著性意義。未知功能序列對庫檢索的一般分析策略如下:和運行Blastp程序的服務(wù)器()連接; 將目的序列粘貼到序列輸入框中,選擇BLOSUM62記分矩陣運行BlastP程序
17、。NCBI的BlastP程序要求輸入格式為FASTA格式; 如果BlastP檢測到了高度同源的序列,將有可能提示目的序列的生物學(xué)功能七七 基于同源序列的蛋白質(zhì)功能預(yù)測基于同源序列的蛋白質(zhì)功能預(yù)測.序列相似性比較作為一個非常有效的工具用于同源序列相似性比較作為一個非常有效的工具用于同源基因的發(fā)現(xiàn)基因的發(fā)現(xiàn)基于序列同源的蛋白質(zhì)功能預(yù)測基于序列同源的蛋白質(zhì)功能預(yù)測.基于序列同源的蛋白質(zhì)功能預(yù)測基于序列同源的蛋白質(zhì)功能預(yù)測.45在uniprot數(shù)據(jù)庫中檢索人脂聯(lián)素 (adiponectin)蛋白質(zhì)序列;寫出檢索號。使用在線分析平臺ExPASy對上述蛋白質(zhì)序列進行分子質(zhì)量、氨基酸組成(protparam
18、)、和疏水性等基本性質(zhì)分析(protscale);寫出分子質(zhì)量是多少?氨基酸組成情況?哪個氨基酸所占比例最高?哪個最低?不穩(wěn)定系數(shù)是多少?根據(jù)該系數(shù)判斷,該蛋白質(zhì)穩(wěn)定嗎?帶正負電荷氨基酸個數(shù)分別是多少?疏水性分析結(jié)果如何?(截圖報道圖形結(jié)果,在圖中標(biāo)出疏水性高的位點三個,疏水性低的位點3個),并在文字結(jié)果中找到這些位點對應(yīng)的的氨基酸編號和類型(格式例如6號亮氨酸)。作作 業(yè)業(yè).46作 業(yè) 預(yù)測海參溶菌酶A0MT08的信號肽,并分析結(jié)果,指出信號肽位置。 預(yù)測P69332的亞細胞定位,并翻譯、分析、截取最終結(jié)果,指出該蛋白質(zhì)在那些位置表達。 預(yù)測P69332的跨膜區(qū),并分析預(yù)測結(jié)果,指出哪些區(qū)域是跨膜區(qū)。 使用COILS Server對對水稻瘤矮病毒RGDV P2蛋白卷曲螺旋預(yù)測分析,指出預(yù)測為卷曲螺旋的區(qū)域。.47作 業(yè) 利 用 I n t e r p r o s c a
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 管道工程行業(yè)自律與規(guī)范完善路徑探索與實施策略考核試卷
- 紡織面料鞋制造節(jié)能減排技術(shù)考核試卷
- 雙十一銷量增長秘籍
- 四川農(nóng)業(yè)大學(xué)《生物質(zhì)廢棄物資源化利用》2023-2024學(xué)年第二學(xué)期期末試卷
- 寧夏衛(wèi)生健康職業(yè)技術(shù)學(xué)院《圖形圖像處理技術(shù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 寧夏職業(yè)技術(shù)學(xué)院《生物工程概論》2023-2024學(xué)年第二學(xué)期期末試卷
- 天津市東麗區(qū)名校2025年初三第二次聯(lián)考考生物試題理試題含解析
- 昆明學(xué)院《生物工程與技術(shù)》2023-2024學(xué)年第二學(xué)期期末試卷
- 吉林省白城市一中2025屆高三第二學(xué)期調(diào)研考試(語文試題)試題含解析
- 2025年網(wǎng)絡(luò)工程師水平測試試卷及答案
- 2025-2030工程塑料行業(yè)市場深度分析及發(fā)展策略研究報告
- 2025-2030中國涂料設(shè)備行業(yè)市場發(fā)展趨勢與前景展望戰(zhàn)略研究報告
- 業(yè)務(wù)員合同范本與業(yè)務(wù)員和公司的合同6篇
- 2025年大學(xué)生學(xué)習(xí)鄉(xiāng)村振興知識競賽題庫及答案(共60道題)
- 2025年廣東廣州市高三二模高考英語試卷試題(含答案詳解)
- 期中考試質(zhì)量分析會上校長引用6個關(guān)鍵詞講話:深耕、融合、賦能、深耕、創(chuàng)新、協(xié)同、堅守
- 2025屆高三化學(xué)備考:山東高考模擬練習(xí)-工業(yè)流程61道
- 電網(wǎng)工程設(shè)備材料信息參考價(2024年第四季度)
- 碳中和技術(shù)概論全套教學(xué)課件
- 管道閥門安裝方案(共14頁)
- 采油工中級工更換潛油電泵井電流卡片
評論
0/150
提交評論