簡單使用說明_第1頁
簡單使用說明_第2頁
簡單使用說明_第3頁
簡單使用說明_第4頁
簡單使用說明_第5頁
已閱讀5頁,還剩8頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、ANTHEPROT 5.0簡單使用說明生物技術 2002 房磊 021402144生物的化學,就是蛋白質與核酸的化學.對蛋白質的研究是生物化學領域一 個非常重要的局部.但是眾多蛋白質的復雜序列數(shù)據(jù),其分析工作是一個非常困 難的工作.用人工的方法是很難完成如此大量的分析工作的.運用計算機,利用一定的運算規(guī)那么,對眾多的蛋白質序列數(shù)據(jù),進行蛋白序列分析就是最好的解決 方法.蛋白序列分析軟件包ANTHEPROT 5.0正是這樣的一個程序包.蛋白序列分析軟件包ANTHEPROT 5.0是法國的蛋白質生物與化學研究院(Institute of Biology and Chemistry of Prote

2、ins)開發(fā)的蛋白質研究軟件包.軟件 包包括了蛋白質研究領域所包括的大多數(shù)內容,功能非常強大.應用此軟件包, 使用個人電腦,便能進行各種蛋白序列分析與特性預測.包括:進行蛋白序列二級結構預測;在蛋白序列中查找符合 PROSITES數(shù)據(jù)庫的特征序列;繪制出蛋 白序列的所有理化特性曲線;在Internet或本地蛋白序列數(shù)據(jù)庫中查找類似序 列;計算蛋白序列分子量,比重與各蛋白殘基百分組成;計算蛋白序列滴定曲線 與等電點;選定一個片段后,繪制 Helical Wheel圖;進行點陣圖(Dot Plot ) 分析;計算信號肽潛在的斷裂位點等功能.更重要的是此軟件包為免費軟件.軟件分為三個版本,分別用于U

3、nix系統(tǒng),DOS系統(tǒng)與 WINDOWS95或98 系統(tǒng),以用于WINDOWS系統(tǒng)的版本為例,介紹一下這個軟件的根本用法.軟件包為一個自解壓執(zhí)行文件,文件名Anthe_5_0.exe,大小為2,013,184字節(jié).執(zhí)行此文件,輸入解壓后存放的目錄名,便可將所有文件解壓在此目錄下.其文件如下列圖nCLJEVU. EXEn 1CUErXLV . rHDULQG.ROK PDBCLZEVlLVD電上包 any1Dili. DAY國臉I(yè)ATA.DhR回過假巨 wDili, lit DAllDOrr IEFAUU DASDuui/.'bn 概畫畫AT兒 QFRZij-Tn G1E回7AS7A.m

4、 Thd皿 t MOROI MOMOL. E!tl «A. IME回rznrriLE.iiiiEtr.痛國國國THIEM. VEX VBSUK300. . . ¥1»31 vMn 畫KDCHER.E 犯BfST.KS05t_ricie. cat軟件運行后的主程序中按鈕是極其簡單的相關介紹,根本無任何用doc ant. ex:e處.但是在軟件目錄中的自解壓壓縮文件doc ant.exe文件壓在另一個目錄,是 HTML格式的介紹文件,對軟件進行了一些較詳細說明介 紹.如圖色 ©蜀日 目 可可藺 isugssib. Acjn<vld> Pn i_i

5、uQ,JFG Ui 曲qg中*, Rigjm 曲liinar-1P Ali?Ui qnc江蜀蜀山眄也,Alifui;江.劇匐AuLhepr >. Anli&ciu.B '&£.一m蜀qioUcoLjIfr dot_natr.(kt_pLot.O_icombinel.Gnlifcm.蜀COn5eJLSX 一0io2 thl. ere11 jcmentti6_entkqi>t html蜀N qDFHjiiEth . HPijiTa . DPUjroE.a式Lit gi feJilor jpg回囿 目Ie市il icc. Fasts IlLtiI fa5

6、ta JPG 7口1運行 Documentation_antheprot.html主程序名為Anthewin,即可.B acujueiitati iik_arithejK6 t ktml雙擊便翻開了ANTHEPROT 5.0主窗口.也可以在桌面上建立它的快捷方式,雙擊快捷方式運行ANTHEPROT 5.0 主程序.通過主程序,我們可以載入蛋白序列,對序列進行編輯、打印、拷貝、改變設定等操作,可以在此調用各種所需的分析工具,對蛋白序列進行分析.序列編輯功能ANTHEPROT 5.0的主窗口便是其序列編輯窗口,如圖3刖 L S4;ilxZi££E電 LUfifU可以使用回按鍵或

7、菜單中的或快捷鍵Ctrl+0命令翻開各種序列文件其他按鈕在后面說明,程序識別的文件類型包括:單序列文件格式:*.SEQ, ANTHEPROT 3.3支持以下格式的單序列文件: DNA/Strider 格式、EMBL 格式、NBRF 格式、Pearson/Fast附式、PIR 格式與 IG/Stanford 格式;含有多個蛋白序列的蛋白數(shù)據(jù)庫文件:*.BAS,以Pearson/Fast潞式添加序 列,上限為30條序列或32K文件大?。籆lustalV或ClustalW 文件:*.ALN 含有ClustalW 格式的多隊列;含有多隊列的 Multalin 4.1格式文件:*.MUL ;在Prosi

8、te蛋白數(shù)據(jù)庫中查尋出Site結果的文件:*.SIT,蛋白質原子空間結構的PDB格式文件:*.PDB ;使用舊CP 效勞器預測蛋白二級結構所獲得的結果文件格式:*.CNS;序列可以從ANTHEPROT編輯窗口以鍵盤輸入,或者以*.SEQ等文件格式 載入,也可以從其它文件復制粘貼到編輯窗口.最簡單的序列格式為 Pearson/Fasta格式,為文本格式文件,帶有 >開始的為序列蛋白的名稱,其后便 是蛋白序列.下面為一個此格式的例子:>MBNVLSEGEWQLVLHVWAKVEADV AGHGQDILIRLFKSHPETLEKFDRFKHLKTEAEMKASEDLKKHGVTVLTAL

9、GAILKKKGHHEAELKPLAQSHA TKHKIPIKYLEFISEAIIHVLHSRHPGDFGADAQGAMNKALELFRKDIAAKYKELGYQG程序支持的一些編輯功能如下:取消,恢復(Undo): Ctrl+Z.查找 Ctrl+T.支持復制與粘貼.可以自定義字符顏色,背景色與打印字體.可打印序列文件.輸入或載入序列后,便同時翻開了一個圖像窗口,以彩圖的形式顯示出蛋 白序列.不同的蛋白殘基以不同的顏色表示. 下面便是翻開一個序列后的主程序窗口的例子:.工具欄與根本功能當序列格式識別后,Methods菜單便被激活,相應的快捷按鍵也出現(xiàn)在工具欄中.如果序列格式未能識別那么不會出現(xiàn)

10、下列圖中新的工具按鈕.waw圜 Mm as© 凹區(qū)1回回這些按鍵依次為:翻開文件按鍵存儲文件按鍵打印按鍵更改字體與格式按鍵更改設定顏色按鍵進行蛋白序列二級結構預測在蛋白序列中查找符合PROSITES數(shù)據(jù)庫的特征序列繪制出蛋白序列的所有理化特性曲線在Internet或本地蛋白序列數(shù)據(jù)庫中查找類似序列計算蛋白序列分子量,比重與各蛋白殘基百分組成計算蛋白序列滴定曲線與等電點選定一個片段后,繪制 Helical Wheel圖進行點陣圖Dot Plot分析父J計算信號肽潛在的斷裂位點因;打一個簡單的幫助文件 國;退出程序 三.根本分析工具介紹除了通過單擊快捷按鍵的方式進行各種蛋白序列分析,通過

11、菜單進行各種 操作也非常方便.下面讓我將一些主要分析工具的功能介紹一下:1 .點陣圖Dot Plot Dot Plot分析方法對以下分析工作非常有用:在一條序列內查找重復序列;在2條序列中不同位置查找類似片段;在不同序列中查找同源性.只有當程序載入一條序列時,才可以激活Dot Plot程序,選擇菜單命令Dot Plot或單擊按鍵 EEI ,運行Dot Plot程序,可再選擇要進行比擬的第二條序列.然后,再確定參數(shù)與限制條件,包括:窗口尺寸:移動片段的長度矩陣:選擇替代矩陣下列圖為含有兩個蛋白酶序列的點陣圖,兩個酶具有同源性,由于由點陣圖 可以看到,根本上有非常好的斜線.但由于此斜線的位置開始于

12、位置115,很容易知道,水平軸的蛋白序列含有前體由 1到第114個殘基組成,也清楚地看 到,它們具有一個小的內部重復片段圖上非常短的紅線.X. 152 PRJ01EINYYIlTfiGMC TDCATTWWOSHRTTT: 36 PMa_SMl1UTAGHCTKISRSWSIGTJITGT2 .類似性查找Similarity Search 此程序用來在一個蛋白數(shù)據(jù)庫可以是本地數(shù)據(jù)庫,也可是網(wǎng)上的數(shù)據(jù)庫 中,找出所有與給定序列具有同源性的序列.選擇菜單命令 Methods/Similarity Search/ Local Fasta或者 Methods/Similarity Search/ at

13、 PBIL NPS server便實現(xiàn)在蛋白數(shù)據(jù)庫中對類似性蛋白序列的查找.需注意,如果在本地蛋白數(shù)據(jù)庫中查找,需要先下載SwissProt蛋白質數(shù)據(jù)庫.Prosite蛋白數(shù)據(jù)庫1.4兆與Swiss-Prot蛋白數(shù)據(jù)庫41版,85.7兆左右,壓縮 格式下載后,將其放置在 ANTHEPROT 5.0同一個目錄,便可在本地使用程序的檢索功能.3.查找 Site/signature在 ANTHEPROT 主窗口單擊按鍵或選取菜單命令Methods / Sitedetection Prosite,便進行位點與特征序列的查找.程序查找給定序列是否存在 PROSITE數(shù)據(jù)庫中已定義的特征序列,缺省設置為1

14、00%匹配,也可設定為Mismatch 1 or 2一到兩個不匹配或者Similarity level 類似水平.當前PROSITE 數(shù)據(jù)庫是95年2月發(fā)布的,共1054個不同位點與特征序列,含有兩個文件, PROSITE.DAT與PROSITE.DOC.止匕兩個文件必需均放在 ANTHEPROT程序的目錄下,程序才能進行.下列圖為查找結束后程序輸出的結果:/ 9 O 7 7 2-70 J4 d 54二22S O4- 4 S綠色的文字可連接到PROSITE文件中相應的位置GQKVTE01b與er礪t fxetfuercy : 1. 14EOUSGSFEAAObsecrTed £xeq

15、uen=:y : 2 . 9:E一口.弓GILLEF OLiiar utsd £ii=jiienz:i/ . 1.0 2E0 0 SATFGTP-bifiding cite >ntif & (P-loop) PS00017 «3-s(4)-GkK-(STTheoretical trequencv; 1 O9E-0Q4Site ,165 to 176 GDRQTGKT Observed frequency. 2 42E-O0SiTP syzi t base mJ. ph. an_d beta sub units is i. qum t uxeDO 1 E 2P-

16、SAFJ-:工V-K(3J-S-X-STheorstic»l f renusncs?' F 7DE-007Site :366 to 375PAOFGISTS Otserved fxe4uenc75.ZOE-O 36El .=i-ppi-|searchirg time,g 1286245網(wǎng)口9K4 Sec.需要知道的是,蛋白序列中找到的特征序列并不一定具有生物學意義,只 能說,查找的結果對尋找潛在的有意義片段具有很大幫助.4.在序列數(shù)據(jù)庫中查找一個自定義的特征序列:Pattern search選擇菜單命令Databases/Patternsearch,便開始在網(wǎng)上的蛋白數(shù)據(jù)庫或

17、本地 蛋白數(shù)據(jù)庫中查找含有自定義特征序列的蛋白.所定義的特征序列必需符合 PROSITE規(guī)定的語法.語法規(guī)那么如下:- 位置分隔符;- 允許此位置為括號內的任何一個殘基;- )允許此位置為除了括號內所包括的任何一個殘基;- x代表任何殘基;- x(3)代表任何3個氨基酸殘基,根據(jù)以上語法,如果要查找的特征序列為 N-PT-GM-x(2)-ILVM,那么序 列 N-P-K-G-H-V, N-T-L-K-G-M 將能夠找到,而序列 N-L-K-G-H-V , N-T-G-K-H-V 將不能找到.查找結束后,所有找到的序列將以 Pearson格式,以SEQ_x.BAS 為文件名存儲在硬盤中.5 .預

18、測物理化學特性曲線Antheprot可以以圖示的方法,顯示出預測的蛋白質的物理化學特性曲線, 下列圖為一個親水性特性曲線的例子. 在圖中,一個可移動的光標,顯示了目前在 序列中的位置為115,此位置的氨基酸殘基(L)顯示為紅色,同時顯示前 5個 與后五個殘基(為AIIHVLHSRHP ),特性值(-7)與參數(shù)(5)也顯示在圖中.光標可以如下方式移動:鼠標左鍵在選定位置單擊;方向鍵左或右為每次移動一個位置;Shift+方向鍵左或右為每次移動十個位置;方向鍵上或下為放大縮小.可顯示的物理化學特性曲線包括:親水曲線(Hydrophobicity profile )疏水曲線(Hydrophilicit

19、y profile )易溶性曲線(Solvent accessibility profile)抗原性曲線(Antigenicity profile )跨膜區(qū)域曲線(transmembranous regions profile結合抗原性曲線( Combined antigenicity profile)6 .二級結構預測Antheprot提供了幾種方法進行蛋白質二級結構預測,包括:GOR I 方法:在菜單中選擇 Method/Secondary structure prediction/Garnier et alGibrat 方法:在菜單中選擇 Method/Secondary structu

20、re prediction/Gibrat et alDouble Prediction Method - DPM 方法:在菜單中選擇 Method/Secondarystructure prediction/DPMHomologue 方法: 在菜單 中選擇 Method/Secondary structure prediction/LevinPredator 方法:在菜單中選擇 Method/Secondary structure prediction/Predator,或全部使用以上幾種方法:單擊四 按鍵或在菜單中選擇Method/Secondary structure prediction

21、/All,其快捷鍵為 Ctrl+L.五種方法的輸出形式分別舉例如下:GOR I萬法Gibrat方法Homologue 方法Predator 方法FJU D-FSGK S3 GG7 品目舊 TIKE1 CCCCC B.&ll AlilLiCZ tUTOtobll LW (Xl DOCS MH全部使用以上幾種方法的輸出形式為上圖中參加了自定義的由X射線衍射法確定的二級結構圖,可以顯示在一N* AA: KSHPE LEKFDState GOR I method:CCCC HHHHH> |DPM methodIHHHH HHHHHUGib聞 methodICCCC1 HHHHljIHom

22、ologue methodJCGCC HHHHC XR ay methodIHCHHE1HHTCH I 0100個窗口,與其它預測的二級結構相比擬.自定義的二級結構由以 *.XRA為擴展 名的文件輸入.其格式為Pearson/Fast故件格式,下面是一個*.xra文件的例子,>MyoglobinCCCHHHHHHHHHHHHHHTTSHHHHHHHHHHHHHHHCHHHHHTCHHHHTCCSHHHHHHCHHHHHHHHHHHHHHHHHHTTTTCCHHHHHHHHHHHHHTTCCCHHHHHHHHHHHHHHHHHHCTTTTSHHHHHHHHHHHHHHHHHHHHHHHHH

23、TCCCH代表螺旋,圖中表小為藍色;E代表折疊,圖中表示為橙色;T代表轉角,圖中表示為綠色;C代表其它松散結構,圖中表示為黑色.7 .計算蛋白序列分子量,比容與各蛋白殘基百分組成的計算.單擊程序可以非常方便地對蛋白序列進行分子量,比容與各蛋白殘基百分組成 按鍵或選取 Methods/AA Composition, specific volume, M.Weight便進行計算.快捷鍵為Ctrl+M輸出形式如下:8 .計算蛋白序列滴定曲線與等電點ANTHEPRO5.0還可根據(jù)一定算法,對輸入的蛋白序列計算其滴定曲線與等電點圖aCtrl+U .單擊按鍵或選取Methods/Titration curve便可進行計算,快捷鍵為 輸出圖形如上圖a9 .選定一個片段后,繪制Helical Wheel圖HelicalANTHEPRO4.3還可先選定一個蛋白片段,繪制其 Helical Wheel圖.單擊 按鍵或選取Methods/ Helica

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論