版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、文章編號:100021336(20020120081203利用SWISS 2PR OT 網(wǎng)獲取生物信息學資源劉樹春(中國醫(yī)科大學醫(yī)學信息學系,沈陽110001關(guān)鍵詞:生物信息學;蛋白質(zhì)序列;因特網(wǎng)中圖分類號:Q51收稿日期:2001210215作者簡介:劉樹春(1963,男,博士生。生物信息學是是采用數(shù)學、統(tǒng)計學和計算機方法對生物學數(shù)據(jù)信息進行采集、存儲、傳播、分析、歸類、解釋的科學1。Internet 網(wǎng)絡(luò)是信息傳輸、檢索、獲取、交流的重要手段。當前,在Internet 網(wǎng)上可以查詢到大量的生物信息學數(shù)據(jù)庫,其中SWISS 2PROT 蛋白質(zhì)序列數(shù)據(jù)庫是網(wǎng)上生物信息學最核心的3個數(shù)據(jù)庫之一。
2、通過該數(shù)據(jù)庫,可以較完整地獲得生物大分子的序列信息。同時,研究者也可以將測定的序列信息通過該數(shù)據(jù)庫予以認定、發(fā)表、交流。本文主要探討SWISS 2PROT 蛋白質(zhì)序列數(shù)據(jù)庫的特點、檢索方法及利用Internet 獲取蛋白質(zhì)序列信息。1.蛋白質(zhì)序列數(shù)據(jù)庫1.1SWISS 2PROT 蛋白質(zhì)序列數(shù)據(jù)庫SWISS 2PROT 是蛋白質(zhì)序列注釋性知識數(shù)據(jù)庫,創(chuàng)建于1986年,由瑞士生物信息學研究所(S wiss Institute for Bioinformatics ,SI B 和歐洲生物信息學研究所(European Bioin formatic Institute ,E BI 共同協(xié)作維護。該數(shù)
3、據(jù)庫到2001年末共收錄102708個序列數(shù)據(jù),包含37803202個氨基酸。在SWISS 2PROT 數(shù)據(jù)庫各種氨基酸的分布中,亮氨酸、丙氨酸、絲氨酸、甘氨酸、纈氨酸、谷氨酸占較高的比例,而組氨酸、半胱氨酸、苯丙氨酸等占的比例較小(表1。SWISS 2PROT 數(shù)據(jù)庫現(xiàn)有的序列數(shù)據(jù)涉及1202種期刊的92845篇文獻。被引用100篇文獻以上的期刊有91種,其中經(jīng)常被引用的前20種期刊(表2被引用次數(shù)皆在表1SWISS 2PROT 蛋白質(zhì)序列數(shù)據(jù)庫中各種氨基酸分布氨基酸%氨基酸%氨基酸%氨基酸%Ala7.62G ln 3.94Leu 9.54Ser 7.08Arg 5.19G lu 6.47L
4、ys 5.97Thr 5.57Asn 4.35G ly 6.85M et 2.36T rp 1.21Asp 5.25His 2.25Phe 4.10T yr 3.16Cys1.62Ile 5.85Pro 4.89Val6.61表2SWISS 2PROT 蛋白質(zhì)序列數(shù)據(jù)庫引用文獻來源期刊分布N o.期刊名稱被引用文獻(篇%1J of Biol Chem81258.752Proc Natl Acad Sci US A 4659 5.023Nucleic Acids Res 3560 3.834J Bacteriology 3320 3.585G ene3163 3.416FE BS Lett250
5、2 2.697Biochem Bioph Res C ommun 2316 2.498Eur J Biochem 2274 2.459Biochem istry 2164 2.3310E M BO J 2006 2.1611Nature1914 2.0612Biochim Bioph Acta 1846 1.9913J M ol Biol 1692 1.8214Cell1528 1.6515G enom ics 1487 1.6016M ol Cell Biol 1439 1.5517Biochem J1112 1.2018M ol G ene G ene 1087 1.1719Plant M
6、 ole Biol 1081 1.1620Science10391.121000次以上,合計貢獻文獻48314篇,占總被引用文獻數(shù)的52.04%,說明這些期刊是發(fā)表蛋白質(zhì)序列相關(guān)信息的主要文獻源。1.2SWISS 2PROT 數(shù)據(jù)庫的特點(1可提供蛋白質(zhì)序列的詳盡注釋信息序列注釋包括蛋白質(zhì)功能、蛋白質(zhì)翻譯后修飾、結(jié)構(gòu)域和結(jié)合位點、二級結(jié)構(gòu)、四級結(jié)構(gòu)、蛋白質(zhì)缺陷相關(guān)疾病等信息。(2避免過多的重復(fù)在SWISS 2PROT 中,盡量避免過多的重復(fù)。對同種蛋白質(zhì)的多個記錄進行仔細比較后歸結(jié)到一個記錄內(nèi),方便了用戶檢索利用。表3SWISS2PROT記錄字段及含義縮寫全稱含義縮寫全稱含義ID Identi
7、fication標識號RC Reference comments參考文獻評注AC Accession Number登記號RX Cross2references交叉參考DT Date創(chuàng)建日期RA Reference authors文獻著者DE Description名稱R L Reference location文獻出處G N G ene name(s基因名稱CC C omments or notes評注或注釋OS Organism species來源物種DR Database cross2references數(shù)據(jù)庫參見OG Organelle來源細胞器K W K eyw ords關(guān)鍵詞OC O
8、rganism classification物種分類FT Feature table data特征數(shù)據(jù)列表RN Reference number參考文獻序號S Q Sequence header序列題頭RP Reference position參考文獻內(nèi)容/T erm ination line結(jié)束符(3與其他數(shù)據(jù)庫交叉參考一次檢索可同時獲得蛋白質(zhì)的各方面資料信息。(4記錄顯示格式規(guī)范字段名運用兩位字母代碼表示。代碼具體含義(表3。1.3T rE M BL蛋白質(zhì)序列數(shù)據(jù)庫T rE M2 BL是計算機注釋的蛋白質(zhì)序列數(shù)據(jù)庫,是SWISS2PROT蛋白質(zhì)序列數(shù)據(jù)庫的輔助數(shù)據(jù)庫,其包含尚未結(jié)合到SWI
9、SS2PROT數(shù)據(jù)庫的E M BL核酸序列數(shù)據(jù)庫中所有編碼序列(C DS的翻譯內(nèi)容。T rE M BL可作為SWISS2 PROT的初級部分,它也是加速注釋升級以達到SWISS2PROT質(zhì)量標準的重要處理過程。SWISS2PROT和T rE M BL記錄的一般結(jié)構(gòu)是一致的,檢索方式也相同。二者的主要區(qū)別在于T rE M BL的數(shù)據(jù)分類總是標明“Prelimi2 nary(初級”,而SWISS2PROT數(shù)據(jù)標明“Stan2 dard(標準”。2.SWISS2PR OT/T rEMB L數(shù)據(jù)庫的檢索Web上有多個站點可進入并檢索該數(shù)據(jù)庫。其主要站點有蛋白質(zhì)分析專家系統(tǒng)(Ex2 PASy分子生物學網(wǎng)
10、站(http:/w w w.expasy. ch/sprot/和歐洲生物信息學研究所(E BI網(wǎng)站(http:/w w w.ebi.ac.uk/swissprot/等。通過ExPASy網(wǎng)站可鏈接到國際上包括SWISS2PROT、T rE M BL、PROSITE、E NZY ME等數(shù)據(jù)庫的有關(guān)蛋白質(zhì)、核酸、基因組序列、結(jié)構(gòu)與功能的1000多個站點。該網(wǎng)站在瑞士、澳大利亞等國家和地區(qū)設(shè)立了鏡像站點, 2000年起在中國的北京大學也設(shè)立了鏡像站點,網(wǎng)址是/。2.1SWISS2PROT/T rE M BL的常規(guī)檢索途徑進入ExPASy網(wǎng)站上的SWISS2PROT
11、/ T rE M BL首頁,在檢索窗口內(nèi)輸入檢索詞進行一般性檢索(Quick Search。這些檢索詞可以是:登記號(AC、標識號(I D、序列描述內(nèi)容(Description、基因名稱(G ene name、物種名稱(Organism等字段中的詞匯。通過首頁的上的“Access to SWISS2PROT and T rE M BL”欄目可從以下幾種途徑進行檢索:(1全文搜索(Fulltext Search通過點擊“Fulltext Search”鏈接到全文搜索界面。在檢索窗口內(nèi),可以輸入:AC、I D、DE、G N、OS、OC、RX、RC、RA、R L、CC、DR、K W、FT字段中的任意
12、詞。輸入的檢索詞應(yīng)區(qū)分大小寫。如果選定檢索窗口下方的“Prefix and append wildcard 3to w ords”(前綴及詞上添加通配符3復(fù)選框,還可以將輸入的檢索詞作為前綴或詞的一部分進行擴展檢索。當同時輸入多個檢索詞時,則可利用邏輯運算符(AND,OR, NOT及大括號“”、“”來限定檢索。例如:“coli ANDatpase OR atp synthetase”,該檢索式可獲得包含“coli”,同時還包含“atpase”或“atp synthetase”的記錄。(2登記號或標識號(AC或I D途徑檢索進入登記號檢索界面后,可在檢索窗口內(nèi)輸入登記號或標識號進行檢索。如:P0
13、4406, G3P2-H UMAN。但需注意,每次只能輸入一個登記號或標識號。(3序列描述或標識(DE或I D檢索在此檢索界面可在檢索窗口內(nèi)輸入SWISS2PROT 或T rE M BL數(shù)據(jù)庫中DE、OS、OG、G N或I D字段中的任意詞進行檢索。(4著者(Author檢索可在檢索窗口內(nèi)輸入著者姓名全稱或姓名的一部分。名字縮寫后需加“.”。例如:BAIROCH、H ochstrasser D.F.。在輸入著者姓名時,也可以利用通配符“3”代表多個字母,利用“?”代表任意一個字母。例如:可利用“Craw for3”或“Craw?ord”檢索“Craw ford”為作者的記錄。(5文獻源(Cit
14、ation檢索此途徑只可以檢索SWISS2PROT數(shù)據(jù)庫而不能檢索T rE M BL 數(shù)據(jù)庫。用戶可以在相應(yīng)的檢索窗口內(nèi)輸入期刊全名或刊名縮寫、期刊的出版年、卷號(后兩者可選等,從發(fā)表文獻的期刊的角度檢索。2.2SRS序列檢索系統(tǒng)通過點擊在Ex2 PASy的SWISS2PROT數(shù)據(jù)庫網(wǎng)頁下方的SRS 鏈接進入建立在Web上的SRS序列檢索系統(tǒng)。在SRS頁面上,點擊“Start”按鈕進入選擇ExPASy數(shù)據(jù)庫網(wǎng)頁。ExPASy網(wǎng)站上的所有數(shù)據(jù)庫均可通過該網(wǎng)站的SRS檢索系統(tǒng)進行檢索。SRS的大多數(shù)界面上方有6個按鈕,包括“T op Page”、“Query F orm”、“Query Manag
15、er”、“View Manag2 er”、“Databanks”及“Help”?!癟 op Page”用于選擇數(shù)據(jù)庫,一次可選擇;“Query F orm”為檢索界面,通過在檢索窗口內(nèi)輸入檢索詞,進入檢索;“Query Manager”有兩個功能,其一為存儲檢索史,其二是做進一步檢索或?qū)崿F(xiàn)鏈接;“View Manager”可以定義檢索結(jié)構(gòu)的閱讀方式;“Databanks”網(wǎng)頁上以圖表的方式列出了可提供服務(wù)的數(shù)據(jù)庫,并標明版次、數(shù)據(jù)記錄數(shù)量、索及日期、分組等信息;“Help”提供數(shù)據(jù)庫、字段等各種幫助信息。3.檢索結(jié)果的顯示與輸出在檢索窗口內(nèi)輸入檢索詞并執(zhí)行數(shù)據(jù)庫檢索后,可顯示出符合檢索條件的記
16、錄列表。選擇需要瀏覽詳細資料的記錄,進入記錄的詳細顯示界面。在結(jié)果顯示的詳細界面中,最初為NiceProt顯示方式,內(nèi)容包括:一般信息(記錄名、登記號等、名稱及來源(蛋白質(zhì)名稱等、PubMed文獻信息、評論、交叉檢索、關(guān)鍵詞、特性、序列信息等。也可以對SWISS2PROT顯示格式進行選擇。此外,通過點擊“Quick Blastp search”可進入SI B的BLAST網(wǎng)絡(luò)服務(wù)系統(tǒng),對序列進行相似性比較。4.SWISS2PR OT序列數(shù)據(jù)上傳研究者可將被直接測序的肽鏈序列數(shù)據(jù)上傳至E BI的SWISS2PROT數(shù)據(jù)庫。該數(shù)據(jù)庫將為這些序列提供登記號。上傳序列數(shù)據(jù)表格可在E BI網(wǎng)站(http:
17、/w w w.ebi.ac.uk/2 sp/sub.form獲得。表格填寫后,將其發(fā)至datasubsebi.ac.uk。在7個工作日內(nèi)將收到結(jié)果信息,告知著者所呈報的序列被賦予的登記號或所需要進一步提供的信息。呈報的蛋白質(zhì)序列數(shù)據(jù)還與德國的MIPS(Martin2 sried蛋白質(zhì)序列數(shù)據(jù)研究所及美國的NBRF2PIR(國家生物醫(yī)學研究基金會蛋白質(zhì)鑒定資源等數(shù)據(jù)庫共享。參考文獻1蕭浪濤.湖南農(nóng)業(yè)大學學報(自然科學版,2000,26(6:405410第六屆細胞信號轉(zhuǎn)導(dǎo)專題學術(shù)討論會經(jīng)細胞生物學會細胞信號轉(zhuǎn)導(dǎo)專業(yè)委員會主持召開首次籌備會(武漢,2001年5月19日討論決定,原“鈣與細胞功能暨細胞信號轉(zhuǎn)導(dǎo)專題學術(shù)討論會”改名為“細胞信號轉(zhuǎn)導(dǎo)專題學術(shù)討論會”,屆時將請多名國內(nèi)外知名教授作報告。會議歡迎跨學科(物理、化學等專業(yè)專家、研究生參加。本會第六屆會議將于2002年10月在武漢召開,主辦單位為武漢大學生命科學學院,會議名譽主席為該學院楊弘遠院士。會議主題內(nèi)容為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年無機膠粘劑項目投資申請報告代可行性研究報告
- 銀行信息系統(tǒng)開發(fā)與維護制度
- 銀行合規(guī)管理制度執(zhí)行
- 酒店餐飲服務(wù)規(guī)范與顧客滿意度提升措施制度
- 光學復(fù)習(浙教版)-課件
- 《證券業(yè)務(wù)之律師》課件
- 陜西省咸陽市三原縣2023-2024學年九年級上學期期末考試數(shù)學試卷(含答案)
- 保單年檢對客戶的意義-中國平安人壽保險公司萬能保險產(chǎn)品學習早會分享培訓(xùn)模板課件演示文檔幻燈片資料
- 古詩詞誦讀《無衣》課件 2024-2025學年統(tǒng)編版高中語文選擇性必修上冊
- 2025屆福建省廈門湖濱中學高三第四次模擬考試數(shù)學試卷含解析
- 集成電路制造工藝 課件 6光刻工藝2
- 建筑邊坡工程施工質(zhì)量驗收標準
- 2020海灣JTW-LD-GST85B纜式線型感溫火災(zāi)探測器
- 微測網(wǎng)題庫完整版行測
- 2024中華人民共和國農(nóng)村集體經(jīng)濟組織法詳細解讀課件
- 2024年貴州省中考理科綜合試卷(含答案)
- 2024應(yīng)急管理部國家自然災(zāi)害防治研究院公開招聘34人(高頻重點提升專題訓(xùn)練)共500題附帶答案詳解
- 2002版《水利工程施工機械臺時費定額》
- 創(chuàng)意思維與演講口才智慧樹知到期末考試答案章節(jié)答案2024年宜賓學院
- 當代大學生對馬克思主義的態(tài)度及認知程度實踐調(diào)查分析報告
- 俄語入門智慧樹知到期末考試答案章節(jié)答案2024年吉林師范大學
評論
0/150
提交評論