




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第二章第二章 生物信息數(shù)據(jù)庫生物信息數(shù)據(jù)庫1、模式生物、模式生物2、數(shù)據(jù)庫、數(shù)據(jù)庫第二節(jié)第二節(jié) 數(shù)據(jù)庫數(shù)據(jù)庫生物分子數(shù)據(jù)生物分子數(shù)據(jù)高速增長高速增長 分子生物學分子生物學及相關(guān)領(lǐng)域研究人員及相關(guān)領(lǐng)域研究人員迅速獲得最新實驗數(shù)據(jù)迅速獲得最新實驗數(shù)據(jù) 建立生物分子數(shù)據(jù)庫建立生物分子數(shù)據(jù)庫 (1)數(shù)據(jù)庫的更新速度不斷加快)數(shù)據(jù)庫的更新速度不斷加快 數(shù)據(jù)量呈指數(shù)增長趨勢數(shù)據(jù)量呈指數(shù)增長趨勢 (2)數(shù)據(jù)庫使用頻率增長更快)數(shù)據(jù)庫使用頻率增長更快 (3)數(shù)據(jù)庫的復雜程度不斷增加)數(shù)據(jù)庫的復雜程度不斷增加 (4)數(shù)據(jù)庫網(wǎng)絡化)數(shù)據(jù)庫網(wǎng)絡化 (5)面向應用)面向應用(6)先進的軟硬件配置)先進的軟硬件配置 分
2、子生物信息數(shù)據(jù)庫種類繁多。歸納起來,大體可以分為4個大類,即基因組數(shù)據(jù)庫、核酸和蛋白質(zhì)一級結(jié)構(gòu)數(shù)據(jù)庫、生物大分子(主要是蛋白質(zhì))三維空間結(jié)構(gòu)數(shù)據(jù)庫,以及由上述3類數(shù)據(jù)庫和文獻資料為基礎(chǔ)構(gòu)建的二次數(shù)據(jù)庫。 通常分法:序列數(shù)據(jù)庫序列數(shù)據(jù)庫 結(jié)構(gòu)數(shù)據(jù)庫結(jié)構(gòu)數(shù)據(jù)庫生物信息生物信息 學數(shù)據(jù)庫學數(shù)據(jù)庫 工具工具 染色體染色體核酸核酸蛋白質(zhì)蛋白質(zhì)基因組圖譜基因組圖譜DNA序列序列蛋白質(zhì)序列蛋白質(zhì)序列蛋白質(zhì)結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu)基因組基因組數(shù)據(jù)庫數(shù)據(jù)庫核酸序列核酸序列數(shù)據(jù)庫數(shù)據(jù)庫蛋白質(zhì)序列蛋白質(zhì)序列數(shù)據(jù)庫數(shù)據(jù)庫蛋白質(zhì)結(jié)構(gòu)蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫數(shù)據(jù)庫二級數(shù)據(jù)庫二級數(shù)據(jù)庫 復合數(shù)據(jù)庫復合數(shù)據(jù)庫基因組作圖基因組作圖序列測定序列測
3、定結(jié)構(gòu)測定結(jié)構(gòu)測定國際著名的生物信息中心 NCBI National Center for Biotechnology Information (US) EBI European Bioinformatics Institute (EU) HGMP Human Genome Mapping Project Resource Centre (UK) ExPASy Expert of Protein Analysis System (Switzerland ) CMBI Centre of Molecular and Biomolecule (The Netherlands) ANGIS Nati
4、onal Genome Information Service (Australia) NIG National Institute of Genetics (Japan) BIC National Bioinformatics Centre (Singapore)國內(nèi)生物信息資源 北大生物信息中心 中科院上海生物信息中心 華大基因 國家人類基因組北方研究中心 博奧芯片 國際上權(quán)威的核酸序列數(shù)據(jù)庫國際上權(quán)威的核酸序列數(shù)據(jù)庫 (1)歐洲分子生物學實驗室的EMBL http:/www.embl-heidelberg.de (2)美國生物技術(shù)信息中心的GenBank http:/www.ncbi.n
5、/Web/Genbank/index.html (3)日本遺傳研究所的DDBJ http:/www.ddbj.nig.ac.jp/GenBankDDBJEMBL 三個數(shù)據(jù)庫中的數(shù)據(jù)基本一致,僅在三個數(shù)據(jù)庫中的數(shù)據(jù)基本一致,僅在數(shù)據(jù)格式上有所差別,對于特定的查詢,數(shù)據(jù)格式上有所差別,對于特定的查詢,三個數(shù)據(jù)庫的響應結(jié)果一樣。三個數(shù)據(jù)庫的響應結(jié)果一樣。 這三個數(shù)據(jù)庫是綜合性的這三個數(shù)據(jù)庫是綜合性的DNADNA和和RNARNA序序列數(shù)據(jù)庫,每條記錄代表一個單獨、連列數(shù)據(jù)庫,每條記錄代表一個單獨、連續(xù)、附有注釋的續(xù)、附有注釋的DNADNA或或RNARNA片段。片段。美國的核酸數(shù)據(jù)庫
6、美國的核酸數(shù)據(jù)庫GenBankBanson,D.A. et al. (1998) Nucleic Acids Res. 26, 1-7從從1979年開始建設(shè),年開始建設(shè),1982年正式運行;年正式運行;NCBI下子數(shù)據(jù)庫下子數(shù)據(jù)庫 歐洲分子生物學實驗室的歐洲分子生物學實驗室的EMBL數(shù)據(jù)庫也于數(shù)據(jù)庫也于1982年開始服務年開始服務日本于日本于1984年開始建立國家級的核酸數(shù)年開始建立國家級的核酸數(shù)據(jù)庫據(jù)庫DDBJ,并于,并于1987年正式服務。年正式服務。一、GenBank數(shù)據(jù)庫 GenBank(/genbank/)是一個綜合數(shù)據(jù)庫,該數(shù)據(jù)庫
7、中包含了已是一個綜合數(shù)據(jù)庫,該數(shù)據(jù)庫中包含了已經(jīng)公開的經(jīng)公開的30萬余種不同物種生物的核酸序萬余種不同物種生物的核酸序列,這些數(shù)據(jù)主要來源于全世界不同實驗列,這些數(shù)據(jù)主要來源于全世界不同實驗室和大規(guī)模測序計劃項目。室和大規(guī)模測序計劃項目。 GenBank是具有目錄和生物學注釋的核酸序列綜是具有目錄和生物學注釋的核酸序列綜合數(shù)據(jù)庫,由美國國家醫(yī)學圖書館的國家生物技術(shù)合數(shù)據(jù)庫,由美國國家醫(yī)學圖書館的國家生物技術(shù)信息中心構(gòu)建、維護和管理。該中心位于美國馬里信息中心構(gòu)建、維護和管理。該中心位于美國馬里蘭國家健康研究所(蘭國家健康研究所(NIH)。)。GenBank數(shù)據(jù)庫的序數(shù)據(jù)庫的序列數(shù)據(jù)來源于序列發(fā)
8、現(xiàn)者提交的序列、批量提交的列數(shù)據(jù)來源于序列發(fā)現(xiàn)者提交的序列、批量提交的表達序列標簽(表達序列標簽(expressed sequence tag, EST)、)、基因組測序序列(基因組測序序列(genome survey sequence, GSS)和其他測序中心提供的高通量數(shù)據(jù),還包括)和其他測序中心提供的高通量數(shù)據(jù),還包括美國專利商標局提供的已發(fā)表專利的序列數(shù)據(jù)。美國專利商標局提供的已發(fā)表專利的序列數(shù)據(jù)。 GenBank數(shù)據(jù)庫每天與歐洲分子生物學實數(shù)據(jù)庫每天與歐洲分子生物學實驗室的核酸序列數(shù)據(jù)庫(驗室的核酸序列數(shù)據(jù)庫(European Molecular Biology Laboratory
9、 Nucleotide Sequence Database,EMBL)和日本的和日本的DNA數(shù)據(jù)庫(數(shù)據(jù)庫(DNA Data Bank of Japan DDBJ)進行數(shù)據(jù)交換,以保證數(shù)據(jù))進行數(shù)據(jù)交換,以保證數(shù)據(jù)庫內(nèi)容在全世界范圍的同步性。庫內(nèi)容在全世界范圍的同步性。 在在NCBI(/)的主)的主頁上提供了進入頁上提供了進入GenBank的路徑、相關(guān)檢索和分的路徑、相關(guān)檢索和分析服務。析服務。 通過通過NCBI的檢索系統(tǒng)(的檢索系統(tǒng)(Entrez)可以進入)可以進入GenBank。Entrez檢索程序整合了主要的檢索程序整合了主要的DNA和
10、蛋白序列數(shù)據(jù)的分類學、基因組、圖譜、蛋白和蛋白序列數(shù)據(jù)的分類學、基因組、圖譜、蛋白結(jié)構(gòu)和結(jié)構(gòu)(功能)域信息,還包括相關(guān)的結(jié)構(gòu)和結(jié)構(gòu)(功能)域信息,還包括相關(guān)的PubMed的生物醫(yī)學文獻信息。的生物醫(yī)學文獻信息。 BLAST程序提供程序提供GenBank和其他序列數(shù)據(jù)庫中和其他序列數(shù)據(jù)庫中序列相似性搜索服務。序列相似性搜索服務。 (一)GenBank數(shù)據(jù)庫結(jié)構(gòu) 1. 依據(jù)序列的物種來源分類依據(jù)序列的物種來源分類 2. Genbank記錄和分類記錄和分類 2.1 表達序列標簽表達序列標簽(EST) 2.2 序列標簽位點序列標簽位點(STS)、基因組勘測序列、基因組勘測序列(GSS)和環(huán)和環(huán)境樣品序
11、列境樣品序列(ENV) 2.3 高通量基因組高通量基因組(HTG)和高通量和高通量cDNA(HTC)序列序列 2.4 全基因組鳥槍測序序列全基因組鳥槍測序序列(WGS) 2.5 轉(zhuǎn)錄組鳥槍組合序列轉(zhuǎn)錄組鳥槍組合序列 (一)GenBank數(shù)據(jù)庫結(jié)構(gòu) 3. 特殊記錄類型特殊記錄類型 3.1 第三方注釋(第三方注釋(TPA) 3.2 GenBank CON記錄記錄 較小記錄組合記錄較小記錄組合記錄 (二)構(gòu)建數(shù)據(jù)庫 1直接電子提交 1.1 使用BankIt提交 1.2 使用Sequin和tbl2asn提交 1.3 條形碼序列提交 2. 序列標識符和記錄號 (三)檢索GenBank數(shù)據(jù) 1. Entr
12、ez系統(tǒng)系統(tǒng) (/sites/gquery) 2. 與測序計劃檢索相關(guān)的序列記錄與測序計劃檢索相關(guān)的序列記錄 (/genomeprj) 3. BLAST 序列相似性搜索序列相似性搜索 (/Blast.cgi) 4. 用用FTP獲取獲取GenBank (/genbank) 二、EMBL數(shù)據(jù)庫 EMBL建立于1980年,EMBL核苷序列數(shù)據(jù)庫(http:/ www.edi.ac.uk/embl/)
13、是歐洲主要的核苷序列收集單位,歐洲生物信息中心EBI(即EMBL在德國海德堡的站點)維護這個數(shù)據(jù)庫。 核苷數(shù)據(jù)來自基因組測序中心、世界各地的科學家、歐洲專利局、以及與合作伙伴DDBJ (Japan)和GenBank (USA)交換的數(shù)據(jù)。 三、DDBJ數(shù)據(jù)庫 日本日本DNA數(shù)據(jù)庫(數(shù)據(jù)庫(DDBJ)是在亞洲唯一的核酸)是在亞洲唯一的核酸序列數(shù)據(jù)庫,是搜集研究者公認的測定核酸序列序列數(shù)據(jù)庫,是搜集研究者公認的測定核酸序列的數(shù)據(jù)庫,并且發(fā)放給數(shù)據(jù)提交者國際認證的核的數(shù)據(jù)庫,并且發(fā)放給數(shù)據(jù)提交者國際認證的核酸序列編號。由于酸序列編號。由于DDBJ每天將搜集的數(shù)據(jù)與每天將搜集的數(shù)據(jù)與EMBL-Bank
14、/EBI和和GenBank/NCBI進行交換,進行交換,使得三個核酸數(shù)據(jù)庫幾乎在任何時候都享有相同使得三個核酸數(shù)據(jù)庫幾乎在任何時候都享有相同數(shù)據(jù)。數(shù)據(jù)。DDBJ主要收集來自日本研究者獲得的序主要收集來自日本研究者獲得的序列數(shù)據(jù),但也收集數(shù)據(jù)和發(fā)放編號給任何其他國列數(shù)據(jù),但也收集數(shù)據(jù)和發(fā)放編號給任何其他國家的研究者。家的研究者。 四、其他重要的核酸序列數(shù)據(jù)庫 dbEST:dbEST是是GenBank中的一個子數(shù)據(jù)庫,中的一個子數(shù)據(jù)庫,包含來源于不同物種的表達序列數(shù)據(jù)和表達序列包含來源于不同物種的表達序列數(shù)據(jù)和表達序列標簽序列的其他信息。標簽序列的其他信息。 ncRNAdb:非編碼:非編碼RNA(
15、non-coding RNA ncRNA)數(shù)據(jù)庫旨在提供非編碼)數(shù)據(jù)庫旨在提供非編碼RNA的序列和功的序列和功能信息。能信息。 miRBase:miRBase序列數(shù)據(jù)庫主要存放已發(fā)表序列數(shù)據(jù)庫主要存放已發(fā)表的微小的微小RNA(microRNA miRNA)序列和注釋的序列和注釋的數(shù)據(jù)庫。數(shù)據(jù)庫。 (美國、加拿大)(美國、加拿大)The Genome Database 1990年,年,John Hopkins大學建立,后由加拿大兒童醫(yī)院生物信息大學建立,后由加拿大兒童醫(yī)院生物信息中心管理中心管理.基因單位、基因單位、PCR位點、細胞遺傳標記、位點、細胞遺傳標記、EST、contig、重復片段、基
16、、重復片段、基因組圖譜因組圖譜與其它分子生物信息網(wǎng)絡資源(與其它分子生物信息網(wǎng)絡資源(EMBL、GenBank)的鏈接)的鏈接 線蟲基因組數(shù)據(jù)庫。既是一個數(shù)據(jù)庫,又是一個數(shù)據(jù)庫管理系統(tǒng)。線蟲基因組數(shù)據(jù)庫。既是一個數(shù)據(jù)庫,又是一個數(shù)據(jù)庫管理系統(tǒng)。 提供很好的圖形界面,用戶能夠從大到整個基因組小到序列的各提供很好的圖形界面,用戶能夠從大到整個基因組小到序列的各 個層次觀察和分析基因組數(shù)據(jù)。個層次觀察和分析基因組數(shù)據(jù)。 限制性圖譜,基因結(jié)構(gòu)信息,質(zhì)粒圖譜,序列數(shù)據(jù),參考文獻限制性圖譜,基因結(jié)構(gòu)信息,質(zhì)粒圖譜,序列數(shù)據(jù),參考文獻 (歐洲歐洲) (美國美國)蛋白質(zhì)功
17、能、結(jié)構(gòu)域和蛋白質(zhì)家族有關(guān)的數(shù)據(jù)庫: PROSITE InterPro Pfam ProDom SMART 等 蛋白質(zhì)三維結(jié)構(gòu)相關(guān)數(shù)據(jù)庫: PDB BioMagResBank SWISS-MODEL Repository ModBase CATH SCOP ReLiBase TOPS SWISS-3DIMAGE BioImage等 蛋白質(zhì)二維凝膠電泳數(shù)據(jù)庫: WORLD-2DPAGE Phoretix links 信號傳導及蛋白質(zhì)-蛋白質(zhì)相互作用相關(guān)數(shù)據(jù)庫: DIP INTERACT ProNet KEGG CANSITE SPAD CSNDB等 DNA和蛋白質(zhì)相互作用數(shù)據(jù)庫:DPIntera
18、ct 蛋白質(zhì)翻譯后修飾相關(guān)數(shù)據(jù)庫:O-GlycBase、PhosphoBase、RES蛋白質(zhì)等蛋白質(zhì) 1. 瑞士日內(nèi)瓦大學瑞士日內(nèi)瓦大學 (Geneva )醫(yī)學生物化學系和歐洲生物信息學研究所)醫(yī)學生物化學系和歐洲生物信息學研究所(EBI)合作維護(合作維護(1986年);年); 2. 在在EMBL和和GenBank數(shù)據(jù)庫上均建立了鏡像站點數(shù)據(jù)庫上均建立了鏡像站點; 3. 數(shù)據(jù)庫包括了從數(shù)據(jù)庫包括了從EMBL翻譯而來的蛋白質(zhì)序列,這些序列經(jīng)過檢驗和注釋;翻譯而來的蛋白質(zhì)序列,這些序列經(jīng)過檢驗和注釋; 4. 數(shù)據(jù)記錄包括兩部分:數(shù)據(jù)記錄包括兩部分: 序列序列 注釋注釋 (結(jié)構(gòu)域、功能位點、跨膜區(qū)
19、域、二硫鍵位置、翻結(jié)構(gòu)域、功能位點、跨膜區(qū)域、二硫鍵位置、翻 譯后的修飾、突變體等譯后的修飾、突變體等) 5. 數(shù)據(jù)存在滯后性數(shù)據(jù)存在滯后性 TrEMBL數(shù)據(jù)庫的建立數(shù)據(jù)庫的建立SWISS-PROT的網(wǎng)址:的網(wǎng)址: /sprotTrEMBL的網(wǎng)址:的網(wǎng)址: http:/www.ebi.ac.uk/trembl/index.htmlSWISS-PROT (http:/www.expasy.ch/sprot/sprot-top.html)是目前國際上比較權(quán)威的蛋白質(zhì)序列數(shù)據(jù)庫,其中的蛋白質(zhì)序列是經(jīng)過注釋的 SWISS-PROT中的數(shù)據(jù)來源于不同源地:(1)從核
20、酸數(shù)據(jù)庫經(jīng)過翻譯推導而來;(2)從蛋白質(zhì)數(shù)據(jù)庫PIR挑選出合適的數(shù)據(jù);(3)從科學文獻中摘錄;(4)研究人員直接提交的蛋白質(zhì)序列數(shù)據(jù) 1. 由美國由美國NCBI翻譯自翻譯自GenBank的的DNA序列序列(1984年年); 2. 在在EMBL和和GenBank數(shù)據(jù)庫上均建立了鏡像站點;數(shù)據(jù)庫上均建立了鏡像站點; 3. 數(shù)據(jù)依據(jù)注釋的質(zhì)量分為數(shù)據(jù)依據(jù)注釋的質(zhì)量分為4類。類。 網(wǎng)址:網(wǎng)址: /分類名稱分類名稱(Name)說明說明(Comment)記錄數(shù)記錄數(shù)(Number of entries)PIR1已分類、已注釋已分類、已注釋(Clas
21、sified and annotated)13572PIR2已注釋已注釋(Annotated)69368PIR3未核實未核實(Unverified)7508PIR4未翻譯未翻譯(Unencoded or untranslated)196 目的:目的:幫助研究者鑒別和解釋蛋白質(zhì)序列信息,幫助研究者鑒別和解釋蛋白質(zhì)序列信息,研究分子進化、功能基因組。研究分子進化、功能基因組。 它是一個全面的、經(jīng)過注釋的、非冗余的蛋白質(zhì)序列數(shù)它是一個全面的、經(jīng)過注釋的、非冗余的蛋白質(zhì)序列數(shù)據(jù)庫。據(jù)庫。 所有序列數(shù)據(jù)都經(jīng)過整理,超過所有序列數(shù)據(jù)都經(jīng)過整理,超過99%99%的序列已按蛋白質(zhì)的序列已按蛋白質(zhì)家族分類,一半
22、以上還按蛋白質(zhì)超家族進行了分類家族分類,一半以上還按蛋白質(zhì)超家族進行了分類。1、PIR(Protein Information Resource)除了蛋白質(zhì)序列數(shù)據(jù)之外,除了蛋白質(zhì)序列數(shù)據(jù)之外,PIR還包含以下信息:還包含以下信息: (1)蛋白質(zhì)名稱、蛋白質(zhì)的分類、蛋白質(zhì)的來源;蛋白質(zhì)名稱、蛋白質(zhì)的分類、蛋白質(zhì)的來源; (2)關(guān)于原始數(shù)據(jù)的參考文獻;關(guān)于原始數(shù)據(jù)的參考文獻; (3)蛋白質(zhì)功能和蛋白質(zhì)的一般特征,包括基因表達、翻蛋白質(zhì)功能和蛋白質(zhì)的一般特征,包括基因表達、翻 譯后處理、活化等;譯后處理、活化等; (4)序列中相關(guān)的位點、功能區(qū)域。序列中相關(guān)的位點、功能區(qū)域。PIR提供三種類型的檢
23、索服務:一是基于文本的交互式查詢,用戶通過關(guān)鍵字進行數(shù)據(jù)查詢。二是標準的序列相似性搜索,包括BLAST、FastA等。三是結(jié)合序列相似性、注釋信息和蛋白質(zhì)家族信息的高級搜索,包括按注釋分類的相似性搜索、結(jié)構(gòu)域搜索等。四個子數(shù)據(jù)庫Uniprot- 通用蛋白質(zhì)資源通用蛋白質(zhì)資源數(shù)據(jù)庫數(shù)據(jù)庫iProClass-蛋白質(zhì)知識整蛋白質(zhì)知識整合數(shù)據(jù)庫合數(shù)據(jù)庫PIRSF-蛋白質(zhì)家族分類系蛋白質(zhì)家族分類系統(tǒng)統(tǒng)iProLINK-蛋白質(zhì)文獻、信蛋白質(zhì)文獻、信息和知識整合數(shù)據(jù)庫息和知識整合數(shù)據(jù)庫 1.UniProt-通用蛋白質(zhì)資源庫通用蛋白質(zhì)資源庫 UniProt(/) 存儲
24、和鏈接其他蛋白質(zhì)數(shù)據(jù)庫的資源庫,并且是存儲和鏈接其他蛋白質(zhì)數(shù)據(jù)庫的資源庫,并且是蛋白質(zhì)序列和具有綜合功能注釋目錄的中心資源蛋白質(zhì)序列和具有綜合功能注釋目錄的中心資源庫。使用庫。使用UniprotKB可以檢索準確、可靠的蛋白可以檢索準確、可靠的蛋白綜合信息。使用綜合信息。使用UniRef可以減少冗余,加速序列可以減少冗余,加速序列相似性搜索。使用相似性搜索。使用UniParc可以檢索存檔序列和可以檢索存檔序列和它們來源的數(shù)據(jù)庫。它們來源的數(shù)據(jù)庫。 2. iProClass-蛋白質(zhì)知識整合數(shù)據(jù)庫蛋白質(zhì)知識整合數(shù)據(jù)庫 iProClass(/iprocl
25、ass/) 提供來自提供來自90多個生物學數(shù)據(jù)庫的大量整合數(shù)據(jù),包括蛋白多個生物學數(shù)據(jù)庫的大量整合數(shù)據(jù),包括蛋白ID圖譜服務、圖譜服務、UniProtKB編注蛋白質(zhì)摘要描述和篩選編注蛋白質(zhì)摘要描述和篩選UnParc數(shù)據(jù)庫的蛋白質(zhì)序列。使用數(shù)據(jù)庫的蛋白質(zhì)序列。使用iProClass可以檢索最新的蛋白可以檢索最新的蛋白質(zhì)綜合信息,包括:功能、轉(zhuǎn)導通路、相互作用、家族分類、質(zhì)綜合信息,包括:功能、轉(zhuǎn)導通路、相互作用、家族分類、基因和基因組、功能注釋標準體系(基因和基因組、功能注釋標準體系(ontology)、文獻和分)、文獻和分類學信息。使用類學信息。使用iProClass還可以檢索還可以檢索ID圖
26、譜、蛋白質(zhì)詞典圖譜、蛋白質(zhì)詞典和相關(guān)序列。和相關(guān)序列。 3. PIRSF-蛋白質(zhì)家族分類系統(tǒng)蛋白質(zhì)家族分類系統(tǒng) PIRSF(/pirsf/) 分類系統(tǒng)概要論述家族的特征,如家族名稱、分分類系統(tǒng)概要論述家族的特征,如家族名稱、分類分布、分級和功能域結(jié)構(gòu),以及家族成員,包類分布、分級和功能域結(jié)構(gòu),以及家族成員,包括功能、結(jié)構(gòu)、傳導通路、功能注釋標準體系括功能、結(jié)構(gòu)、傳導通路、功能注釋標準體系(ontology)和家族分類。利用這些信息可以獲)和家族分類。利用這些信息可以獲得蛋白質(zhì)的準確功能或預測的功能和該蛋白質(zhì)所得蛋白質(zhì)的準確功能或預測的功能和該蛋白
27、質(zhì)所屬家族成員共有的其他特征。屬家族成員共有的其他特征。 4. iProLINK-蛋白質(zhì)文獻、信息和知識整合數(shù)據(jù)庫蛋白質(zhì)文獻、信息和知識整合數(shù)據(jù)庫 iProLINK(/iprolink/) 提供有關(guān)注釋內(nèi)容的文獻、蛋白質(zhì)名稱詞典和其他有助于提供有關(guān)注釋內(nèi)容的文獻、蛋白質(zhì)名稱詞典和其他有助于文獻挖掘的人文語言處理技術(shù)開發(fā)的信息、數(shù)據(jù)庫校正、文獻挖掘的人文語言處理技術(shù)開發(fā)的信息、數(shù)據(jù)庫校正、蛋白質(zhì)名稱標記和功能注釋標準體系(蛋白質(zhì)名稱標記和功能注釋標準體系(ontology)。使)。使用用iProLINK可以獲得描述蛋白質(zhì)記錄的文本文獻資源,可以獲得
28、描述蛋白質(zhì)記錄的文本文獻資源,在在UniProtKB記錄(生物詞典)中加入蛋白質(zhì)或基因命名記錄(生物詞典)中加入蛋白質(zhì)或基因命名的圖譜,獲得用于開發(fā)文本挖掘算法的注釋數(shù)據(jù)集、挖掘的圖譜,獲得用于開發(fā)文本挖掘算法的注釋數(shù)據(jù)集、挖掘蛋白質(zhì)磷酸化(蛋白質(zhì)磷酸化(RLIMS-P)文獻和獲得蛋白質(zhì)功能注釋標)文獻和獲得蛋白質(zhì)功能注釋標準體系(準體系(ontology)()(PRO)信息。)信息。 1. 目前最主要的蛋白質(zhì)分子結(jié)構(gòu)數(shù)據(jù)庫;目前最主要的蛋白質(zhì)分子結(jié)構(gòu)數(shù)據(jù)庫; 2. 1970年代建立,年代建立,美國美國Brookhaven國家實驗室國家實驗室維護管理維護管理; 3. 1988年,由美國年,由美
29、國RCSB(research collaboratory for structural biology)管理;管理; 4. 以文本格式存放數(shù)據(jù),包括原子坐標、物種來源、測定方法、提交以文本格式存放數(shù)據(jù),包括原子坐標、物種來源、測定方法、提交者信息、一級結(jié)構(gòu)、二級結(jié)構(gòu)等;者信息、一級結(jié)構(gòu)、二級結(jié)構(gòu)等; 5. PDBsum數(shù)據(jù)庫:數(shù)據(jù)庫:PDB注釋信息綜合數(shù)據(jù)庫,具有檢索、分析、可注釋信息綜合數(shù)據(jù)庫,具有檢索、分析、可視化的功能。視化的功能。PDB的網(wǎng)址:的網(wǎng)址:/pdb(美國美國) PDBsum的網(wǎng)址:的網(wǎng)址:http:/www.biochem.ucl.ac.
30、uk/bsm/pdbsumHEADER HYDROLASE 19-FEB-97 1ADZ TITLE THE SOLUTION STRUCTURE OF THE SECOND KUNITZ DOMAIN OF TITLE 2 TISSUE FACTOR PATHWAY INHIBITOR, NMR, 30 STRUCTURES COMPND MOL_ID: 1; COMPND 2 MOLECULE: TISSUE FACTOR PATHWAY INHIBITOR; 。COMPND 8 BIOLOGICAL_UNIT: MONOMER SOURCE MOL_ID: 1; 。SOURCE 7 EX
31、PRESSION_SYSTEM_PLASMID: PFLAG KEYWDS HYDROLASE, INHIBITOR, COAGULATION EXPDTA NMR, 30 STRUCTURES AUTHOR M.J.M.BURGERING,L.P.M.ORBONS REVDAT 1 25-FEB-98 1ADZ 0 JRNL AUTH M.J.BURGERING,L.P.ORBONS,A.VAN DER DOELEN, 。REMARK 1 REFERENCE 1 REMARK 1 AUTH M.T.STUBBS II REMARK 1 TITL STRUCTURAL ASPECTS OF FACTOR XA INHIBITION 。REMARK 999 SEQUENCE REMARK 999 1ADZ SWS P10646 1 - 111 NOT IN ATOMS LIST REMARK 999 1ADZ SWS P10646 183 - 304 NOT IN ATOMS LIST REMARK 999 THE FIRST NINE RESIDUES ARE NOT PART OF THE TFPI DOMAIN II REMARK 999 SEQUENCE BUT ARE FROM THE PFLAG PEPTIDE
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 內(nèi)控審計合同范本
- 仁和經(jīng)銷合同范本
- 加盟返利合同范本
- 代購代理合同范本
- 農(nóng)村建房簽合同范本
- 共同合作居間合同范本
- 化學桶回收合同范本
- it行業(yè)采購合同范本
- 分戶協(xié)議合同范本
- 勞動合同正規(guī)合同范本
- 2024年貴州水投水務集團有限公司招聘筆試參考題庫含答案解析
- (完整版)ERP流程及操作手冊
- 接上童氣:小學《道德與法治》統(tǒng)編教材研究
- 武器講解課件
- 通勤車租賃投標方案(技術(shù)標)
- 關(guān)于魯迅簡介
- 余華讀書分享名著導讀《文城》
- 高三二輪專題復習化學課件-分布系數(shù)(分數(shù))圖像
- 支委委員辭去職務申請書
- 【橋梁工程的發(fā)展趨勢與思考5300字】
- 云南省蒙自市長橋海水庫擴建工程環(huán)評報告
評論
0/150
提交評論