NCBI站點的一般介紹及其它資源庫的介紹_第1頁
NCBI站點的一般介紹及其它資源庫的介紹_第2頁
NCBI站點的一般介紹及其它資源庫的介紹_第3頁
NCBI站點的一般介紹及其它資源庫的介紹_第4頁
NCBI站點的一般介紹及其它資源庫的介紹_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

NCBI站點的一般介紹及其它資源庫的介紹GenBankOverview生物信息學站點地圖其它資源庫的介紹什么是GenBank?GenBank是一個有有13億億堿基,,來自于于100,000多種種生物的的核苷酸酸序列的的數(shù)據(jù)庫庫。每條條紀錄都都有編碼碼區(qū)(CDS))特征的的注釋,,還包括括氨基酸酸的翻譯譯。GenBank屬屬于一個個序列數(shù)數(shù)據(jù)庫的的國際合合作組織織,包括括EMBL和DDBJ。紀錄樣本本關于GenBank的的各個字字段的詳詳細描述述,以及及同Entrez搜索索字段的的交叉索索引。訪問GenBank通過EntrezNucleotides來查詢。。用accessionnumber,作作者姓名名,物種種,基因因/蛋白白名字,,還有許許多其他他的文本本術語來來查詢。。關于Entrez更多多的信息息請看下下文。用BLAST來來在GenBank和和其他數(shù)數(shù)據(jù)庫中中進行序序列相似似搜索。。用E-mail來訪問問Entrez和BLAST可以通通過Query和BLAST服務器器。另外外一種選選擇是可可以用FTP下下載整個個的GenBank和和更新數(shù)數(shù)據(jù)。增長統(tǒng)計計參見公布布通知的的2.2.6((每個分分類的統(tǒng)統(tǒng)計),,2.2.7((每個物物種的統(tǒng)統(tǒng)計),,2.2.8((GenBank增長長)小節(jié)節(jié)。公布通知知最新--最近近和即將將有的變變化,GenBank的分類類,數(shù)據(jù)據(jù)增長統(tǒng)統(tǒng)計,GenBank的引用用。舊-同同上相相同,是是過去公公布的統(tǒng)統(tǒng)計。遺傳密碼碼-15個遺傳傳密碼的的概要。。用來確確保GenBank中中紀錄的的編碼序序列被正正確的翻翻譯。向GenBank提交交數(shù)據(jù)Sequin提交軟件件程序,,用于一一條或者者很多條條的提交交,長序序列,完完整基因因組,alignments,人群群/種系系/突變變研究的的提交。??梢元毩⒘⑹褂茫?,或者用用基于TCP//IP的的“networkaware””模式,,可以鏈鏈接到其其他NCBI的的資源和和軟件比比如Entrez和PowerBLAST。(請請在提交交前用VecScreen去去除載體體)ESTs-表表達序序列標簽簽,短的的、單次次(測序序)閱讀讀的cDNA序序列。也也包括來來自于差差異顯示示和RACE實實驗的cDNA序列。。GSSs基因組調調查序列列,短的的、單次次(測序序)閱讀讀的cDNA序序列,exontrap獲獲得的序序列,cosmid//BAC/YAC末端端,及其其他。HTGs-來來自于于大規(guī)模模測序中中心的高高通量基基因組序序列,未未完成的的(階段段0,1,2))和完成成的(階階段3))序列。。注意:完完成的人人類的HTG序序列可以以同時在在GenBank和HumanGenomeSequencing頁面上訪訪問。STSs序列列標簽位位點短的在基基因組上上可以被被唯一操操作的序序列,用用于產生生作圖位位點。注:SNPs--人人類的和和其他物物種的遺遺傳變異異數(shù)據(jù)可可以提交交到NCBI數(shù)數(shù)據(jù)庫的的單核苷苷酸多態(tài)態(tài)性庫中中(dbSNP)。國際核苷苷酸序列列數(shù)據(jù)庫庫合作組組織GenBank,DDBJ,,EMBL--合作作計劃的的概述,,并鏈接接到相應應的主頁頁。GenBank,DDBJ((DNADataBankofJapan),,andEMBL((EuropeanMolecularBiologyLaboratory))數(shù)據(jù)庫庫共享的的數(shù)據(jù)是是每天都都交換的的,因此此他們是是相等的的。數(shù)據(jù)紀錄錄的格式式和搜索索方式可可能會不不一樣,,但是accessionnumber,序列列數(shù)據(jù)和和注解都都是一模模一樣的的。即,,你可以以用accessionnumberU12345在GenBank,,DDBJ或EMBL中查找找相應紀紀錄,得得到的結結果是完完全一樣樣的序列列數(shù)據(jù),,參考內內容等等等。DDBJ/EMBJ//GenBank特性性表((見講義義)特性表格格式和標標準被合合作數(shù)據(jù)據(jù)庫用在在序列記記錄的注注釋上,,使得數(shù)數(shù)據(jù)共享享成為可可能,包包括詳細細的描述述生物特特性和特特性限定定語的附附錄,以以及IUPAC規(guī)定的的核苷酸酸和氨基基酸的代代號。FTPGenBankandDailyUpdatesGenBank普通文文件格式式參見GenBank記記錄樣本本和在GenBank公布通通知中的的詳細描描述,下下載大多多數(shù)最近近的完全全公告和和日常積積累或非非積累更更新數(shù)據(jù)據(jù)。ASN..1格式式—摘摘要句句法記號號1,國國際標準準組織((ISO)數(shù)據(jù)據(jù)表示格格式,下下載大多多數(shù)最近近的完全全公告和和日常積積累或非非積累更更新數(shù)據(jù)據(jù)。FASTA格式式定義行號號后只跟跟隨序列列數(shù)據(jù)((示例)),參見見描述數(shù)數(shù)據(jù)庫的的readme文件,,包括nt.Z((每天更更新的非非冗余BLAST核酸酸數(shù)據(jù)庫庫,包括GenBank++EMBL+DDBJ+PDB序列列,不包括EST,,STS,GSS,orHTGS序列)),nr.Z((每日更更新的非非冗余蛋蛋白質)),est.Z,gss..Z,htg.Z,,sts.Z,和其其它文件件。分子數(shù)據(jù)據(jù)庫概覽覽核酸序列列Entrez核核酸——用accessionnumber,作者者姓名,,物種,,基因//蛋白名名字,以以及很多多其它的的文本術術語來搜搜索核酸酸序列記記錄(在在GenBank++PDB中)。更更多的關關于Entrez的信信息見下下。如果果要檢索索大量數(shù)數(shù)據(jù),也也可使用用BatchEntrez(批量量Entrez)。

RefSeqNCBI數(shù)據(jù)庫庫的參考考序列。。校正的的,非冗冗余集合合,包括括基因組組DNAcontigs,,已知基基因的mRNAs和蛋蛋白,在在將來,,整個的的染色體體。Accessionnumbers用NT_xxxxxx,,NM_xxxxxx,NP__xxxxxx,和和NC__xxxxxx的形式式來表示示。dbEST——表達達序列標標簽數(shù)據(jù)據(jù)庫,短短的、單單次(測測序)閱閱讀的cDNA序列。。也包括括來自于于差異顯顯示和RACE實驗的的cDNA序列列。dbGSS——基因組組調查序序列的數(shù)數(shù)據(jù)庫,,短的、、單次((測序))閱讀的的cDNA序列列,exontrap獲得得的序列列,cosmid/BAC//YAC末端,,及其他他。dbSTS序列標簽簽位點的的數(shù)據(jù)庫庫,短的的在基因因組上可可以被唯唯一操作作的序列列,用于于產生作作圖位點點。

dbSNP——單核核苷酸多多態(tài)性數(shù)數(shù)據(jù)庫,,包括SNPs,小范范圍的插插入/缺缺失,多多態(tài)重復復單元,,和微衛(wèi)衛(wèi)星變異異。完整的基基因組參見下面面Genome和Maps部部分,包包括各種種物種資資源,人人,小鼠鼠,大鼠鼠,酵母母,線蟲蟲,瘧原原蟲,細細菌,病病毒,viroids,質粒粒。瘧原蟲UniGene被整理成成簇的EST和和全長mRNA序列,,每一個個代表一一種特定定已知的的或假設設的人類類基因,,有定位位圖和表表達信息息以及同同其它資資源的交交叉參考考。序列列數(shù)據(jù)可可以以cluster形式在在Unigene網頁頁下載,,完整的的數(shù)據(jù)可可以從FTP站站點repository//UniGene目錄錄下下載載。人類UniGene小鼠UniGene大鼠UniGene斑馬魚UniGeneBLAST將你的序序列同核核酸庫中中的的序序列比較較,檢索索相似的的序列。。(更詳詳細的信信息見下下面Tools/Sequence相似搜搜索部分分)BLAST查找BLAST指南蛋白序列列Entrez蛋蛋白——用accessionnumber,,作者姓姓名,物物種,基基因/蛋蛋白名字字,以及及很多其其它的文文本術語語來搜索索蛋白序序列記錄錄(在GenPept+Swiss--Prot++PIR++RPF++PDB中))。更多多的關于于Entrez的信息息見下。。如果要要檢索大大量數(shù)據(jù)據(jù),也可可使用BatchEntrez((批量Entrez))。

RefSeqNCBI數(shù)據(jù)庫庫的參考考序列。。Curated,非非冗余余集合包包括基因因組DNAcontigs,已知知基因的的mRNAs和和蛋白,,在將來來,整個個的染色色體。Accessionnumbers用NT_xxxxxx,,NM_xxxxxx,NP__xxxxxx,和和NC__xxxxxx的形式式來表示示。FTPGenPept下載“genpept.fsa.Z”文件件,這個個文件包包含了從從GenBank/EMBL/DDBJ記記錄中翻翻譯過來來的FASTA格式的的氨基酸酸序列,,這些記記錄都有有一到兩兩個CDS特性性的描述述。

完整基因因組參見下面面Genome和Maps部部分,包包括各種種物種資資源,人人,小鼠鼠,大鼠鼠,酵母母,線蟲蟲,瘧原原蟲,細細菌,病病毒,viroids,質粒粒。Entrez基基因組提供了一一個編碼碼區(qū)的概概要和各各種物種種的分類類表(TaxTable)。。編碼區(qū)區(qū)概要列列出了在在基因組組中所有有的的蛋蛋白,并并提供鏈鏈接到FASTA文件件和BLAST。分類類表總結結了蛋白白BLAST分分析的結結果,建建議他們們的可能能功能,,并用顏顏色編碼碼的圖來來顯示物物種同其其它物種種之間的的關系((參見下下面'Genomes和Maps,,'部分分Entrez基因組組的一般般描述))

FTP基基因組蛋蛋白從ftp站點的的genbank/genomes目錄下下下載各各種物種種的FASTA格式的的氨基酸酸序列**.faa和蛋蛋白表文文件*..ptt。參見見readme文件。。蛋白表表也可以以在Entrez基因因組中看看到。

PROWWeb上上的蛋白白資源,,關于大大約200種人人類的CD細胞胞表面分分子的簡簡短官方方向導。。互相檢檢索,為為每個CD抗原原提供大大約20中標準準信息的的分類((生化功功能,配配體,等等等)

BLAST將你的序序列同蛋蛋白庫中中的的序序列比較較,檢索索相似的的序列。。(更詳詳細的信信息見下下面Tools/Sequence相似搜搜索部分分)BLASTp查找PSI--BLAST結構

結構主頁頁—關關于NCBI結構小小組的一一般信息息和他們們的研究究計劃,,另外也也可以訪訪問分子子模型數(shù)數(shù)據(jù)庫((MMDB)和和用來搜搜索和顯顯示結構構的相關關工具。。

MMDB:分子子模型數(shù)數(shù)據(jù)庫一個關于于三維生生物分子子結構的的數(shù)據(jù)庫庫,結構構來自于于X-ray晶晶體衍射射和NMR色譜譜分析。。MMDB是來源源于Brookhaven蛋蛋白數(shù)據(jù)據(jù)庫(PDB))三維結結構的一一部分,,排除了了那些理理論模型型。MMDB重重新組織織和驗證證了這些些信息,,從而保保證在化化學和大大分子三三維結構構之間的的交叉參參考。數(shù)數(shù)據(jù)的說說明書包包括生物物多聚體體的空間間結構,,這個分分子在化化學上是是如何組組織的,,以及聯(lián)聯(lián)系兩者者的一套套指針。。利用將將化學,,序列,,和結構構信息整整合在一一起,MMDB計劃成成為基于于結構的的同源模模型化和和蛋白結結構預測測的資源源服務。。MMDBMMDB的記錄錄以ASN.1格式存存儲,可可以用Cn3D,Rasmol,,或Kinemage來來顯示。。另外,,數(shù)據(jù)庫庫中類似似的結構構已經被被用VAST確確認,新新的結構構可以用用VASTsearch來同同數(shù)據(jù)庫庫進行比比較。

Cn3D“Seein3--D”,,一個個用于NCBI數(shù)據(jù)庫庫的結構構和序列列相似顯顯示工具具,它允允許觀察察3-D結構和和序列——結構或或結構——結構同同源比較較。Cn3D用用起來就就象你瀏瀏覽器上上的一個個幫助工工具。

VAST矢量同源源比較搜搜索工具具一個在NCBI開發(fā)的的計算算算法,用用于確定定相似的的蛋白三三維結構構。每一一個結構構的“結結構鄰居居”都是是預先計計算好的的,而且且可以通通過MMDB的的結構概概要頁面面的鏈接接訪問。。這些鄰鄰居可以以用來確確認那些些不能被被序列比比較識別別的遠的的同源性性。VAST搜索索—結結構——結構相相似搜索索服務。。比較一一個新解解出的蛋蛋白結構構和在MMDB/PDB數(shù)據(jù)據(jù)庫中的的結構的的三維坐坐標。VAST搜索計計算一系系列可能能會被交交互瀏覽覽的結構構鄰居,,用分子子圖形來來觀察重重疊和同同源相似似。

分類學NCBI的分類類數(shù)據(jù)庫庫主頁——關關于分類類計劃的的一般信信息,包包括分類類資源和和同NCBI分分類學家家合作的的外部管管理者的的列表。。分類瀏覽覽器——搜索索NCBI的分分類數(shù)據(jù)據(jù)庫,包包括大于于70000個個物種的的名字和和種系,,這些物物種都至至少在遺遺傳數(shù)據(jù)據(jù)庫中有有一條核核酸或蛋蛋白序列列??梢砸詸z索一一個特定定種或者者更高分分類(如如屬,科科)的核核酸,蛋蛋白,和和結構記記錄。如如果有新新物種的的序列數(shù)數(shù)據(jù)被放放到數(shù)據(jù)據(jù)庫中,,這個物物種就被被加到((分類))數(shù)據(jù)庫庫中。NCBI的分類類數(shù)據(jù)庫庫的目的的是為序序列數(shù)據(jù)據(jù)庫建立立一個一一致的種種系發(fā)生生分類學學。分類學文獻數(shù)據(jù)據(jù)庫概要要PubMed—一個個關于生生物醫(yī)藥藥科學的的檢索系系統(tǒng),包包括引用用,摘要要,和雜雜志的索索引術語語。它包包括直接接由出版版商提供供給NCBI的的文獻引引用以及及鏈接到到在出版版商網址址上的全全文的URLs。PubMed包包括MEDLINE和和PREMEDLINE的完完整內容容。它還還包括一一些被MEDLINE認為超超出范圍圍的文章章和雜志志,(這這些文章章或雜志志)由于于內容或或在某一一時期不不在索引引范圍內內。因此此PubMed是比MEDLINE的更大大的集合合。

雜志瀏覽覽器允許你去去查找收收錄到PubMed系系統(tǒng)的雜雜志的名名字,MEDLINE的縮寫寫,或ISSN號碼。。PubRef((開發(fā)中中)—一一個關關于來自自于廣大大范圍的的科學雜雜志的數(shù)數(shù)目記錄錄,和鏈鏈接到出出版商網網址的全全文。PubRef包包含了PubMEd,,加上了了來自其其它學科科的雜志志出版商商提供的的引用和和摘要。。因此它它是比PubMed更更大的集集合。這這個計劃劃的啟動動是因為為NAS要求為為科學領領域的電電子雜志志提供一一個“白白皮書””服務。。

PubMed中中心(開開發(fā)中))PubMed中中心是一一個無障障礙的NIH資資源,用用于在生生命科學學領域中中同業(yè)互互查的基基礎研究究報告。。從2000年年一月開開始接受受雜志文文章。所所有在PubMed中中心的材材料將由由目前任任一主要要的摘要要和索引引服務中中列出的的雜志提提供,或或者在編編輯委員員會中擁擁有3個個以上有有主要資資金機構構的研究究經費的的擁有人人的雜志志提供。。PubMedOMIM:在線人人類孟德德爾遺傳傳—經常更新新的人類類基因和和遺傳失失調的目目錄,有有鏈接到到其它相相關的文文獻參考考,序列列記錄,,和相關關數(shù)據(jù)庫庫。

書籍

同書籍出出版商合合作NCBI為為網絡改改編了教教科書,,并把他他們鏈接接到PubMed—生生物醫(yī)藥藥書目數(shù)數(shù)據(jù)庫。。這是為為了給PubMed提提供背景景信息,,這樣使使用者可可以探究究在PubMed搜索索結果中中不熟悉悉的概念念。目前前收錄的的書有::MolecularBiologyoftheCell,3rded.AlbertsB..,BrayD..,LewisJ.,RaffM.,RobertsK.,WatsonJ..D.,,1994,,GarlandPublishing.

外部鏈接接一個登記記服務,,用于建建立從在在Entrez中的特特定的文文章,雜雜志,或或生物數(shù)數(shù)據(jù)到外外部網址址的鏈接接。第三三方可以以提供一一個URL,資資源名字字,關于于他們網網址的簡簡要的描描述,和和關于從從NCBI數(shù)據(jù)據(jù)的哪里里他們希希望

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論