版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
NCBI站點的一般介紹及其它資源庫的介紹GenBankOverview生物信息學站點地圖其它資源庫的介紹什么是GenBank?GenBank是一個有13億堿基,來自于100,000多種生物的核苷酸序列的數(shù)據(jù)庫。每條紀錄都有編碼區(qū)(CDS)特征的注釋,還包括氨基酸的翻譯。GenBank屬于一個序列數(shù)據(jù)庫的國際合作組織,包括EMBL和DDBJ。紀錄樣本關于GenBank的各個字段的詳細描述,以及同Entrez搜索字段的交叉索引。訪問GenBank通過EntrezNucleotides來查詢。用accessionnumber,作者姓名,物種,基因/蛋白名字,還有許多其他的文本術語來查詢。關于Entrez更多的信息請看下文。用BLAST來在GenBank和其他數(shù)據(jù)庫中進行序列相似搜索。用E-mail來訪問Entrez和BLAST可以通過Query和BLAST服務器。另外一種選擇是可以用FTP下載整個的GenBank和更新數(shù)據(jù)。增長統(tǒng)計
參見公布通知的2.2.6(每個分類的統(tǒng)計),2.2.7(每個物種的統(tǒng)計),2.2.8(GenBank增長)小節(jié)。
公布通知最新-最近和即將有的變化,GenBank的分類,數(shù)據(jù)增長統(tǒng)計,GenBank的引用。
舊-同上相同,是過去公布的統(tǒng)計。
遺傳密碼-15個遺傳密碼的概要。用來確保GenBank中紀錄的編碼序列被正確的翻譯。
向GenBank提交數(shù)據(jù)
Sequin提交軟件程序,用于一條或者很多條的提交,長序列,完整基因組,alignments,人群/種系/突變研究的提交??梢元毩⑹褂?,或者用基于TCP/IP的“networkaware”模式,可以鏈接到其他NCBI的資源和軟件比如Entrez和PowerBLAST。(請在提交前用VecScreen去除載體)
ESTs-表達序列標簽,短的、單次(測序)閱讀的cDNA序列。也包括來自于差異顯示和RACE實驗的cDNA序列。GSSs基因組調查序列,短的、單次(測序)閱讀的cDNA序列,exontrap獲得的序列,cosmid/BAC/YAC末端,及其他。
HTGs-來自于大規(guī)模測序中心的高通量基因組序列,未完成的(階段0,1,2)和完成的(階段3)序列。注意:完成的人類的HTG序列可以同時在GenBank和HumanGenomeSequencing頁面上訪問。
STSs序列標簽位點短的在基因組上可以被唯一操作的序列,用于產生作圖位點。
注:SNPs-人類的和其他物種的遺傳變異數(shù)據(jù)可以提交到NCBI數(shù)據(jù)庫的單核苷酸多態(tài)性庫中(dbSNP)。國際核苷酸序序列數(shù)據(jù)庫合合作組織GenBank,DDBJ,EMBL-合合作計劃的概概述,并鏈接接到相應的主主頁。GenBank,DDBJ(DNADataBankofJapan)),andEMBL((EuropeanMolecularBiologyLaboratory)數(shù)數(shù)據(jù)庫共享的的數(shù)據(jù)是每天天都交換的,,因此他們是是相等的。數(shù)據(jù)紀錄的格格式和搜索方方式可能會不不一樣,但是是accessionnumber,序列數(shù)數(shù)據(jù)和注解都都是一模一樣樣的。即,你你可以用accessionnumberU12345在GenBank,,DDBJ或或EMBL中中查找相應紀紀錄,得到的的結果是完全全一樣的序列列數(shù)據(jù),參考考內容等等。。DDBJ/EMBJ/GenBank特性表((見講義))特性表格式和和標準被合作作數(shù)據(jù)庫用在在序列記錄的的注釋上,使使得數(shù)據(jù)共享享成為可能,,包括詳細的的描述生物特特性和特性限限定語的附錄錄,以及IUPAC規(guī)定定的核苷酸和和氨基酸的代代號。FTPGenBankandDailyUpdatesGenBank普通文件件格式參見GenBank記錄錄樣本和在GenBank公布通知知中的詳細描描述,下載大大多數(shù)最近的的完全公告和和日常積累或或非積累更新新數(shù)據(jù)。ASN.1格格式—摘摘要句法記號號1,國際標標準組織(ISO)數(shù)據(jù)據(jù)表示格式,,下載大多數(shù)數(shù)最近的完全全公告和日常常積累或非積積累更新數(shù)據(jù)據(jù)。FASTA格格式定義行號后只只跟隨序列數(shù)數(shù)據(jù)(示例)),參見描述述數(shù)據(jù)庫的readme文件,包括nt.Z(每天更新新的非冗余BLAST核核酸數(shù)據(jù)庫,,包括GenBank+EMBL+DDBJ+PDB序列,,不包括EST,STS,GSS,orHTGS序序列),nr.Z(每日日更新的非冗冗余蛋白質)),est.Z,gss.Z,htg.Z,sts.Z,和其其它文件。分子數(shù)據(jù)庫概概覽核酸序序列Entrez核核酸——用用accessionnumber,作者者姓名名,物物種,,基因因/蛋蛋白名名字,,以及及很多多其它它的文文本術術語來來搜索索核酸酸序列列記錄錄(在在GenBank+PDB中)。。更多多的關關于Entrez的的信息息見下下。如如果要要檢索索大量量數(shù)據(jù)據(jù),也也可使使用BatchEntrez((批量量Entrez)。。RefSeqNCBI數(shù)數(shù)據(jù)庫庫的參參考序序列。。校正正的,,非冗冗余集集合,,包括括基因因組DNAcontigs,已已知基基因的的mRNAs和和蛋白白,在在將來來,整整個的的染色色體。。Accessionnumbers用NT_xxxxxx,NM_xxxxxx,NP_xxxxxx,和和NC_xxxxxx的形形式來來表示示。dbEST——表表達序序列標標簽數(shù)數(shù)據(jù)庫庫,短短的、、單次次(測測序))閱讀讀的cDNA序序列。。也包包括來來自于于差異異顯示示和RACE實實驗的的cDNA序列列。dbGSS——基因因組調調查序序列的的數(shù)據(jù)據(jù)庫,,短的的、單單次((測序序)閱閱讀的的cDNA序列列,exontrap獲得得的序序列,,cosmid/BAC/YAC末端端,及及其他他。dbSTS序列標標簽位位點的的數(shù)據(jù)據(jù)庫,,短的的在基基因組組上可可以被被唯一一操作作的序序列,,用于于產生生作圖圖位點點。dbSNP——單單核苷苷酸多多態(tài)性性數(shù)據(jù)據(jù)庫,,包括括SNPs,小小范圍圍的插插入/缺失失,多多態(tài)重重復單單元,,和微微衛(wèi)星星變異異。完整的的基因因組參見下下面Genome和和Maps部分分,包包括各各種物物種資資源,,人,,小鼠鼠,大大鼠,,酵母母,線線蟲,,瘧原原蟲,,細菌菌,病病毒,,viroids,,質粒粒。瘧原蟲蟲UniGene被整理理成簇簇的EST和全全長mRNA序序列,,每一一個代代表一一種特特定已已知的的或假假設的的人類類基因因,有有定位位圖和和表達達信息息以及及同其其它資資源的的交叉叉參考考。序序列數(shù)數(shù)據(jù)可可以以以cluster形形式在在Unigene網網頁下下載,,完整整的數(shù)數(shù)據(jù)可可以從從FTP站站點repository/UniGene目目錄下下下載載。人類UniGene小鼠UniGene大鼠UniGene斑馬魚魚UniGeneBLAST將你的的序列列同核核酸庫庫中的的的序序列比比較,,檢索索相似似的序序列。。(更更詳細細的信信息見見下面面Tools/Sequence相似似搜索索部分分)BLAST查找BLAST指南蛋白序序列Entrez蛋蛋白——用用accessionnumber,作作者姓姓名,,物種種,基基因/蛋白白名字字,以以及很很多其其它的的文本本術語語來搜搜索蛋蛋白序序列記記錄((在GenPept+Swiss-Prot+PIR+RPF+PDB中中)。。更多多的關關于Entrez的的信息息見下下。如如果要要檢索索大量量數(shù)據(jù)據(jù),也也可使使用BatchEntrez((批量量Entrez)。。RefSeqNCBI數(shù)數(shù)據(jù)庫庫的參參考序序列。。Curated,非非冗余余集合合包括括基因因組DNAcontigs,已已知基基因的的mRNAs和和蛋白白,在在將來來,整整個的的染色色體。。Accessionnumbers用用NT_xxxxxx,NM_xxxxxx,NP_xxxxxx,和和NC_xxxxxx的的形式式來表表示。。FTPGenPept下載載““genpept.fsa.Z””文文件件,,這這個個文文件件包包含含了了從從GenBank/EMBL/DDBJ記記錄錄中中翻翻譯譯過過來來的的FASTA格格式式的的氨氨基基酸酸序序列列,,這這些些記記錄錄都都有有一一到到兩兩個個CDS特特性性的的描描述述。。完整整基基因因組組參見見下下面面Genome和和Maps部部分分,,包包括括各各種種物物種種資資源源,,人人,,小小鼠鼠,,大大鼠鼠,,酵酵母母,,線線蟲蟲,,瘧瘧原原蟲蟲,,細細菌菌,,病病毒毒,,viroids,,質質粒粒。。Entrez基基因因組組提供供了了一一個個編編碼碼區(qū)區(qū)的的概概要要和和各各種種物物種種的的分分類類表表((TaxTable))。。編編碼碼區(qū)區(qū)概概要要列列出出了了在在基基因因組組中中所所有有的的的的蛋蛋白白,,并并提提供供鏈鏈接接到到FASTA文文件件和和BLAST。。分分類類表表總總結結了了蛋蛋白白BLAST分分析析的的結結果果,,建建議議他他們們的的可可能能功功能能,,并并用用顏顏色色編編碼碼的的圖圖來來顯顯示示物物種種同同其其它它物物種種之之間間的的關關系系((參參見見下下面面'Genomes和和Maps,'部部分分Entrez基基因因組組的的一一般般描描述述))FTP基基因因組組蛋蛋白白從ftp站站點點的的genbank/genomes目目錄錄下下下下載載各各種種物物種種的的FASTA格格式式的的氨氨基基酸酸序序列列*.faa和和蛋蛋白白表表文文件件*.ptt。。參參見見readme文文件件。。蛋蛋白白表表也也可可以以在在Entrez基基因因組組中中看看到到。。PROWWeb上上的蛋白白資源,,關于大大約200種人人類的CD細胞胞表面分分子的簡簡短官方方向導。?;ハ鄼z檢索,為為每個CD抗原原提供大大約20中標準準信息的的分類((生化功功能,配配體,等等等)BLAST將你的序序列同蛋蛋白庫中中的的序序列比較較,檢索索相似的的序列。。(更詳詳細的信信息見下下面Tools/Sequence相似搜搜索部分分)BLASTp查找PSI-BLAST結構結構主頁——關于于NCBI結構小組組的一般信信息和他們們的研究計計劃,另外外也可以訪訪問分子模模型數(shù)據(jù)庫庫(MMDB)和用用來搜索和和顯示結構構的相關工工具。MMDB::分子模型型數(shù)據(jù)庫一個關于三三維生物分分子結構的的數(shù)據(jù)庫,,結構來自自于X-ray晶體體衍射和NMR色譜譜分析。MMDB是是來源于Brookhaven蛋白數(shù)數(shù)據(jù)庫(PDB)三三維結構的的一部分,,排除了那那些理論模模型。MMDB重新新組織和驗驗證了這些些信息,從從而保證在在化學和大大分子三維維結構之間間的交叉參參考。數(shù)據(jù)據(jù)的說明書書包括生物物多聚體的的空間結構構,這個分分子在化學學上是如何何組織的,,以及聯(lián)系系兩者的一一套指針。。利用將化化學,序列列,和結構構信息整合合在一起,,MMDB計劃成為為基于結構構的同源模模型化和蛋蛋白結構預預測的資源源服務。MMDBMMDB的的記錄以ASN.1格式存儲儲,可以用用Cn3D,Rasmol,或Kinemage來顯示。。另外,數(shù)數(shù)據(jù)庫中類類似的結構構已經被用用VAST確認,新新的結構可可以用VASTsearch來同數(shù)據(jù)據(jù)庫進行比比較。Cn3D“Seein3-D”,,一個用用于NCBI數(shù)據(jù)庫庫的結構和和序列相似似顯示工具具,它允許許觀察3-D結構和和序列—結結構或結構構—結構同同源比較。。Cn3D用起來就就象你瀏覽覽器上的一一個幫助工工具。VAST矢量同源比較較搜索工具一個在NCBI開發(fā)的計計算算法,用用于確定相似似的蛋白三維維結構。每一一個結構的““結構鄰居””都是預先計計算好的,而而且可以通過過MMDB的的結構概要頁頁面的鏈接訪訪問。這些鄰鄰居可以用來來確認那些不不能被序列比比較識別的遠遠的同源性。。VAST搜搜索—結結構—結構相相似搜索服務務。比較一個個新解出的蛋蛋白結構和在在MMDB/PDB數(shù)據(jù)據(jù)庫中的結構構的三維坐標標。VAST搜索計算一一系列可能會會被交互瀏覽覽的結構鄰居居,用分子圖圖形來觀察重重疊和同源相相似。分類類學學NCBI的的分分類類數(shù)數(shù)據(jù)據(jù)庫庫主主頁頁——關關于于分分類類計計劃劃的的一一般般信信息息,,包包括括分分類類資資源源和和同同NCBI分分類類學學家家合合作作的的外外部部管管理理者者的的列列表表。。分類類瀏瀏覽覽器器——搜搜索索NCBI的的分分類類數(shù)數(shù)據(jù)據(jù)庫庫,,包包括括大大于于70000個個物物種種的的名名字字和和種種系系,,這這些些物物種種都都至至少少在在遺遺傳傳數(shù)數(shù)據(jù)據(jù)庫庫中中有有一一條條核核酸酸或或蛋蛋白白序序列列。??煽梢砸詸z檢索索一一個個特特定定種種或或者者更更高高分分類類((如如屬屬,,科科))的的核核酸酸,,蛋蛋白白,,和和結結構構記記錄錄。。如如果果有有新新物物種種的的序序列列數(shù)數(shù)據(jù)據(jù)被被放放到到數(shù)數(shù)據(jù)據(jù)庫庫中中,,這這個個物物種種就就被被加加到到((分分類類))數(shù)數(shù)據(jù)據(jù)庫庫中中。。NCBI的的分分類類數(shù)數(shù)據(jù)據(jù)庫庫的的目目的的是是為為序序列列數(shù)數(shù)據(jù)據(jù)庫庫建建立立一一個個一一致致的的種種系系發(fā)發(fā)生生分分類類學學。。分類學學文獻數(shù)數(shù)據(jù)庫庫概要要PubMed—一一個關關于生生物醫(yī)醫(yī)藥科科學的的檢索索系統(tǒng)統(tǒng),包包括引引用,,摘要要,和和雜志志的索索引術術語。。它包包括直直接由由出版版商提提供給給NCBI的文文獻引引用以以及鏈鏈接到到在出出版商商網址址上的的全文文的URLs。。PubMed包包括MEDLINE和PREMEDLINE的的完整整內容容。它它還包包括一一些被被MEDLINE認認為超超出范范圍的的文章章和雜雜志,,(這這些文文章或或雜志志)由由于內內容或或在某某一時時期不不在索索引范范圍內內。因因此PubMed是是比MEDLINE的更更大的的集合合。雜志瀏瀏覽器器允許你你去查查找收收錄到到PubMed系統(tǒng)統(tǒng)的雜雜志的的名字字,MEDLINE的縮縮寫,,或ISSN號號碼。。PubRef((開發(fā)發(fā)中))—一一個個關于于來自自于廣廣大范范圍的的科學學雜志志的數(shù)數(shù)目記記錄,,和鏈鏈接到到出版版商網網址的的全文文。PubRef包包含了了PubMEd,加加上了了來自自其它它學科科的雜雜志出出版商商提供供的引引用和和摘要要。因因此它它是比比PubMed更大大的集集合。。這個個計劃劃的啟啟動是是因為為NAS要要求為為科學學領域域的電電子雜雜志提提供一一個““白皮皮書””服務務。PubMed中中心((開發(fā)發(fā)中))PubMed中中心是是一個個無障障礙的的NIH資資源,,用于于在生生命科科學領領域中中同業(yè)業(yè)互查查的基基礎研研究報報告。。從2000年年一月月開始始接受受雜志志文章章。所所有在在PubMed中心心的材材料將將由目目前任任一主主要的的摘要要和索索引服服務中中列出出的雜雜志提提供,,或者者在編編輯委委員會會中擁擁有3個以以上有有主要要資金金機構構的研研究經經費的的擁有有人的的雜志志提供供。PubMedOMIM:在線線人類類孟德德爾遺遺傳——經常更更新的的人類類基因因和遺遺傳失失調的的目錄錄,有有鏈接接到其其它相相關的的文獻獻參考考,序序列記記錄,,和相相關數(shù)數(shù)據(jù)庫庫。書籍同書籍籍出版版商合合作NCBI為為網絡絡改編編了教教科書書,并并把他他們鏈鏈接到到PubMed—生生物醫(yī)醫(yī)藥書書目數(shù)數(shù)據(jù)庫庫。這這是為為了給給PubMed提供供背景景信息息,這這樣使使用者者可以以探究究在PubMed搜搜索結結果中中不熟熟悉的的概念念。目目前收收錄的的書有有:MolecularBiologyoftheCell,3rded.AlbertsB.,BrayD.,LewisJ.,RaffM.,RobertsK.,WatsonJ.D.,1994,GarlandPublishing.外部鏈接接一個登記記服務,,用于建建立從在在Entrez中的特特定的文文章,雜雜志,或或生物數(shù)數(shù)據(jù)到外外部網址址的鏈接接。第三三方可以以提供
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 供應商選擇培訓
- 治安宣傳教育活動
- 1.2太陽對地球的影響(教學設計)高一地理同步高效課堂(人教版2019必修一)
- 信息技術(第2版)(拓展模塊) 教案 拓展模塊5 5.1 認識人工智能
- T-ZFDSA 21-2024 決明子燒茄子制作標準
- 高中物理第三章相互作用2彈力課件新人教版必修
- 如何利用市場營銷戰(zhàn)略打造企業(yè)競爭優(yōu)勢
- 部編版六年級語文上冊第七單元《伯牙鼓琴》教學課件
- 施工升降機安全教育講座
- 六年級上心理健康教育教案
- 2023譯林版新教材高一英語必修一全冊單詞默寫
- 物流配送的基本知識
- XX項目不動產權籍調查技術設計書
- 鋼筋混凝土結構水泥砂漿鋼筋網結構加固方案
- 集成電路測試課件
- 化工技術經濟學總概課件
- 公務用車外出派車單
- 家具行業(yè)安全事故應急救援預案w
- 胃食管反流病的外科手術適應癥及手術技巧課件
- 《合理用藥健康教育》課件
- 地下水資源過度開采課件
評論
0/150
提交評論