文獻檢索與數(shù)據收集_第1頁
文獻檢索與數(shù)據收集_第2頁
文獻檢索與數(shù)據收集_第3頁
文獻檢索與數(shù)據收集_第4頁
文獻檢索與數(shù)據收集_第5頁
已閱讀5頁,還剩93頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

EST信息檢索及常用數(shù)據庫石河子大學動物科技學院賈斌功能分類及代謝途徑分析目標基因的分析及應用cDNA文庫的構建隨機挑取克隆進行5’或3’端測序序列前處理聚類和拼接EST數(shù)據注釋分析平臺的構建文獻檢索與數(shù)據收集數(shù)據公布,形成文章主要內容文獻檢索常用的文獻檢索數(shù)據庫文獻管理常用的EST數(shù)據庫實踐EST信息檢索與常用數(shù)據庫一、文獻檢索EST信息檢索與常用數(shù)據庫1.1文獻檢索方法檢索工具法追溯法分段法文獻檢索1.2檢索途徑文獻檢索途徑是指通過何種特征來進行檢索。如著者、出版年份、關鍵詞等。檢索工具中對文獻不同特征進行標識而編制的各種索引,給檢索者提供了各種檢索途徑。例如,在PubMed中,就有著者途徑,文獻名稱途徑、主題途徑等等;文獻檢索1.3文獻檢索步驟(參考)分析課題,明確檢索目標和范圍;選擇檢索工具;選擇檢索手段和檢索方法;選擇檢索途徑,確定檢索標識;查找文獻,獲取原始文獻。文獻檢索二、一些常用的文獻檢索數(shù)據庫EST信息檢索與常用數(shù)據庫2.1中文文獻全文數(shù)據庫數(shù)據庫文獻年限網址瀏覽器中國期刊網全文數(shù)據庫(CJFD)1994http:///index.htmCajViewer,AcrobatReader維普全文期刊數(shù)據庫1989/index.asp維普瀏覽器AcrobatReader萬方數(shù)據資源系統(tǒng)依各期刊而定http://AcrobatReader常用文獻數(shù)據庫2.2外文文獻檢索PubMed(http:///entrez/query.fcgi?db=PubMed

)MEDLINE(/

)ScholarGoogle(/

)ISIwebofknowledge()常用文獻數(shù)據庫PubMedPubMed是美國國家醫(yī)學圖書館(NLM)開發(fā)的基于網絡服務的查詢系統(tǒng),可以免費查詢MEDLINE、OLDMEDLINE、PREMEDLINE以及其他相關的數(shù)據庫,截至到2013年11月,PubMed中共收錄了23,772本期刊雜志,包括了二千七百多萬的生物學和醫(yī)學文獻,最早的文獻可以追溯到上世紀50年代。PubMed中包括了這些文獻的一些全文鏈接或者其他的一些信息。

主頁外文文獻檢索PubMedservicesJournalsDatabase

MeshDatabaseSingleCitationMatcher

BatchCitationMacherClinicalQueries

LinkOutMyNCBI(Cubby)外文文獻檢索PubMed附加菜單欄LimitsPreview/IndexHistoryClipboardDetails外文文獻檢索【實例1】

檢索最新的關于人類EST應用的綜述性文獻。外文文獻檢索PubMed顯示方式(Display)Summary(go)BriefAbstractCitationMEDLINE外文文獻檢索三、文獻管理EST信息檢索與常用數(shù)據庫ReferenceManager

(以此軟件為例簡單講解實際使用方法,它將使論文寫作中參考文獻的使用和插入十分方便。)

EndNote/EndNoteWeb

(也將以此軟件為例講解實際使用方法,它將使論文寫作中參考文獻的使用和插入十分方便。)ProCite

http://www.adeptscience.co.uk/index.html文獻管理四、常用的EST數(shù)據庫EST信息檢索與常用數(shù)據庫DatabaseURL備注dbESThttp:///dbEST/index.html綜合UniGenehttp:///entrez/query.fcgi?db=unigene綜合TigrGeneIndiceshttp:///tdb/tgi/綜合AllGeneshttp://人和老鼠dbCFC

http://cytokine.medic.kumamoto-u.ac.jp/脊椎動物信號轉導相關KazusaDNAresearchinstitutehttp://www.kazusa.or.jp/ja2003/english/index.html藻類及擬南芥

MAGEST

http://www.genome.jp/magest/海鞘類NEMBASE

http://nema.cap.ed.ac.uk/nematodeESTs/nembase.html寄生蟲Mendel-ESTs

http://www.mendel.ac.uk/植物ApiDots

http:///apidots/頂復門(Apicomplexan

)EASED

http://eased.bioinf.mdc-berlin.de/選擇性剪切相關PEDEhttp://pede.dna.affrc.go.jp/豬常用的EST數(shù)據庫其他相關數(shù)據庫DatabaseURL備注核酸數(shù)據庫NCBI(nt,nr)ftp:///blast/db/FASTA/綜合性數(shù)據庫EMBL-EBIhttp://www.ebi.ac.uk/databases/index.html綜合性數(shù)據庫DDBJhttp://www.ddbj.nig.ac.jp/綜合性數(shù)據庫TIGRhttp:///綜合性數(shù)據庫基因組GDBhttp://人類基因組相關蛋白質InterPro

http://www.ebi.ac.uk/interpro/蛋白質家族、結構域和功能位點KEGGhttp://www.genome.jp/kegg/代謝途徑GOhttp://分子功能、生物過程、細胞組分常用的EST數(shù)據庫4.1dbESTdbEST是目前最大的一個公共功能性序列數(shù)據庫,是由NCBI于1992年開發(fā)的專門用于收集各個研究組織遞交的EST數(shù)據。直到2010年11月,該數(shù)據庫中已有1976個物種的EST數(shù)據231,275,705條,其中人的EST約有1700萬條,小鼠的EST1200多萬條。下面我們以一個具體的例子來說明如何從dbEST數(shù)據庫中收集我們想要的數(shù)據。常用的EST數(shù)據庫【實例2】在dbEST數(shù)據庫中搜索并保存有關人的EST序列步驟如下:

1、搜索人類的EST序列(圖示):

2、保存我們所需要的信息(圖片)常用的EST數(shù)據庫4.2EST序列的遞交向dbEST中遞交EST數(shù)據

E-mail遞交(需要一定的格式)實驗證實具有生物學功能的EST序列

BankIt、Sequin更多介紹參考網頁:/Genbank/submit.html

常用的EST數(shù)據庫4.2.1EST序列的E-mail遞交序列數(shù)據的遞交必須包括4個文件:Publication、Library、Contact以及EST。圖譜數(shù)據的遞交也包括4個文件:Publication、Contact、Method和MapData。文件組織好以后,發(fā)送郵件到batch-sub@就可以完成遞交。

常用的EST數(shù)據庫EST數(shù)據的更新EST數(shù)據的更新與數(shù)據的遞交類似,只要修改數(shù)據文件中的信息(除了EST#和CONT_NAME),然后把STATUS內容改為“Update”而不是“New”。對Publication、Contact、源數(shù)據、EST#或者CONT_NAME所做的修改必須發(fā)送郵件到batch-sub@并闡明原因。最后把修改后的文件發(fā)送到batch-sub@就可以完成更新。

常用的EST數(shù)據庫4.2.2具有生物學功能的EST序列的遞交BankIt http:///BankIt/Sequin

/sequin/ http:///Sequin/download/seq_download.html

常用的EST數(shù)據庫4.3UniGene為了解決冗余和重疊的問題,NCBI的科學家們開發(fā)了UniGene數(shù)據庫。UniGene自動地把GenBank中的序列分類,變成一個非冗余的序列集,而這樣的一個序列集就代表了一個基因。已有66個物種的927,817條記錄存在于UniGene中,其中最多的三個物種是人、水稻和小鼠,分別為:54,576,44,394和43,104。常用的EST數(shù)據庫UniGene的查詢UniGene的查詢方式與PubMed類似可以采用關鍵詞、基因名稱、物種名稱、核酸及蛋白的accession號、組織等進行查詢;可以在查詢框中直接輸入這些檢索式,也可以采用“Preview/Index”進行高級檢索。

常用的EST數(shù)據庫【實例3】查詢在人的腦組織中表達的UniGene

步驟如下:(圖示)點擊附加菜單欄中的“Preview/Index”按鈕,在下拉框中選擇“Tissue”,在隨后的文本框中輸入“brain”,點擊“AND”;繼續(xù)在下拉框中選擇“Organism”,在隨后的文本框中輸入“human”,點擊“AND”;點擊查詢框后面的“Go”遞交查詢條件就得到我們所需要的UniGene的多條記錄。常用的EST數(shù)據庫一條完整的UniGene記錄包括:URL

類似的序列(與UniGene中的其他具有表達產物的序列進行比較得出);

基因表達情況(包括組織表達情況、表達水平(Profile)、GEO水平、NLAIII標簽、SAU3A標簽等);

圖譜信息(即該基因在染色體上的定位信息以及STS的信息等);

序列(包括mRNA序列和EST序列)。

您可以把這些序列下載到本地,但是需要選擇您的操作環(huán)境:Unix、PC或者Mac,然后點擊“Downloadsequences”按鈕,就可以得到全部的序列。常用的EST數(shù)據庫 在UniGene的一條記錄中還有一些特殊的標識,其代表的意義如下:

P

經過翻譯后,與已知蛋白有相似性

A

具有PolyA信號

S

該序列在這個基因簇中的匹配不是很理想

M

該克隆是一個推測的全長CDS常用的EST數(shù)據庫【實例1】檢索最新的關于人類EST應用的綜述性文獻。

/entrez/query.fcgi?db=PubMed【實例2】在dbEST數(shù)據庫中搜索并保存有關雞(gallus

gallus)的EST序列。

【實例3】查詢在人的腦組織中表達的UniGene http:///entrez/query.fcgi?db=unigene

EST信息檢索與常用數(shù)據庫實踐回顧Theend!Publication文件

【實例】:

TYPE:Pub MEDUID:92347897 TITLE: ExpressedsequencetagsandchromosomallocalizationofcDNAclonesfromasubtractedretinalpigmentepitheliumlibrary AUTHORS:

Gieser,L.;Swaroop,A. JOURNAL:Genomics VOLUME:13 ISSUE:2 PAGES:873-6 YEAR:1992 STATUS:4 ||Publication文件項目名稱大寫,后面跟上“:”1表示文章沒有發(fā)表;2表示文章已被接收;3表示文章正在印刷中;4表示文章已經發(fā)表

Library文件

【實例】:

TYPE:Lib NAME:RatLambdaZapExpressLibrary ORGANISM:Rattus

norvegicus STRAIN:Sprague-Dawley SEX:male STAGE:embryonicday17post-fertilization TISSUE:aorta CELL_TYPE:vascularsmoothmuscle DESCR: ||不能多于48個字符

Contact文件

【實例】:

TYPE:Cont NAME:SikelaJM FAX:3032707097 TEL:303270 EMAIL:tjs@ LAB:DepartmentofPharmacology INST:UniversityofColoradoHealthSciencesCenter ADDR:BoxC236,4200E.9thAve.,Denver,CO80262- 0236,USA ||EST文件【實例】:TYPE:ESTSTATUS:NewCONT_NAME:KerlavageAREST#:EST00001CLONE:HHC189SOURCE:ATCCSOURCE_INHOST:65128OTHER_EST:EST00093,EST000101CITATION:ComplementaryDNAsequencing:expressedsequencetagsandhumangenomeprojectSEQ_PRIMER:M13ForwardP_END:5'HIQUAL_START:1HIQUAL_STOP:285DNA_TYPE:cDNALIBRARY:Hippocampus,Stratagene(cat.#936205)PUBLIC:PUT_ID:Actin,gamma,skeletalCOMMENT:Thisisacommentaboutthesequence.Itmayspanseverallines.SEQUENCE:AATCAGCCTGCAAGCAAAAGATAGGAATATTCACCTACAGTGGGCACCTCCTTAAGAAGCTGATAGCTTGTTACACAGTAATTAGATTGAAGATAATGGACACGAAACATATTCCGGGATTAAACATTCTTGTCAAGAAAGGGGGAGAGAAGTCTGTTGTGCAAGTTTCAAAGAAAAAGGGTACCAGCAAAAGTGATAATGATTTGAGGATTTCTGTCTCTAATTGGAGGATGATTCTCATGTAAGGTTGTTAGGAAATGGCAAAGTATTGATGATTGTGTGCTATGTGATTGGTGCTAGATACTTTAACTGAGTATACGAGTGAAATACTTGAGACTCGTGTCACTT||EST序列的遞交“new”(表示是新的序列)或者“update”(表示對原有序列記錄的修改)

默認為cDNA,可省略序列每行不能多于60個字符在更新EST記錄的時候,只有EST文件可以修改。與Publication文件中的TITLE內容一致與Library文件中的NAME內容一致與Contact文件中的NAME內容一致Method文件【實例】 TYPE:Meth NAME:YAC/CEPHJMS ORGANISM:Homosapiens ABSOLUTE:n L1:plate L2:row L3:column L4:comment L5:comment L6:comment L7:comment DESCR: PCR-basedmappingof3'UT

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論