![生物信息數(shù)據(jù)庫檢索及其應用_第1頁](http://file4.renrendoc.com/view/be6ed515c3d391e56c36ca0a296e785b/be6ed515c3d391e56c36ca0a296e785b1.gif)
![生物信息數(shù)據(jù)庫檢索及其應用_第2頁](http://file4.renrendoc.com/view/be6ed515c3d391e56c36ca0a296e785b/be6ed515c3d391e56c36ca0a296e785b2.gif)
![生物信息數(shù)據(jù)庫檢索及其應用_第3頁](http://file4.renrendoc.com/view/be6ed515c3d391e56c36ca0a296e785b/be6ed515c3d391e56c36ca0a296e785b3.gif)
![生物信息數(shù)據(jù)庫檢索及其應用_第4頁](http://file4.renrendoc.com/view/be6ed515c3d391e56c36ca0a296e785b/be6ed515c3d391e56c36ca0a296e785b4.gif)
![生物信息數(shù)據(jù)庫檢索及其應用_第5頁](http://file4.renrendoc.com/view/be6ed515c3d391e56c36ca0a296e785b/be6ed515c3d391e56c36ca0a296e785b5.gif)
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
生物信息數(shù)據(jù)庫檢索及其應用第1頁,共106頁,2023年,2月20日,星期一提綱核酸數(shù)據(jù)庫核酸序列數(shù)據(jù)庫檢索入口核酸序列數(shù)據(jù)庫序列檢索ENTREZ的使用第2頁,共106頁,2023年,2月20日,星期一分子生物學數(shù)據(jù)庫的應用可以分為兩個主要方面數(shù)據(jù)庫查詢(databasequery)數(shù)據(jù)庫搜索(databasesearch)。第3頁,共106頁,2023年,2月20日,星期一數(shù)據(jù)庫查詢定義:是指對序列、結構以及各種二次數(shù)據(jù)庫中的注釋信息進行關鍵詞匹配查找。如:在蛋白質序列數(shù)據(jù)庫SwissProt中輸入關鍵詞insulin(胰島素),即可找出該數(shù)據(jù)庫所有胰島素或與胰島素有關的序列條目(Entry)第4頁,共106頁,2023年,2月20日,星期一數(shù)據(jù)庫檢索它和互聯(lián)網(wǎng)上通過搜索引擎(Searchengine)查找需要的信息是一個概念。是數(shù)據(jù)庫查詢的一種第5頁,共106頁,2023年,2月20日,星期一數(shù)據(jù)庫搜索定義:在分子生物信息學中有特定含義,它是指通過特定的序列相似性比對算法,找出核酸或蛋白質序列數(shù)據(jù)庫中與檢測序列具有一定程度相似性的序列。通過數(shù)據(jù)庫搜索,可以在序列數(shù)據(jù)庫中找出與該檢測序列(querysequence)具有一定相似性的序列。第6頁,共106頁,2023年,2月20日,星期一數(shù)據(jù)庫查詢、檢索和搜索在生物信息學中,數(shù)據(jù)庫搜索是專門針對核酸和蛋白質序列數(shù)據(jù)庫而言,搜索的對象,不是數(shù)據(jù)庫的注釋信息,而是序列信息數(shù)據(jù)庫查詢和數(shù)據(jù)庫搜索在生物信息學中是兩個完全不同的概念,所要解決的問題、所采用的方法和得到的結果均不相同第7頁,共106頁,2023年,2月20日,星期一核酸數(shù)據(jù)庫序列查詢系統(tǒng)GenBank
查詢檢索通過因特網(wǎng)上的序列查詢系統(tǒng)(Entrez)服務完成。NCBI的網(wǎng)址是:EMBL核酸序列數(shù)據(jù)庫
查詢檢索通過因特網(wǎng)上的序列提取系統(tǒng)(SRS)服務完成。
數(shù)據(jù)庫網(wǎng)址是:http://www.ebi.ac.uk/embl/。
SRS的網(wǎng)址是:http://srs.ebi.ac.uk/。DDBJ數(shù)據(jù)庫
使用主頁上提供的SRS工具進行數(shù)據(jù)檢索和序列分析,DDBJ的網(wǎng)址是:http://www.ddbj.nig.ac.jp/。第8頁,共106頁,2023年,2月20日,星期一序列數(shù)據(jù)庫檢索EMBL:(SequenceRetrievalSystem,SRS)NCBI:(Entrez)是NCBI為用戶提供整合的訪問序列、定位、分類、和結構數(shù)據(jù)的搜索和檢索系統(tǒng)。第9頁,共106頁,2023年,2月20日,星期一第10頁,共106頁,2023年,2月20日,星期一NCBI第11頁,共106頁,2023年,2月20日,星期一第12頁,共106頁,2023年,2月20日,星期一GenBank第13頁,共106頁,2023年,2月20日,星期一NCBI網(wǎng)站網(wǎng)址:第14頁,共106頁,2023年,2月20日,星期一GenBank數(shù)據(jù)庫是由美國國立生物技術信息中心(NCBI)維護的一級核酸序列數(shù)據(jù)庫。GenBank數(shù)據(jù)庫的數(shù)據(jù)來源有三種:1、直接來源于測序工作者提交的序列;2、與其它數(shù)據(jù)機構協(xié)作交換的數(shù)據(jù);3、美國專利局提供的專利數(shù)據(jù)。簡介第15頁,共106頁,2023年,2月20日,星期一檢索界面簡介1、基本檢索界面第16頁,共106頁,2023年,2月20日,星期一第17頁,共106頁,2023年,2月20日,星期一第18頁,共106頁,2023年,2月20日,星期一Nucleotide數(shù)據(jù)庫分為三個子數(shù)據(jù)庫:EST:表達序列標記數(shù)據(jù)庫GSS:基因組測序序列數(shù)據(jù)庫CoreNucleotide:包含所有未被以上兩個子數(shù)據(jù)庫收錄的核苷酸序列第19頁,共106頁,2023年,2月20日,星期一檢索界面簡介1、基本檢索界面2、跨庫檢索界面第20頁,共106頁,2023年,2月20日,星期一第21頁,共106頁,2023年,2月20日,星期一第22頁,共106頁,2023年,2月20日,星期一簡介檢索界面基本檢索功能(一)字段限制檢索、強制短語檢索(二)特殊標志符檢索(四)范圍檢索(三)序列長度檢索第23頁,共106頁,2023年,2月20日,星期一簡介檢索界面基本檢索功能(一)字段限制檢索、強制短語檢索第24頁,共106頁,2023年,2月20日,星期一第25頁,共106頁,2023年,2月20日,星期一第26頁,共106頁,2023年,2月20日,星期一ras第27頁,共106頁,2023年,2月20日,星期一第28頁,共106頁,2023年,2月20日,星期一ras[GENE]第29頁,共106頁,2023年,2月20日,星期一第30頁,共106頁,2023年,2月20日,星期一第31頁,共106頁,2023年,2月20日,星期一第32頁,共106頁,2023年,2月20日,星期一檢索限定詞:1、基因名稱的檢索限定詞:[GENE]or[GENENAME]2、生物體名稱的檢索限定詞:[ORGN]or[ORGANISM]3、作者姓名的檢索限定詞:[AUTH]or[AUTHOR]第33頁,共106頁,2023年,2月20日,星期一簡介檢索界面基本檢索功能(二)特殊標志符檢索(一)字段限制檢索、強制短語檢索第34頁,共106頁,2023年,2月20日,星期一特殊標志符的格式(核酸序列)
:1、序列辨認號(GI):一串阿拉伯數(shù)字
e.g.:19440733第35頁,共106頁,2023年,2月20日,星期一第36頁,共106頁,2023年,2月20日,星期一特殊標志符的格式(核酸序列)
:2、GenBank/EMBL/DDBJ序列接受號:
(1)1個字母+5個阿拉伯數(shù)字
e.g.:U12345(2)2個字母+6個阿拉伯數(shù)字
e.g.:AY123456,Af1234561、序列辨認號(GI):一串阿拉伯數(shù)字
e.g.:19440733第37頁,共106頁,2023年,2月20日,星期一第38頁,共106頁,2023年,2月20日,星期一(1)mRNA記錄(NM_*):e.g.:NM_000492(2)基因組的DNA重疊群(NT_*):e.g.:NT_000347(3)完整的基因組或染色體(NC_*):e.g.:NC_000907(4)基因組的局部區(qū)域(NG_*):e.g.:NG_000019(5)從人類基因組注釋、加工得到的序列模型(XM,XP,orXR_*):
e.g.:XM_000483特殊標志符的格式(核酸序列):3、RefSeq(ReferenceSequence)序列接受號:第39頁,共106頁,2023年,2月20日,星期一第40頁,共106頁,2023年,2月20日,星期一特殊標志符的格式(核酸序列):4、PDB序列接受號:1個阿拉伯數(shù)字+3個字母
e.g.:1TUP序列接受號的檢索限定詞為[ACCN]or[ACCESSION]第41頁,共106頁,2023年,2月20日,星期一簡介檢索界面基本檢索功能(一)字段限制檢索、強制短語檢索(二)特殊標志符檢索(三)序列長度檢索第42頁,共106頁,2023年,2月20日,星期一序列長度的檢索限定詞:[SLEN]1510[SLEN]第43頁,共106頁,2023年,2月20日,星期一第44頁,共106頁,2023年,2月20日,星期一簡介檢索界面基本檢索功能(一)字段限制檢索、強制短語檢索(二)特殊標志符檢索(四)范圍檢索(三)序列長度檢索第45頁,共106頁,2023年,2月20日,星期一范圍檢索:中間用冒號連接1、序列接受號范圍檢索:
AF114696:AF114714[ACCN]2、序列長度范圍檢索:
3000:4000[SLEN]3、日期范圍檢索:
2005/01:2006/09/26[MDAT]or[PDAT]第46頁,共106頁,2023年,2月20日,星期一簡介檢索界面基本檢索功能特征欄輔助檢索限制檢索(Limits)索引檢索(Preview/Index)檢索史管理(History)剪貼板管理(Clipboard)詳細匹配過程(Details)第47頁,共106頁,2023年,2月20日,星期一第48頁,共106頁,2023年,2月20日,星期一第49頁,共106頁,2023年,2月20日,星期一限制檢索檢索史管理預檢索/索引檢索剪貼板管理詳細匹配過程第50頁,共106頁,2023年,2月20日,星期一第51頁,共106頁,2023年,2月20日,星期一限制檢索包含其余四種檢索第52頁,共106頁,2023年,2月20日,星期一第53頁,共106頁,2023年,2月20日,星期一簡介檢索界面基本檢索功能特征欄輔助檢索限制檢索(Limits)第54頁,共106頁,2023年,2月20日,星期一第55頁,共106頁,2023年,2月20日,星期一限制檢索范圍第56頁,共106頁,2023年,2月20日,星期一限制檢索范圍第57頁,共106頁,2023年,2月20日,星期一排除某種類型的序列限制分子類型第58頁,共106頁,2023年,2月20日,星期一限制分子類型第59頁,共106頁,2023年,2月20日,星期一
限制基因位點第60頁,共106頁,2023年,2月20日,星期一
限制基因位點第61頁,共106頁,2023年,2月20日,星期一限制序列片段的顯示第62頁,共106頁,2023年,2月20日,星期一限制序列片段的顯示第63頁,共106頁,2023年,2月20日,星期一限制數(shù)據(jù)來源第64頁,共106頁,2023年,2月20日,星期一限制數(shù)據(jù)來源第65頁,共106頁,2023年,2月20日,星期一限制數(shù)據(jù)發(fā)布日期第66頁,共106頁,2023年,2月20日,星期一限制數(shù)據(jù)發(fā)布日期第67頁,共106頁,2023年,2月20日,星期一限制數(shù)據(jù)修訂日期第68頁,共106頁,2023年,2月20日,星期一限制數(shù)據(jù)修訂日期第69頁,共106頁,2023年,2月20日,星期一簡介檢索界面基本檢索功能特征欄輔助檢索限制檢索(Limits)索引檢索(Preview/Index)第70頁,共106頁,2023年,2月20日,星期一第71頁,共106頁,2023年,2月20日,星期一第72頁,共106頁,2023年,2月20日,星期一索引檢索輸入框第73頁,共106頁,2023年,2月20日,星期一第74頁,共106頁,2023年,2月20日,星期一第75頁,共106頁,2023年,2月20日,星期一第76頁,共106頁,2023年,2月20日,星期一序列特性關鍵詞索引第77頁,共106頁,2023年,2月20日,星期一第78頁,共106頁,2023年,2月20日,星期一簡介檢索界面基本檢索功能特征欄輔助檢索限制檢索(Limits)索引檢索(Preview/Index)檢索史管理(History)第79頁,共106頁,2023年,2月20日,星期一第80頁,共106頁,2023年,2月20日,星期一簡介檢索界面基本檢索功能特征欄輔助檢索限制檢索(Limits)索引檢索(Preview/Index)檢索史管理(History)剪貼板管理(Clipboard)第81頁,共106頁,2023年,2月20日,星期一第82頁,共106頁,2023年,2月20日,星期一第83頁,共106頁,2023年,2月20日,星期一第84頁,共106頁,2023年,2月20日,星期一簡介檢索界面基本檢索功能特征欄輔助檢索限制檢索(Limits)預檢索/索引檢索(Preview/Index)檢索史管理(History)詳細匹配過程(Details)剪貼板管理(Clipboard)第85頁,共106頁,2023年,2月20日,星期一第86頁,共106頁,2023年,2月20日,星期一第87頁,共106頁,2023年,2月20日,星期一簡介檢索入口基本檢索功能特征欄輔助檢索檢索結果的顯示第88頁,共106頁,2023年,2月20日,星期一第89頁,共106頁,2023年,2月20日,星期一第90頁,共106頁,2023年,2月20日,星期一第91頁,共106頁,2023年,2月20日,星期一第92頁,共106頁,2023年,2月20日,星期一GenBank記錄中特性表中的主要關鍵詞:關鍵詞解釋關鍵詞解釋misc_feature生物學特性無法用特性表關鍵詞描述的序列promoter轉錄起始區(qū)misc_difference序列特性無法用特性表關鍵詞描述的序列CAAT_signal真核啟動子上游的CAAT盒,與RNA結合相關conflict同一序列在不同的研究中在位點或區(qū)域上有差異TATA_signal真核啟動子的TATA盒unsure序列不能確定的區(qū)域-35_signal原核啟動子中的-35框old_sequence該序列對以前的版本做過修訂-10_signal原核啟動子的Pribow盒variation包含穩(wěn)定突變的序列GC_signal真核啟動子的GC盒modified_base修飾過的核苷酸RBS核糖體結合位點gene已識別為基因或已命名的序列區(qū)域polyA_signalRNA轉錄本的剪切識別位點misc_signal無法用信號特性關鍵詞描述的信號序列enhancer增強子第93頁,共106頁,2023年,2月20日,星期一關鍵詞解釋關鍵詞解釋attenuator與轉錄終止有關的序列CDS蛋白質編碼序列terminator轉錄終止序列sig_peptide編碼信號肽的序列rep_origin雙鏈DNA復制起始區(qū)transit_peptide轉運蛋白編碼序列misc_RNA無法用RNA關鍵詞描述的轉錄物或RNA產物mat_peptide編碼成熟肽的序列prim_transcript初始轉錄本intron內含子precursor_RNA前體RNApolyA_siteRNA轉錄本的多聚腺苷酸化位點mRNA信使RNArRNA核糖體RNA5’clip前體轉錄本中被剪切掉的5’端序列tRNA轉運RNA3’clip前體轉錄本中被剪切掉的3’端序列scRNA小細胞質RNA5’UTR5’非翻譯區(qū)snRNA小核RNA3’UTRexon3’非翻譯區(qū)外顯子snoRNA加工和修飾rRNA的小核RNA第94頁,共106頁,2023年,2月20日,星期一關鍵詞解釋關鍵詞解釋immunoglobulin_relatedrepeat_unit單個的重復元件C_region免疫相關蛋白上的不變區(qū)LTR長末端重復序列D_segment免疫球蛋白重鏈的可變區(qū),T細胞受體β鏈Satellite衛(wèi)星重復序列J_segment免疫球蛋白重鏈、輕鏈以及T細胞α、β、γ的結合鏈misc_binding無法描述的核酸序列結合位點N_region插入重排免疫球蛋白片段間的核苷酸primer_bind復制、轉錄的引物結合位點S_region免疫球蛋白重鏈的開關區(qū)protein_bind蛋白質結合區(qū)V_region編碼免疫球蛋白的可變區(qū)N末端的序列STS測序標簽位點V_segment編碼免疫球蛋白的可變區(qū)的序列misc_recomb無法用重組特性關鍵詞描述的重組事件repeat_region基因組中所包含的重復序列iDNA通過重組所消除的DNA第95頁,共106頁,2023年,2月20日,星期一關鍵詞解釋關鍵詞解釋misc_structure無法用結構關鍵詞描述的核酸序列高級結構或構型stem_loop發(fā)夾結構D_loop線粒體中DNA中的取代環(huán)GenBank記錄中特性表中的限定詞:限定詞含義限定詞含義/allele=給定基因的等位基因/codon_start=相對于序列第一個堿基,編碼序列密碼子的偏移量/bound_moiety=嵌合范圍/country=DNA樣本的來源國/cell_type=獲得序列的細胞類型/db_xref=其他數(shù)據(jù)庫信息的交叉索引號/citation=已被引用的參考文獻數(shù)/direction=DNA復制方向/clone_lib=獲得序列的克隆文庫/environmental_sample=序列直接從環(huán)境材料中獲得而沒有指明來源物種第96頁,共106頁,2023年,2月20日,星期一限定詞含義限定詞含義/exception=指明DNA序列未按通常的生物學規(guī)律翻譯,如RNA編輯/PCR_conditi-ons=描述PCR的反應條件/frequency=在種群中發(fā)生變異的頻率/pop_variant=獲得序列的群體變異種名稱/germline如果序列是DNA并來源于免疫球蛋白家族,則表示該序列來源于未重排DNA/product=序列編碼產物的名稱/insertion_seq=序列來源于某種插入元件/anticodon=tRNA反義密碼子的位置及它所編碼的氨基酸/isolate=序列來源的生物個體/cell_line=獲得序列的細胞系/lab_host=為擴增序列來源物種所用的實驗室宿主/chromosome=獲得序列的染色體/macronuclear指明DNA來源于染色體分化的大核期/clone=獲得序列的克隆子/note=評論及附加信息/codon=指出與參考密碼子不同的密碼子/organelle=獲得序列的細胞器/EC_number=序列產物的酶學編號第97頁,共106頁,2023年,2月20日,星期一限定詞含義限定詞含義/cons_splice=區(qū)分內含子剪切位點和“5‘-GT.AG-3'”剪切位點/map=相關特性在基因圖譜上的位置/cultivar=所獲序列植物的栽培變種/mod_base=被修飾堿基的簡寫/dev_stage=序列來源于某種生物的特定發(fā)育階段/number=從5’→3’注明遺傳元件的順序/evidence=序列特性來源于實驗還是推理/organism=提供測序用遺傳物質的物種的科學名稱/focus指出在記錄中的來源特性在其他物種中還有不同的來源特性/phenotype=序列特性所導致的表型/function=序列所代表的功能/plasmid=獲得序列的質粒名稱/haplotype=序列來源于某種物種的單倍體/protein_id=蛋白質的檢索號/isolation_sou-rce=描述序列來源物種的生理、環(huán)境和地理信息/proviral整合在基因組中的前病毒/label=序列特性的俗名/rearranged如果序列是DNA并來源于免疫球蛋白家族,則表示該序列來源于重排DNA第98頁,共106頁,2023年,2月20日,星期一限定詞含義限定詞含義/rpt_family=重復序列/transposon=轉座子/rpt_unit=指明重復區(qū)域的重復元件構成/variety=獲得序列的生物變種/serotype=同一物種的不同血清學特征/pseudo假基因/sex=獲得序列的物種性別/replace=表明特性間的間隔序列已被替換/specimen_vou-cher=指明來源物種保存于什么地方/rpt_type=重復序列的組織方式/strain=獲得序列的菌珠/sequenced_m-ol=獲得序列的分子類型/sub_species=獲得序列的來源物種的亞種/serovar=同一原核生物的血清學特征/tissue_lib=獲得序列組織庫/specific_host=獲得序列的天然宿主/transgenic指明物種的來源特性是否是轉基因受體/standard-name=特性的通用名稱/transl_except=標明序列中未按指定密碼子表翻譯的氨基酸的位置/sub_clone=獲得序列的亞克隆第99頁,共1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 農莊租地或轉讓合同范本
- 傳媒工作室合伙合同范本
- 光伏安裝居間合同范例
- 2025-2030年中國鹽酸卡比佐卡因項目投資可行性研究分析報告
- 企業(yè)工裝裝修合同范本
- 2025年度建筑水電安裝工程知識產權保護合同范本
- 包運租船租賃合同范例
- 2025年度建筑幕墻工程玻璃幕墻玻璃制品采購合同范本
- 企業(yè)白領轉餐飲合同范例
- 2025年中國情侶裝市場全景評估及投資規(guī)劃建議報告
- 新員工入職通識考試(中軟國際)
- 四星級酒店工程樣板房裝修施工匯報
- 圓翳內障病(老年性白內障)中醫(yī)診療方案
- 中考物理復習備考策略
- 博士后進站申請書博士后進站申請書八篇
- 小報:人工智能科技科學小報手抄報電子小報word小報
- GB/T 41509-2022綠色制造干式切削工藝性能評價規(guī)范
- 公安系防暴安全03安檢
- 孫權勸學教案全國一等獎教學設計
- 企業(yè)生產現(xiàn)場6S管理知識培訓課件
- 五年級下冊數(shù)學課件 第10課時 練習課 蘇教版(共11張PPT)
評論
0/150
提交評論