NCBI上下載基因序列_第1頁
NCBI上下載基因序列_第2頁
NCBI上下載基因序列_第3頁
NCBI上下載基因序列_第4頁
NCBI上下載基因序列_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、、NCBI上下載基因序列、mRNA、CDS序列的方法1.打開NCBI網(wǎng)站,第一個(gè)框選擇Gene,第二個(gè)框輸入基因名稱,如ALK基因,點(diǎn)擊Search。2 .進(jìn)入第二頁面后,會(huì)看到如下一系列跟ALK基因相關(guān)的信息,根據(jù)description和location的信息,找到自己需要的基因。空色框中表示的是物種,我需要的是人類的基因,故選擇第一個(gè)。點(diǎn)擊ALK進(jìn)入下一個(gè)頁面。Searchresults1to20Of2G61Page|of133Next>Last»Sealso73di&Qpntinud。匚目plaEaditeq昆Mame/GeneIDDescriptionLocat

2、ionAliasesMIMALKanapIssticlmphomareceptort.rosineChromosome2NC_DOQCi02112CD246,NBLST3105590ID:2理kinaseHomosapiens(humanrt(plement)AkanaplasticlymphomakinaseMusChromosome17NC_OOOOB3.6CD246,TeriID:1162fniisculusI'housemouse)7136893&.72604643complementIAikAnaplasticI'/mphoFnakiraseChromc>

3、;5oiTie2RNT_033778.4DmeLCG8250ALK,CG&25O,DAIkID:53425Drosophild(fruitfly)(1662529J1664D011.ccmpteTent)DAI畫DmelCG8250.alk:dALK,mili3 .進(jìn)入后,會(huì)看到以下關(guān)于ALK基因的詳細(xì)信息:WNCBIResouiresLdHowloEGeneAdvancedOfficialSynbalOfficialFullNamePrirnsiysourceSei*lekledGenetypeRefSeqstatusOrgani&mLinageAlsoknownasFulR

4、fepurtALKanaplasticlymphomareceptortyrosinekinaseHomosapiens(human)GeneID.23&updateddhE-Dec-2口伯工SummarvALK.w_匚hgh匚anajlct5lclrnphomsreceptortyrosinekinasel-三八二HGHCH3NC427EnsemblEHSGD000Q1門口&4MM10559P.VaCTTHUMG口0000152(04proteinsdin©REYIEVDHumo專apiersElikar,?ts:MetasQ'ChordataCrmni凱a

5、;'edelrrats,ElX目eoatQrniMammalia'Eutheria;EuarhcntoglireE:Ptimates;Hjplorrtin-CgtaTrhiniHominidee'HpniCCD24&NBLST3SumtifiaryHiisgenoencodesafMopto*tyrosinekinaco.vihichbobing&tothorulinroceptorcuporfnnilyThicproioineemprisotanCKtracalimardomain,anhydrophobicdratchcorreaporidingto

6、asing出臺(tái)asutransnriBTibaneregion,andanintrscdlLilar«in白dnm31rLitpiny*arimportanlrobinthedc.lpmentofthebrainarditeeffeexrtndnori彌rdimniJzinHhonnrviTHKiufeKoeiThienon口hnnKoenfriiindtnhorn=rronnrwHImutatoHeiamrilifiidrlinaerarmc:nfIiiieeire;inr-hudlinni±anii2nloic.lhrlarniirdll這些信息可以略過,往下查看,點(diǎn)擊

7、下圖紅色框中的SeeALKinGenomeDataViewer,進(jìn)入下個(gè)頁面。GenomiccontextLocRtinn:?p"?-p23"Sign!nin仲C&4而1且融SfibS閆Ideogramw*-BHsErrrnr-n用IB”0H§flufl-WSMOnK33SfALKin®Tnina左相war卡的artxonccuni:29ArinoUrtionreleaseStilusAssemblyChTILb用好wscurremtGR2h38p7(GCF_DOMXMdCGi2NC_000002.12P91927742592161tFcompl

8、ement)lOf.嚴(yán)八c豚asenhb.,GRcwea(omom40%闔NCJMmX/11(;M15fi403niJJ477cf>mplpmFnt)4 .進(jìn)入后會(huì)看到如下頁面,GenomeDataViewerHomo的*"apchup#但上嶼ctrancjkmm曉*昨».i2m-»fPick|卜jduckxh*區(qū)典;加64髀;Loclk>nft?,Qii甘晨UCS#guen»NCH期昵IN20.1m.m7昆KI劇1將鼠標(biāo)箭頭放在圖中紅色框中的綠色線上2-5秒,不用點(diǎn)擊。會(huì)看到下面的界面:(有些基因會(huì)出現(xiàn)好幾個(gè),根據(jù)自己的要求選擇)力麗ALC

9、Gene:ALKTitle:己n1api/或icI'mptionidrectortyr口si而kinaseLocatiofi:conipleinent(29fl92,774.-29321總11】Length:726.83SMergedfeatures:lNP.omz95Nand川E_0043OT.4|Ekrnmload:nF0H29EZNMD43Q4WMBankVigw:7匚叫OCO2J2f29J%774.2962LGD個(gè)沖?丈婚1sKesiNCBIHomosapiensAnnotationSelease1022016-CS-07FJSTAView:QUOQQQQNJ?1§2

10、774-鼻79211工工;LOC1319293B6.?_939920.2IHHH_I?KJJ33L2H>1城與四9空之H-lK?_?3992-».2HI>R_?3992,2H-l索_?44夕苻4IH淋!尸3弟2二衛(wèi)附t<?_339926.2MRH7SL516P第一個(gè)紅色框中:NP004295.2表示蛋白質(zhì)序列,NP代表蛋白質(zhì),004295是編號(hào),后面的.2代表更新狀態(tài),數(shù)值越大,版本越新。NM004304.4表示mRNA序列,NM表示mRNA,004304是編號(hào),后面的.4代表更新狀態(tài),數(shù)值越大,版本越新。第二個(gè)紅色框中:CCDS33172.1表示CDS序歹U,CC

11、DS表示CDS命名規(guī)則同上。第三個(gè)紅色框中:Links&ToolsBLASTGenomic:HC(JQ0小四支,142,774.229116:LU配4gNP_0ai2?4457.iTHP_0SS&1S19.LTXP_013W121TXF_0a5712167.1THPJSK2C4S2B1ViewrGenelD:2濯1viewhigmc:的VIfwMIM:105500NC000002.12(29,192,774.29,921,611)表示完整的基因序列,NC表示基因組。括號(hào)中的數(shù)字表示這個(gè)基因的堿基長度,從29,192,774bp到29,921,611bp。要下載蛋白序列、mRNA

12、序列、CDS序列、基因序列,直接點(diǎn)擊紅色框中的鏈接即可。5 .這里下載基因序列,點(diǎn)擊后出現(xiàn)如下界面:點(diǎn)擊右邊的Send予completerecord-mfile>format(有好幾種格式)一次CreateFile。常用的是FASTA格式和GenBank格式。GenBank格式保存的信息更全面。"NCBIResourcesHowTo®至此就把ALK基因的序列下載了。二.幾種代號(hào)的意思ACCESSION是NCBI序列數(shù)據(jù)中瑁常用到箱號(hào)(另一個(gè)是03ACCES印。N形式為CC#.其中CC為兩個(gè)字母,其不同組合又可以區(qū)分為蛋白序列、核酸序列或基因蛆序列,而亡腿;ACCESS

13、ION后面又會(huì)力賑本片,以CC產(chǎn)用.若形式表示,aSOT尾數(shù)遞增表示序信息底之前的版本有所修改.這祥ACCESSION+版本號(hào)就是fftFS示,代表一個(gè)唯一的序列.而目這餞號(hào)不會(huì)改變.ACCESSIONMOLECULEMETHODNOTEAC_123456GenomicMixed一些可供送擇的注殍E毒和原核生物。度因組序列主要用來標(biāo)記病AP_123456ProteinMixedAC_標(biāo)記序列對(duì)應(yīng)的蛋白產(chǎn)物。NJ123456GenomicMixed完整的基因組分子序列,標(biāo)記的類別包括基因組色體、細(xì)胞器、質(zhì)苞。、染NG.123456GenomicMixed不完整的基因組區(qū)域,提供NCBI基因組注釋

14、途徑。比較有代表性有不轉(zhuǎn)錄的假基因或者那些很難自行化注釋的基因組簇。NM23456mRNAMixed轉(zhuǎn)錄產(chǎn)物序列;成熟mRN鼎錄本序列。生微信號(hào):HehzLire一般梟說,mRNA和其因組序列是我們主要的尋找對(duì)象.如單想找標(biāo)準(zhǔn)序列的話,mRN領(lǐng)采用NM_開頭的,基囚組用NC_或者AC_開頭的。soeasy!NPJ23456NP.1234S6789ProteinMixed后白產(chǎn)炳;主奧星全米轉(zhuǎn)手簧,舜序列,但也有一些只有部分函白質(zhì)的部分氨基釀序少卜NR.123456RNAMixed才編碼的轉(zhuǎn)錄子序列,包話髭構(gòu)RNAS,但邕因法子等。NT.,123456GenomicAutomatedBAC或者鳥槍廁序法的遷未完全注釋的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論