版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、基因組序列的差異分析mVISTA的在線使用說明當(dāng)然,除了在線版的,我們還可以在網(wǎng)站上填寫信息中請離線的軟件。但我試用了一下,需要先自己比對,然后要按照一定的格式來制作文 件,當(dāng)然你還必須得安裝java才能運(yùn)行軟件;總之,我感覺沒有在線 版的方便。1將數(shù)據(jù)放入服務(wù)器中在首頁,你將被要求確龍你想要分析的基因組序列的數(shù)量。輸入這個數(shù)字之后,點(diǎn)擊“提 交”,將帶你到主提交頁面。mVISTA服務(wù)器最多可以同時處理100條序列。mVISTA SubmissionRankVISTA regions are now autoinaiically computed for all mVISTA submissi
2、ons. Add die rankVISTA curve in the VISTABrov/ser io view them. or click the rankVISTA link in the Text Browser to download the results of the coinputationPlease enter the number of species you would like to compare and click the Submit button. This will take you to a form where you may input your s
3、pecie Sequences.Total number of I I fJ要求你填入需要分忻的序列骸量sequences: w (2 -100 ) SubmitRsuipd fields are forked1.1主提交頁面必填的內(nèi)容E-mail地址通過ErnaiL我們可以提示你的在線處理已經(jīng)得到結(jié)果。序列你可以用2種方式來上傳你的序列:使用“Browse按鈕從你的電腦上,上傳純文本的Fasta格式文件。如果是一個作為參考的 生物體的DNA序列必須作為一個contig提交(可以進(jìn)行一泄的左向排列將多個片段合并為 一個cont回,而英他非參考序列可以在一個或多個contig中提交(draft)
4、。Fasta格式的示例序列(您可以在NCBI站點(diǎn)上找到關(guān)于該格式的更多細(xì)節(jié)):mouse ATCACGCTCTTTGTACACTCCGCCATCTCTCTCT注意:序列里而我們只接受字母CAGTN和X。請確保提交序列是作為一種純文本格 式,而不是Word或HTML文件格式。如果您以FASTA格式提交序列,我們建議您為它取一個有意義的名稱(比如直接是你 的物種名之類的),因?yàn)檫@些需稱將出現(xiàn)在我們生成的圖形中。如果您使用的是一個draft 草圖序列,那么結(jié)果中每個contigs的命需都將按照您在“”符號后指示的命名進(jìn)行。您可以給出它的GenBank登錄號,系統(tǒng)將自動從GenBank數(shù)據(jù)庫里進(jìn)行檢索
5、序列。在這兩種情況下,序列的總大小都不應(yīng)超過10M,而且任何一條序列都不應(yīng)超過2M。1.2主提交頁面選填的內(nèi)容這些選項(xiàng)允許您自定義您的VISTA分析。您可以使用獨(dú)立獲得的基因注釋,選擇合適的Repeat Masker選項(xiàng),給分析的序列指泄爻且稱,并改變序列保存分析的參數(shù)。如果您沒有填寫這些選填 選項(xiàng),我們將使用它們的默認(rèn)值。比對程序根據(jù)您分析的具體內(nèi)容(參見“about”-鏈接中的詳細(xì)信息),您可以選擇以下比對程序之一:1、AVID-全局兩兩比對。如果您選擇使用這個程序,其中一個序列應(yīng)該被完成比對,其他所 有序列可以完成或以草圖draft格式完成。對于集合中所有已完成的序列,AVID生成所有
6、相對所有成對的比對結(jié)果,可以使用任何序列作為基礎(chǔ)(參考)來顯示。如果某些序列是 草圖格式,AVID將生成它們與最終序列的比對,這將被用作基礎(chǔ)(參考)。這是該服務(wù)器 上唯一可以處理草圖序列的比對程序。(小知識:草圖序列與完整序列 DNA sequence, draft: Sequence of a DNA with less accuracy than a finished sequenee. In a draft sequenee, some segments are missing or are in the wrong order or are oriented incorrectly.
7、A draft sequenee is as opposed to a finished DNA sequence)2、LAGAN-完成完整序列的全局兩兩比對和多重比對。如果某些序列是草圖格式,您的查詢 將被重泄向到AVID以獲得兩兩比對。多重比對將由VISTA可視化,它將計算并顯示序列的 保守區(qū),以您指示的任何序列作為參考。這是該服務(wù)器上唯一能夠產(chǎn)生真正的多重比對的程序。3、Sheffle-LAGAN-完整序列的全局比對。它檢測序列中的重排和逆序,同時產(chǎn)生一個全局的端 到端映射圖。如果你輸入幾個序列,所有成對的組合將被處理,結(jié)果將在VISTA中可視 化。這是該服務(wù)器上唯一可用于檢測重排和逆序
8、的比對程序。(葉綠體基因組差異分析論 文中好像一般都選這個)對每條序列你可以選擇:名字你選擇的物種統(tǒng)字將會顯示在圖例中。我們建議您使用一些有意義的內(nèi)容,例如這個生物 體的爻且稱、您的實(shí)驗(yàn)編號或數(shù)據(jù)庫標(biāo)識。當(dāng)您使用GenBank標(biāo)識符來輸入序列時,默認(rèn)情況下 我們將使用它作為序列的名稱。(頁面默認(rèn)的是sequencel, sequence2, sequence3.)注釋如果有序列的基因注釋信息,您可以將其以簡單的純文本格式提交,以便在繪圖中顯示。 每個基因由其在序列上的起始和結(jié)束坐標(biāo)以及列在一行上的需稱來左義。一行前應(yīng)放置大于 ()或小于(V)的符號,以表示正鏈或負(fù)鏈,但編號應(yīng)根據(jù)正鏈來排列。在
9、每個外顯子的開始和 結(jié)束坐標(biāo)之后,外顯子以單詞“exon”單獨(dú)列出。UTRs的注釋方式與外顯子相同,用utr代替 “外顯子”。例如:le ge*n shownFil?OCkpbAid0Calt?c1iaft3 . Analpii Tac:匚5|網(wǎng)d 1 ng矣 jmjlGcliBtati 廠SummaryiqucnccGeriBwhGerCank (til)FASTAASH 1XMLIMSDS制 XM.TinySeq MLFeature TaMeAccession LotGl WGFF3OtionBicRojoctBwSsrrpkTAxonoiACompcncrts (Coro)OencmeR
10、ecent activity目 Panax notoginscng iso 匕cvosome 9. whole 滬Q Panax(123355)注意:但是我下載后導(dǎo)入mVISTA,結(jié)果顯示只注釋了前而一半的基因,后一半序列沒有注釋,我 也暫時沒搞懂,所以,后來就在網(wǎng)上下了一個perl腳本,來自于簡書的mVISTA格式文件:由 Perl腳本處理GenBank注釋文件而來,然后把NCBI上下載的參考序列的gb文 件轉(zhuǎn)換成了 mVISTA格式文件。重復(fù)序列(RepeatMasker的選擇)我們建議掩蔽一個堿基序列以獲得更好的比對結(jié)果。您可以提交掩碼或非掩碼序列。如果 提交了一個掩碼序列,英重復(fù)的堿基
11、序列被替換為字母“N”,請在下拉菜單中選擇“one- celled/do not maskn選項(xiàng)。我們還接受輕度掩蔽序列,其中重復(fù)的元素以小寫字母顯示,而序列的苴余部 分以大寫字母顯示。在這種情況下,你需要在菜單中選擇 softmasked 選項(xiàng)。如果你的序列是非掩碼的,我們的服務(wù)器將用RepeatMasker來掩蓋重復(fù)序列。請在菜單中 為您的具體序列選擇一個特任的掩碼。如果你不希望你的序列被掩碼,選擇“one- celled/do not mask”。反向互補(bǔ)選擇您想要對第二個序列進(jìn)行反向互補(bǔ)的比對(如果沒有同源性,請嘗試這樣做)。監(jiān)管 VISTA(rVISTA)訪問 RegulatoryV
12、ISTA(rVISTA)access我們的服務(wù)器可以預(yù)測轉(zhuǎn)錄因子結(jié)合位點(diǎn),通過對結(jié)果序列運(yùn)行Regulatory VISTA (rVISTA)o rVISTA的最大尺寸限制是20IG有關(guān)此工具的信息,請參閱rVISTA說明。結(jié)果在提交你的序列幾分鐘后,你將收到來自vista的電子郵件,提供給你一個個人 網(wǎng) 絡(luò)鏈接,從那里你可以訪問你的分析結(jié)果。下而是結(jié)果頁。它列出了您提交的每個生物體,并為您提供了三個查看選項(xiàng)。這三個選項(xiàng) 是:文本瀏覽器(TextBrowser):提供所有詳細(xì)信息一一序列、比對、保守序列統(tǒng)汁等;VISTA瀏覽器 (Vista Browser):是一個交互式可視化工具,可以動態(tài)瀏
13、覽結(jié)果的比對,調(diào)整VISTA曲線和保存序 列參數(shù);和一個PDF文件(PDF):這是一個靜態(tài)的VISTA比對結(jié)果圖。Base (reference)Input and output files DynamicVistaorganism(sequences八 alignments, etc.)VisualizationImagesequencelTextBrowse rVista BrowserPDFsequence2TextBrowserVista BrowserPDFsequenc&3TextBrowserVista BrowserPDF在表的底部有一個鏈接,允許您凋整保存和可視化參數(shù)。通過點(diǎn)
14、擊它,用戶可以改變某些 參數(shù),這些參數(shù)用于計算保守區(qū)域和顯示每對提交序列的VISTA圖。諳注意,這些參數(shù)也可以在 使用VISTA瀏用器(VISTA Browser)時動態(tài)調(diào)整。TextBrowser這個鏈接將以文本格式顯示分析的結(jié)果。You are browsing diiinp_r Chimp is the basealigned with:galagomouseother organismsInunanratusing the SLAG AN alignment pm gram Al 1 gnment prog ram在頁而的頂部是一個橫幅,顯示比對好的生物體。在較暗的標(biāo)題區(qū)域中列出的序列
15、充當(dāng)基礎(chǔ)或 叫參考(要選擇一個不同的參考,返回到結(jié)果頁而并單擊所需的參考序列劃稱旁邊的文本瀏覽器 鏈接L這個橫幅還列出了用于比對序列的程序。Coordinates on base sequeneo/sequence 1 ligl7_liia: 1-504513ATi?taBrowser-view region in vista BrowserGet CNS: seauence 1Get Dotplots: seau 如 e 1 七 eauencJcns & dotplots for all displayed alignments下面是導(dǎo)航區(qū)域,它顯示了當(dāng)前顯示區(qū)域的坐標(biāo),提供了一個到Vist
16、a瀏覽器的鏈接(見下面). 以及一個到所有保守區(qū)域列表的鏈接。此外,如果使用Shuffle-Lagan作為比對程序,將會有一 個鏈接來下載生成的比對結(jié)果的點(diǎn)狀圖0:hgL7 dna:l 30626L (+)mm5_dna:101829-347929 (-)Sequence length: 246.10Kbp Vista BrowserScore: 81754 alignment: sequencel- sequence2 irifa:length: 306.26Kbp抨 17 dna:293043 . 32f973 (+)cns:pdf:sequencel-sequenceQsequetice
17、l-sequeticeQseqmcel-sequenceQSequence length: 31.93KbpOverlap=13218bp1115人:101859.133436 (+)Sequencelength: 31.58KbpVista ErowsetScore: 425alignment: sequencel- sequence2mfa:sequencel- sequence2cns:s e queue e 1 - s e接下來是主表,其中列出了相對參考生物體生成的每次比對。每一行都是一個單獨(dú)的比 對 結(jié)果。除最后一列外,每一列都是指提交分析的序列。最后一列包含與整個比對有關(guān)的信息。每
18、一行的第一個單元格還包含這個特泄比對的VISTA圖的預(yù)覽,這允許你快速評估這個比 對的質(zhì)量,并看到重合部分。通過觀察表格中的一行,你可以看到每個生物體的哪個部分與哪個部分比對上了。“Sequence鏈接將返回一個參與比對的fasta格式的生物體序列片段。單擊VISTABrowser”鏈接將 啟動設(shè)置為以所選有機(jī)體為參考的VISTA瀏覽器,并將坐標(biāo)設(shè)亶為所選比對的坐標(biāo)。最后一列提供了一些關(guān)于人類可讀的、MFA (multi-fasta對齊)格式的鏈接,一個單獨(dú)使用 這種比對的保守區(qū)域列表,以及單獨(dú)使用這種比對的pdf圖的鏈接。如果被檢查的區(qū)域是20K或 更少,可以執(zhí)行rVISTA分析,并且rVI
19、STA的鏈接也會顯示在這里。最新! !最后一欄還提供了對比對rankVISTA分析結(jié)果的鏈接。點(diǎn)擊這里閱讀更多關(guān)于 RankVISTA 的信息。VISTA Browser單擊VISTA瀏覽器鏈接將啟動程序,并選擇相應(yīng)的生物體作為基礎(chǔ)/參考序列。VISTA瀏 覽 器是一個交互式的Java程序,設(shè)計來可視化多個比對結(jié)果。瀏覽器清晰的顯示界而可以 很容易 地跨多個物種識別高度保守的區(qū)域。詳細(xì)的幫助和說明可以在這里獲得: HYPERLINK /vgb2help.shtmL /vgb2help.shtmLPDFPDF文件是比對結(jié)果和找到的保守區(qū)域的可視化顯示方式。mVISTA圖片最明顯的特征是 “峰谷”
20、圖。這張圖顯示了在任何給左的坐標(biāo)下,兩種生物之間的保守區(qū)域百分比(或者是差異 百分比,如果你使用cVISTA選項(xiàng))。頂部和底部百分比界限顯示在每一行的右邊。不同保存區(qū)域的顏色對應(yīng)于該區(qū)域的注釋。默認(rèn)情況下,粉色區(qū)域是保守的非編碼序列” (“CNS” ),深藍(lán)色區(qū)域是外顯子exons,淺藍(lán)色區(qū)域是非翻譯區(qū)UTRs。堿基序列中的空格由圖下 面的紅色線條部分表示。顏色圖例匯總在顯示器的左上角。表示基因的箭頭畫在圖的上方,指向基因的方向。外顯子和非翻譯區(qū)在mVISTA主圖上都是 彩色的。如果有足夠的空間,基因名稱都會出現(xiàn)在箭頭下方。重復(fù)直接顯示在圖的正上方,根據(jù) 圖左側(cè)的方案著色。圖下的灰色線顯示contigs,在草圖draft序列的情況下,contigs會被編號。注意:最后得到的結(jié)果都是一個pdf的文件,pdf格式是矢量圖格式,因此你就可以盡情編借啦, 只要你用的pdf編借器有編輯功能(如下圖所示),你就能隨意調(diào)動那些基因注釋的大
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度醫(yī)院心血管內(nèi)科科室承包管理協(xié)議4篇
- 四年級數(shù)學(xué)(上)計算題專項(xiàng)練習(xí)及答案
- 二年級數(shù)學(xué)(上)計算題專項(xiàng)練習(xí)
- 2020-2025年中國研學(xué)旅游行業(yè)競爭格局分析及投資戰(zhàn)略咨詢報告
- 2025年中國六類線行業(yè)市場供需格局及投資規(guī)劃建議報告
- 2025年中國周轉(zhuǎn)箱行業(yè)市場深度分析及投資戰(zhàn)略規(guī)劃研究報告
- 2025年鞋用熱熔膠項(xiàng)目可行性研究報告
- 2025年電氣系統(tǒng)項(xiàng)目深度研究分析報告
- 2023-2028年中國山西省住宿和餐飲行業(yè)市場深度評估及投資戰(zhàn)略規(guī)劃報告
- 2025年桐木刨切單板項(xiàng)目可行性研究報告-20250102-160803
- 無人化農(nóng)場項(xiàng)目可行性研究報告
- 《如何存款最合算》課件
- 社區(qū)團(tuán)支部工作計劃
- 拖欠工程款上訪信范文
- 《wifi協(xié)議文庫》課件
- 中華人民共和國職業(yè)分類大典是(專業(yè)職業(yè)分類明細(xì))
- 2025年新高考語文復(fù)習(xí) 文言文速讀技巧 考情分析及備考策略
- 2024年??谑羞x調(diào)生考試(行政職業(yè)能力測驗(yàn))綜合能力測試題及答案1套
- 一年級下冊數(shù)學(xué)口算題卡打印
- 2024年中科院心理咨詢師新教材各單元考試題庫大全-下(多選題部分)
- 真人cs基于信號發(fā)射的激光武器設(shè)計
評論
0/150
提交評論