Mothur軟件用于OTU分析或序列分型(sequence type,ST)-文檔資料_第1頁
Mothur軟件用于OTU分析或序列分型(sequence type,ST)-文檔資料_第2頁
Mothur軟件用于OTU分析或序列分型(sequence type,ST)-文檔資料_第3頁
Mothur軟件用于OTU分析或序列分型(sequence type,ST)-文檔資料_第4頁
Mothur軟件用于OTU分析或序列分型(sequence type,ST)-文檔資料_第5頁
已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、1Mothor分析atpD過程記錄2012-11-22Mothur軟件分析OTU或?qū)⑿蛄袣w為不同的種類,見相似性部分(前半部分,第2到15張ppt),或按是否完全一樣來分(最后的4張ppt)。21.用Mothur確定OTU 也就是將序列相似性97%的定為一個OTU。如果按Plos One上提出的三個基因的相似性為準(如下),那么就能定出OTU了。Zhang YM, Tian CF, Sui XH, Chen WF, Chen WX (2012) Robust Markers Reflecting Phylogeny and Taxonomy of Rhizobia. PLoS ONE 7(9)

2、: e44936.3如何在dos環(huán)境下運行mothur? (1) 文件準備:將目標序列保存為fasta格式; (2) 將mothur.exe與x.fasta放在同一文件目錄下:4 (3) 打開mothur,注意在英文輸入法下打開mothur,否則會造成程序不響應。5(4) 調(diào)用dist.seqs指令,產(chǎn)生距離矩陣;輸入完后按entercalc以不同方式處理gap:onegap指把所有把對偶排列中出現(xiàn)的所有連續(xù)缺失的堿基當做一個gap;nogap按實際缺失的堿基數(shù)對待;默認為onegap; countends: 用以處理末端gap的罰分,=F,指對末端gap不罰分;=T指對末端gap進行罰分;c

3、utoff:OTU的分界閾值Output: lt (指low triangle)或square, 指輸出距離矩陣為下三角還是矩形6 運行之后產(chǎn)生一個輸出文件: 注意文件格式:xxx.phylip.dist,該文件位于同一個目錄下,見下頁。7生成的文件:atpD_Aligned-fasta.phylip.dist8 說明:與Mega5中形成的距離值類似。用記事本打開生成的文件:atpD_Aligned-fasta.phylip.dist,如下,為距離值9 (5)讀入距離矩陣,用cluster進行OTU聚類(PS: mothur的早期版本此處要用read.dist先讀入距離矩陣,最新版本將其與cl

4、uster指令整合在一起) Method有三種選擇:10回車,屏幕顯示如下結(jié)果:11(7) 輸出OTU的分類結(jié)果,用bin.seqs指令xxx.phylip.fn.0.01.fasta文件對應于序列相似為99%的OTU (cutoff=0.01);xxx.phylip.fn.0.03.fasta文件對應于序列相似為97%的OTU (cutoff=0.03)這個上面的輸出中沒有,是舉個例子,來自于原始的文件12用記事本打開atpD_Aligned-fasta.phylip.fn.unique文件,即可看出將每個序列歸到不同的種類里去,即OTU。從中可看出,12個序列共有7個OTU。這與Mega5

5、中聚樹結(jié)果是一致的。13給出獨特的序列:7個OTU,99%相似性以上的:5個OUT,輸出的文件見相應的名字。14打開文件如下,將序列歸類,與前面的一致,但是沒有了序列,只有序列號名字。如果為unique,則表示某一個序列與其它的全一樣,或全不一樣。并將其中一個序列定為代表序列,如atpD_15644。 或如下,有0.01,則將99%以上相似性的序列歸到一起。并將其中一個序列定為代表序列,如atpD_15644。15這張片子在我處理的數(shù)據(jù)中沒有,因為沒有低于97%的序列,因此沒有出現(xiàn)這種情況。16一篇博士論文中提到的Unique.seq也應與前面的原理一樣??梢栽囍鲆幌隆?測試成功!見下面的片子!17使用unique.seqs分析獨特的序列類型在Mothur中輸入:Unique.seqs(fasta=XXX.fasta),回車。即能計算出來。如我分析的atpD序列,共12個序列,產(chǎn)生7個獨特的序列。并產(chǎn)生兩個文件。兩個文件的內(nèi)容見下頁。輸入的命令產(chǎn)生的結(jié)果,12條序列,7個獨特 的序列產(chǎn)生的兩個文件,打開后見下頁。18新生成的文件 文件格

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論