理學多序列比對_第1頁
理學多序列比對_第2頁
理學多序列比對_第3頁
理學多序列比對_第4頁
理學多序列比對_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

[理學]多序列比對第Ⅲ部分

生物分子信息的分析第七章多序列比對本章內(nèi)容:多序列比對多序列比對程序及應用第一節(jié)、多序列比對

(Multiplesequencealignment)概念多序列比對的意義多序列比對的打分函數(shù)多序列比對的方法1、概念多序列比對(Multiplesequencealignment)alignmultiplerelatedsequencestoachieveoptimalmatchingofthesequences.為了便于描述,對多序列比對過程可以給出下面的定義:把多序列比對看作一張二維表,表中每一行代表一個序列,每一列代表一個殘基的位置。將序列依照下列規(guī)則填入表中:(a)一個序列所有殘基的相對位置保持不變;(b)將不同序列間相同或相似的殘基放入同一列,即盡可能將序列間相同或相似殘基上下對齊(下表)。1234567891ⅠYDGGAV-EALⅡYDGG---EALⅢFEGGILVEALⅣFD-GILVQAVⅤYEGGAVVQAL表1多序列比對的定義表示五個短序列(I-V)的比對結(jié)果。通過插入空位,使5個序列中大多數(shù)相同或相似殘基放入同一列,并保持每個序列殘基順序不變與雙序列比對一樣,多序列比對的方法建立在某個數(shù)學或生物學模型之上。因此,正如我們不能對雙序列比對的結(jié)果得出“正確或錯誤”的簡單結(jié)論一樣,多序列比對的結(jié)果也沒有絕對正確和絕對錯誤之分,而只能認為所使用的模型在多大程度上反映了序列之間的相似性關系以及它們的生物學特征。2、多序列比對的意義用于描述一組序列之間的相似性關系,以便了解一個分子家族的基本特征,尋找motif,保守區(qū)域等。用于描述一組同源序列之間的親緣關系的遠近,應用到分子進化分析中。序列同源性分析:是將待研究序列加入到一組與之同源,但來自不同物種的序列中進行多序列同時比較,以確定該序列與其它序列間的同源性大小。其他應用,如構(gòu)建profile,打分矩陣等3、多序列比對的打分函數(shù)多序列比對的打分函數(shù)(scoringfunction)為逐對加和(sum-of-pairs,SP)函數(shù)SP:Itisthesumofthescoresofallpossiblepairsofsequencesinamultiplealignmentbasedonaparticularscoringmatrix.ThepurposeofmostmultiplesequencealignmentalgorithmsistoachievemaximumSPscores.其中,c1,c2,…,ck是一列中的k個字符,p是關于一對字符相似性的打分函數(shù)。手工比對在運行經(jīng)過測試并具有比較高的可信度的計算機程序(輔助編輯軟件如bioedit,seaview,Genedoc等)基礎上,結(jié)合實驗結(jié)果或文獻資料,對多序列比對結(jié)果進行手工修飾,應該說是非常必要的。為了便于進行交互式手工比對,通常使用不同顏色表示具有不同特性的殘基,以幫助判別序列之間的相似性。計算機程序自動比對通過特定的算法(如窮舉法,啟發(fā)式算法等),由計算機程序自動搜索最佳的多序列比對狀態(tài)。4、多序列比對的方法窮舉法窮舉法(exhaustivealignmentmethod)將序列兩兩比對時的二維動態(tài)規(guī)劃矩陣擴展到多維矩陣。即用矩陣的維數(shù)來反映比對的序列數(shù)目。這種方法的計算量很大,對于計算機系統(tǒng)的資源要求比較高,一般只有在進行少數(shù)的較短的序列的比對的時候才會用到這個方法DCA(Divide-and-ConquerAlignment):aweb-basedprogramthatissemiexhaustive啟發(fā)式算法啟發(fā)式算法(heuristicalgorithms):大多數(shù)實用的多序列比對程序采用啟發(fā)式算法(heuristicalgorithms),以降低運算復雜度。隨著序列數(shù)量的增加,算法復雜性也不斷增加。用O(m1m2m3…mn)表示對n個序列進行比對時的算法復雜性,其中mn是最后一條序列的長度。若序列長度相差不大,則可簡化成O(mn),其中n表示序列的數(shù)目,m表示序列的長度。顯然,隨著序列數(shù)量的增加,序列比對的算法復雜性按指數(shù)規(guī)律增長。第二節(jié)多序列比對程序及應用ProgressiveAlignmentMethodIterativeAlignmentBlock-BasedAlignment1、ProgressiveAlignmentMethodClustal:Clustal,是由Feng和Doolittle于1987年提出的。Clustal程序有許多版本ClustalW(Thompson等,1994)是目前使用最廣泛的多序列比對程序它的PC版本是ClustalX作為程序的一部分,Clustal可以輸出用于構(gòu)建進化樹的數(shù)據(jù)。ClustalW程序:ClustalW程序可以自由使用在NCBI/EBI的FTP服務器上可以找到下載的軟件包。ClustalW程序用選項單逐步指導用戶進行操作,用戶可根據(jù)需要選擇打分矩陣、設置空位罰分等。

EBI的主頁還提供了基于Web的ClustalW服務,用戶可以把序列和各種要求通過表單提交到服務器上,服務器把計算的結(jié)果用Email返回用戶(或在線交互使用)。ProgressiveAlignmentMethodClustalW程序ClustalW對輸入序列的格式比較靈活,可以是FASTA格式,還可以是PIR、SWISS-PROT、GDE、Clustal、GCG/MSF、RSF等格式。輸出格式也可以選擇,有ALN、GCG、PHYLIP和GDE等,用戶可以根據(jù)自己的需要選擇合適的輸出格式。用ClustalW得到的多序列比對結(jié)果中,所有序列排列在一起,并以特定的符號代表各個位點上殘基的保守性,“*”號表示保守性極高的殘基位點;“.”號代表保守性略低的殘基位點。ProgressiveAlignmentMethodClustalW算法ClustalW是一種漸進的比對方法(ProgressiveAlignmentMethod)(seenext)先將多個序列兩兩比對構(gòu)建距離矩陣,反應序列之間兩兩關系;然后根據(jù)距離矩陣計算產(chǎn)生系統(tǒng)進化指導樹,對關系密切的序列進行加權(quán);然后從最緊密的兩條序列開始,逐步引入臨近的序列并不斷重新構(gòu)建比對,直到所有序列都被加入為止。ProgressiveAlignmentMethodglobalalignmentClustalW使用輸入地址:設置選項(next)ProgressiveAlignmentMethod郵件或交互式在線獲取結(jié)果比對嚴謹性:full比fast嚴謹?shù)M時系統(tǒng)發(fā)育樹輸出選項序列輸入注意格式ClustalW使用一些選項說明PHYLOGENETICTREE有三個選項

TREETYPE:構(gòu)建系統(tǒng)發(fā)育樹的算法,有四個個選擇none、nj(neighbourjoining)、phylip、distCORRECTDIST:決定是否做距離修正。對于小的序列歧異(<10%),選擇與否不會產(chǎn)生差異;對于大的序列歧異,需做出修正。因為觀察到的距離要比真實的進化距離低。IGNOREGAPS:選擇on,序列中的任何空位將被忽視。詳細說明參見ProgressiveAlignmentMethodClustalW使用輸入5個16SRNA基因序列AF310602AF308147AF283499AF012090AF447394點擊“RUN”ProgressiveAlignmentMethod比對結(jié)果頁面調(diào)出“jalviewalignmentedit”程序,對比對數(shù)據(jù)進行編輯兩兩比對結(jié)果點擊查看比對文件比對結(jié)果版本號以系統(tǒng)發(fā)育圖顯示The".dnd"adescribesthephylogenetictree分支圖jalviewalignmentedit程序,對比對數(shù)據(jù)進行編輯同一序列系統(tǒng)樹構(gòu)建方法選擇ProgressiveAlignmentMethodT-Coffee(Tree-basedConsistencyObjectiveFunctionforalignmentEvaluation):ProgressivealignmentmethodInprocessingaquery,T-Coffeeperformsbothglobalandlocalpairwisealignmentforallpossiblepairsinvolved.Adistancematrixisbuilttoderiveaguidetree,whichisthenusedtodirectafullmultiplealignmentusingtheprogressiveapproach.OutperformsClustalwhenaligningmoderatelydivergentsequencesSlowerthanClustalProgressiveAlignmentMethodPRALINE:web-based:FirstbuildprofilesforeachsequenceusingPSI-BLASTdatabasesearching.Eachprothenusedformultiplealignmentusingtheprogressiveapproach.theclosestneighbortobejoinedtoalargeralignmentbycomparingtheprodoesnotuseaguidetreeIncorporateproteinsecondarystructureinformationtomodifythepro.Perhapsthemostsophisticatedandaccuratealignmentprogramavailable.Extremelyslowcomputation.ProgressiveAlignmentMethodDbClustal:Poa(Partialorderalignments):2、IterativeAlignmentPRRN:web-basedprogramUsesadoublenestediterativestrategyformultiplealignment.BasedontheideathatanoptimalsolutioncanbefoundbyrepeatedlymodifyingexistingsuboptimalsolutionsThisprocessisrepeatedovermanycyclesuntilthereisnofurtherimprovementintheoverallalignmentscores.1、aninitialrandomalignmentisgeneratedthatisusedtoderiveaUPGMAtreeWeightsaresubsequentlyappliedtooptimizethealignment.2、thesequencesarerandomlydividedintotwogroups3、Thetwogroups,eachtreatedasasinglesequence,arethenalignedtoeachotherusingglobaldynamicprogramming.TheprocessisrepeatedthroughmanycyclesuntilthetotalSPscorenolongerincreases.4、Atthispoint,theresultingalignmentisusedtoconstructanewUPGMAtree.Newweightsareappliedtooptimizealignmentscores.3、Block-BasedAlignmentTheprogressiveanditerativealignmentstrategiesarelargelyglobalalignmentbasedandmaythereforefailtorecognizeconserveddomainsandmotifsamonghighlydivergentsequencesofvaryinglengths.Forsuchdivergentsequencesthatshareonlyregionalsimilarities,alocalalignmentbasedapproachhastobeused.Block-BasedAlignmentDIALI

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論