![生物信息學(xué)山東148講課件38blast搜索_第1頁](http://file4.renrendoc.com/view/a1fe40fb1985ab501bbdabf291307e7d/a1fe40fb1985ab501bbdabf291307e7d1.gif)
![生物信息學(xué)山東148講課件38blast搜索_第2頁](http://file4.renrendoc.com/view/a1fe40fb1985ab501bbdabf291307e7d/a1fe40fb1985ab501bbdabf291307e7d2.gif)
![生物信息學(xué)山東148講課件38blast搜索_第3頁](http://file4.renrendoc.com/view/a1fe40fb1985ab501bbdabf291307e7d/a1fe40fb1985ab501bbdabf291307e7d3.gif)
![生物信息學(xué)山東148講課件38blast搜索_第4頁](http://file4.renrendoc.com/view/a1fe40fb1985ab501bbdabf291307e7d/a1fe40fb1985ab501bbdabf291307e7d4.gif)
下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、生物信息學(xué)第三章:序列比較(第二部分)BLAST 搜索:NCBI BLASTp就 以 NCBI 的 BLAST 工 具 為 例 嘗 試 一 下 不 同 算 法 的 BLAST 工 具()。BLAST在 NCBI 主頁右側(cè)很顯眼的地方。做BLASTp(Protein BLAST),也就是用蛋白質(zhì)序列搜索蛋白質(zhì)序列數(shù)據(jù)庫。在 BLASTp 輸入界面里(圖 1):1)輸入待搜索的蛋白質(zhì)序列,這條序列可以在示例文件 blast.fasta 里面找到。2)指定搜索跟輸入序列哪部分相似的序列,如果空著就是全長搜索。3)給搜索任務(wù)起一個(gè)名字,如果輸入的是 FASTA 格式的序列,那么在輸入框里面點(diǎn)一下,序列
2、的名字就會被自動識別出來。4)如果在Align two or more sequen以同時(shí)提交多個(gè) BLAST 任務(wù)。前面打勾的話,可圖 1. NCBI BLASTp 輸入界面上半部分在輸入界面的下部(圖 2)選擇:1)被搜索的數(shù)據(jù)庫??吹剑m然是 NCBI 的 BLAST工具,可以選擇的數(shù)據(jù)庫卻不只 NCBI 下屬的數(shù)據(jù)庫,還包括其他組織的數(shù)據(jù)庫,比如 PDB,Swissprot。事實(shí)上,各大數(shù)據(jù)庫的 BLAST 工具都可以實(shí)現(xiàn)跨搜索這次用 NCBI的 BLAST 工具搜索 SwissProt 數(shù)據(jù)庫。2anism 可以把搜索范圍限定在某一特定物種內(nèi),或者排除某一物種。3)在算法選擇這一欄里
3、,有之前提到的三種不同的 BLAST 算法,標(biāo)準(zhǔn)BLAST,PSI-BLAST 和 PHI-BLAST。這一次后,點(diǎn) BLAST。先嘗試標(biāo)準(zhǔn) BLAST。所有參數(shù)設(shè)置完畢之圖 2. NCBI BLASTp 輸入界面下半部分做 BLAST 搜索是需要點(diǎn)兒耐心的,不過也不用擔(dān)心,網(wǎng)速跟得上的話,三就會返回結(jié)果。應(yīng)該圖 3 是搜索結(jié)果。最上面是第一部分搜索任務(wù)描述部分。輸入界面里設(shè)置的各種參數(shù)都會在這里列出。第二部分(Graphic Summary)是圖形化搜索結(jié)果部分。在圖形化搜索結(jié)果里,BLAST工具識別出輸入序列的第 25 到第 170 個(gè)氨基酸這一段屬于 TIR 蛋白質(zhì)。這部分里彩色線條的圖
4、告訴,一共從數(shù)據(jù)庫中找到 50 個(gè) hits,也就是高分匹配片段。注意這些線代表的是 50 個(gè)高分匹配片段而不是 50 條序列。一個(gè)高分匹配片段有可能是一條全長的序列,也就是全長匹配,也有可能只是某條序列的一部分,也就是局部匹配。代表這些高分匹配片段的線擁有不同顏色和不同的長短。如果把鼠標(biāo)放到某一條線上,可以看到這條匹配片段的具體信息,包括他所在序列的數(shù)據(jù)庫,序列的名字,匹配得分,期望值 E 值。匹配得分在 200 以上的用紅線表示,80 到 200 之間的用粉線,50 到 80 的綠線,40-50 的藍(lán)線, 40 以下的黑線,所以顏色反映的是匹配的好壞程度。如果某一個(gè)高分匹配片段和輸入序列是
5、從頭到尾匹配,就是全長的線,比如最上面的三條紅線。如果只匹配輸入序列的一部分,則是一條短線,短線所在的位置就是與輸入序列匹配的位置。第三部分(Descriptions)是這 50 個(gè)高分匹配片段所在序列的詳細(xì)信息列表。每條序列都有一個(gè)匹配得分和覆蓋度。這兩項(xiàng)決定了第二部分彩圖中每條線的顏色和長短。除了匹配得分和覆蓋度,表中還列出了其他指標(biāo)。尤為重要的是 E-value。E-value 也叫做期望值或 E值。E 值越接近零,說明輸入序列與當(dāng)前這條序列為同一條序列的可能性越大。第三部分的表就是根據(jù) E 值由低到高排序的。隨著 E 值增大,匹配得分是成反比逐漸降低的。但是一致度與 E 值并非完全成反比。因?yàn)槊嬷v BLAST的時(shí)候,BLAST 沒有做雙序列比對,為了提高速度,它犧牲了一定的準(zhǔn)確度。表中的一致度,是 BLAST 搜索完成后,針對搜索到的這 50 條序列專門做雙序列比對而得到的。BLAST 犧牲掉的準(zhǔn)確度對高度相似的序列,也就是親緣關(guān)系近的序列不了,不會把它們落掉,但是對于那些只有一點(diǎn)點(diǎn)相似,也就是遠(yuǎn)源的序列
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 零售業(yè)中的顧客安全保障措施
- DB3715T 69-2025研學(xué)旅游指導(dǎo)師服務(wù)規(guī)范
- 專業(yè)技術(shù)人才海外培訓(xùn)服務(wù)合同(版)
- 上海股權(quán)轉(zhuǎn)讓合同文本
- 二手房轉(zhuǎn)讓合同定金協(xié)議書范本
- 中外合資企業(yè)勞動合同樣本
- 個(gè)人保證擔(dān)保融資合同協(xié)議
- NBA賽事中國區(qū)電視轉(zhuǎn)播合同
- 互利共贏投資合作合同
- 個(gè)人物流配送服務(wù)合同模板
- 注射用醋酸亮丙瑞林微球
- 部編版語文五年級下冊 全冊教材分析
- 胎兒性別鑒定報(bào)告模板
- 大學(xué)生就業(yè)指導(dǎo)PPT(第2版)全套完整教學(xué)課件
- 家具安裝工培訓(xùn)教案優(yōu)質(zhì)資料
- 湖南大一型抽水蓄能電站施工及質(zhì)量創(chuàng)優(yōu)匯報(bào)
- 耳穴療法治療失眠
- 少兒財(cái)商教育少兒篇
- GB 1886.114-2015食品安全國家標(biāo)準(zhǔn)食品添加劑紫膠(又名蟲膠)
- envi二次開發(fā)素材包-idl培訓(xùn)
- 2022年上海市初中語文課程終結(jié)性評價(jià)指南
評論
0/150
提交評論