




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1如何做序列的如何做序列的BLAST分析分析2內(nèi)容提要內(nèi)容提要 Blast簡介簡介 Blast相關(guān)問題 Blast的應(yīng)用的應(yīng)用 示例3Blast簡介簡介 BLAST 是是NCBI中用來將一個(gè)蛋白質(zhì)或中用來將一個(gè)蛋白質(zhì)或DNA序列和各種數(shù)據(jù)庫中序列和各種數(shù)據(jù)庫中的其他序列進(jìn)行比對的主要工具。的其他序列進(jìn)行比對的主要工具。 BLAST搜索搜索是研究一個(gè)蛋白質(zhì)是研究一個(gè)蛋白質(zhì)和基因的最基本的方法之一。和基因的最基本的方法之一。 Blast具有非常廣泛的運(yùn)用具有非常廣泛的運(yùn)用確定特定的蛋白質(zhì)或核酸序列有哪些已知的直系同源或旁系同源序列確定哪些蛋白質(zhì)和基因在特定的物種中出現(xiàn)確定一個(gè)DNA或蛋白質(zhì)序列身份
2、發(fā)現(xiàn)新基因 確定一個(gè)特定基因或蛋白質(zhì)有哪些已經(jīng)發(fā)現(xiàn)了的變種研究可能存在多種剪切方式的表達(dá)序列標(biāo)簽尋找對于一個(gè)蛋白質(zhì)的功能和/或結(jié)構(gòu)起關(guān)鍵作用的氨基酸殘基 4主要的主要的blast程序程序5主要的主要的blast程序程序程序名程序名查詢序列查詢序列數(shù)據(jù)庫數(shù)據(jù)庫搜索方法搜索方法Blastn核酸核酸核酸序列搜索逐一核酸數(shù)據(jù)庫中的序列Blastp蛋白質(zhì)蛋白質(zhì)蛋白質(zhì)序列搜索逐一蛋白質(zhì)數(shù)據(jù)庫中的序列Blastx核酸蛋白質(zhì)核酸序列6框翻譯成蛋白質(zhì)序列后和蛋白質(zhì)數(shù)據(jù)庫中的序列逐一搜索。Tblastn蛋白質(zhì)核酸蛋白質(zhì)序列和核酸數(shù)據(jù)庫中的核酸序列6框翻譯后的蛋白質(zhì)序列逐一比對。TBlastx核酸核酸核酸序列6框翻
3、譯成蛋白質(zhì)序列,再和核酸數(shù)據(jù)庫中的核酸序列6框翻譯成的蛋白質(zhì)序列逐一進(jìn)行比對。6具體步驟具體步驟1. 登陸blast主頁 /Blast.cgi2. 根據(jù)已有序列類型和搜索目標(biāo),選擇合適的blast程序Blastn,Blastp,Blastx等3. 填寫表單信息選擇要搜索的數(shù)據(jù)庫,并修改一些可選參數(shù)等4. 提交任務(wù)5. 查看和分析結(jié)果7具體步驟具體步驟 輸入要分析的序列輸入要分析的序列NP_006735三種三種主要的輸入方式主要的輸入方式 剪切然后粘貼DNA或蛋白質(zhì)序列 使用FASTA格式的序列 簡單地使用索引號(hào)碼(如一個(gè)RefSeq 或Gen
4、Bank (GI)的序號(hào))8具體步驟具體步驟 選擇要搜索的數(shù)據(jù)庫選擇要搜索的數(shù)據(jù)庫 (blastp)去冗余GenBank編碼序列PDB + SwissProt + PIR + PRFNr數(shù)據(jù)庫數(shù)據(jù)庫 合并了若干個(gè)主要的蛋白質(zhì) 或DNA數(shù)據(jù)庫 數(shù)據(jù)庫有相同的序列,但nr 數(shù)據(jù)庫只收錄一個(gè) 典型和常用的數(shù)據(jù)庫9具體步驟具體步驟 選擇要搜索的數(shù)據(jù)庫(選擇要搜索的數(shù)據(jù)庫(blastn)10具體步驟具體步驟 調(diào)整可選參數(shù)調(diào)整可選參數(shù)1. Limit by Entrez Query可以可以用任何一種范圍限定詞用任何一種范圍限定詞來限定來限定NCBI BLAST搜索的范圍搜索的范圍11具體步驟具體步驟 調(diào)整
5、可選參數(shù)調(diào)整可選參數(shù)2. Max target sequences:比對之后顯示的最大的比對序列的數(shù)目12具體步驟具體步驟 調(diào)整可選參數(shù)調(diào)整可選參數(shù)3. Expect threshold:期望值E是得分大于或等于某個(gè)分值S的不同的比對的數(shù)目在隨機(jī)的數(shù)據(jù)庫搜索中發(fā)生的可能性。 默認(rèn)值是10,表示隨機(jī)出現(xiàn)得分等于 或高于比對得分S的期望數(shù)為10個(gè)。 當(dāng)將期望選項(xiàng)值調(diào)小時(shí),返回的數(shù)據(jù) 庫搜索結(jié)果將變少,匹配被搜索到的 概率也會(huì)變小。 增大E值將返回更多的結(jié)果。13具體步驟具體步驟 調(diào)整可選參數(shù)調(diào)整可選參數(shù)4. Word size(字段長度) 蛋白質(zhì)搜索,默認(rèn)值是3 核酸序列搜索,默認(rèn)值是11 改變字
6、段長度可以影響搜索 精度和速度14具體步驟具體步驟 調(diào)整可選參數(shù)調(diào)整可選參數(shù)5. Matrix (打分矩陣) 在一次BLAST搜索中,可以嘗試使用幾種不同的打分矩陣 高PAM值取代矩陣適合于差異較大的序列 低BLOSUM62值的取代矩陣適合于差異較大的序列15具體步驟具體步驟 調(diào)整可選參數(shù)調(diào)整可選參數(shù)6. Compositional adjustments,默認(rèn)選擇,一般來說可改善E值的統(tǒng)計(jì)計(jì)算和提高靈敏度(減少返回的假陽性結(jié)果的數(shù)目)16具體步驟具體步驟 調(diào)整可選參數(shù)調(diào)整可選參數(shù)7. Filter (選擇性過濾條件), 過濾器將鎖定諸如組成低復(fù)雜序列區(qū)(如Alu序列),用一系列N(任意堿基)
7、替代這些程序 過濾對絕大多數(shù)序列是有利的, 可以幫助避免那些假的數(shù)據(jù)庫匹配 但某些情況下可信的匹配也會(huì)過濾掉17具體步驟具體步驟 Blast輸出結(jié)果輸出結(jié)果上部上部BLAST搜索的類型、關(guān)于查詢內(nèi)容和所搜索的數(shù)據(jù)庫的描述以及一個(gè)分類連接可以將結(jié)果按照物種進(jìn)行分類中部中部數(shù)據(jù)庫中序列與查詢序列相匹配的項(xiàng)的列表,分為圖像和列表兩種描述方式下部下部一系列的兩兩序列比對, 4種衡量的分?jǐn)?shù):比特分?jǐn)?shù)、期望分?jǐn)?shù)、一致性百分比、正性(相似性百分比)18具體步驟具體步驟 Blast輸出結(jié)果輸出結(jié)果databaseprogramquerytaxonomy19具體步驟具體步驟 Blast輸出結(jié)果輸出結(jié)果每一個(gè)條帶
8、表示數(shù)據(jù)庫中的一個(gè)與查詢序列相匹配的蛋白質(zhì)或核酸序列,被標(biāo)以不同顏色表示親緣關(guān)系的遠(yuǎn)近(根據(jù)比對的分),最接近匹配用紅色表示。High scoreslow e values20具體步驟具體步驟Blast輸出結(jié)果輸出結(jié)果Score 使用打分矩陣對匹配的片段進(jìn)行打分,這是對各對氨基酸殘基(或堿基)打分求和的結(jié)果,一般來說,匹配片段越長、 相似性越高則Score值越大。E value 在相同長度的情況下,兩個(gè)氨基酸殘基(或堿基)隨機(jī)排列的序列進(jìn)行打分,得到上述Score值的概率的大小。E值越小表示隨機(jī)情況下得到該Score值的可能性越低。21具體步驟具體步驟 Blast輸出結(jié)果,改變格式輸出結(jié)果,改
9、變格式22 BLAST搜索策略總圖示例搜索策略總圖示例23如何處理過多的結(jié)果在“l(fā)imit Entrez query”窗口輸入“refseq”,這樣所有返回結(jié)果都帶 有一個(gè)refseq號(hào),可去掉冗余的數(shù)據(jù)庫匹配結(jié)果。利用生物體的種類對數(shù)據(jù)庫返回結(jié)果作出限制。利用序列的一部分進(jìn)行搜索。如利用獨(dú)立的結(jié)構(gòu)域序列就可進(jìn)行多結(jié)構(gòu)域蛋白的檢索。調(diào)整打分矩陣使其更恰當(dāng)?shù)伢w現(xiàn)你的query和數(shù)據(jù)庫匹配之間的相似度。調(diào)整期望值。降低E值可減少返回的數(shù)據(jù)庫中的匹配項(xiàng)。BLAST 搜索的一些策略搜索的一些策略24 如何處理過少的結(jié)果很多基因或蛋白在數(shù)據(jù)庫中沒有或只有極少數(shù)的匹配項(xiàng)。當(dāng)新的微生物基因組測序完成時(shí),預(yù)測到的蛋白質(zhì)有一半不和其他任何蛋白相匹配。用于提高BLAST搜索得到的數(shù)據(jù)庫匹配項(xiàng)數(shù)目的策略:去
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 礦物在生物醫(yī)學(xué)成像材料中的應(yīng)用考核試卷
- 玉米加工產(chǎn)業(yè)鏈的綠色化發(fā)展路徑考核試卷
- 清潔服務(wù)企業(yè)品牌故事塑造與傳播策略考核試卷
- 圖書出版與創(chuàng)意寫作考核試卷
- 生物質(zhì)能源在水污染治理中的應(yīng)用考核試卷
- 資產(chǎn)風(fēng)險(xiǎn)控制與信用評級補(bǔ)充合同
- 網(wǎng)絡(luò)文學(xué)版權(quán)登記終端租賃及版權(quán)保護(hù)培訓(xùn)服務(wù)合同
- 海關(guān)貨物信息錄入及派遣人員管理服務(wù)合同
- 國際級舉重賽電子稱重系統(tǒng)租賃與維護(hù)全面服務(wù)合同
- 文化創(chuàng)意產(chǎn)業(yè)股權(quán)期權(quán)激勵(lì)與創(chuàng)新發(fā)展協(xié)議
- 大氣簡約南昌大學(xué)校園文化介紹宣傳
- 部編人教版六年級下冊語文全冊課內(nèi)閱讀訓(xùn)練(含答案)
- 從龍文化看中華文明的連續(xù)性
- 二年級數(shù)學(xué)上冊蘇教版第六單元《表內(nèi)乘法和表內(nèi)除法(二)》說課稿
- DL∕T 475-2017 接地裝置特性參數(shù)測量導(dǎo)則
- 山東省濟(jì)南市2023-2024學(xué)年高一下學(xué)期期末學(xué)習(xí)質(zhì)量檢測歷史試題
- DL-T5241-2010水工混凝土耐久性技術(shù)規(guī)范
- 靜脈導(dǎo)管常見并發(fā)癥臨床護(hù)理實(shí)踐指南
- 圍手術(shù)期血糖管理專家共識(shí)
- 上肢肘腕關(guān)節(jié)松動(dòng)術(shù)
-
評論
0/150
提交評論