用Polyphen2和SIFT進(jìn)行突變預(yù)測_第1頁
用Polyphen2和SIFT進(jìn)行突變預(yù)測_第2頁
用Polyphen2和SIFT進(jìn)行突變預(yù)測_第3頁
用Polyphen2和SIFT進(jìn)行突變預(yù)測_第4頁
用Polyphen2和SIFT進(jìn)行突變預(yù)測_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

用Polyphen2和SIFT進(jìn)行突變 SNP功能預(yù)測 三個網(wǎng)址 Polyphen2 http genetics bwh harvard edu pph2 SIFT http sift jcvi org 以上兩個在線應(yīng)用的軟件 主要對SNP以及點(diǎn)突變進(jìn)行功能預(yù)測 但預(yù)測限于錯義突變 其他無義突變 突變?yōu)榻K止密碼 堿基缺失 插入所造成的框移突變 以及起始密碼子的突變均不可以預(yù)測 Uniportdatabase 數(shù)據(jù)準(zhǔn)備 兩個網(wǎng)站均為在線提交數(shù)據(jù) 提交的數(shù)據(jù)文件格式可有以下兩種 第一種為蛋白質(zhì)的氨基酸序列 按照FASTA格式編寫第二種為蛋白質(zhì)在Uniportdatabase中的ID 獲取蛋白質(zhì)序列或ID 可以在NCBI中查找 也可以直接在Uniportdatabase中查找 此處填寫蛋白質(zhì)名稱 查詢結(jié)果 仔細(xì)核對以上數(shù)據(jù) ID就是所在polyphen2中需要號碼 以humanDAX 1為例 ID為P51843 ID 蛋白質(zhì)名稱 種屬 點(diǎn)擊所需要的蛋白質(zhì)ID鏈接 在出現(xiàn)的頁面中可以詳細(xì)查看DAX 1的信息 再次核對是否正確 注意右上角的幾列標(biāo)簽 如圖 點(diǎn)擊 獲取FASTA格式數(shù)據(jù) 此數(shù)據(jù)可能會被下載 下載后可以用記事本程序打開 或者有時會在瀏覽器中直接打開 可以將其中數(shù)據(jù)全部復(fù)制備用 下方即是打開的FASTA數(shù)據(jù) 最上面是蛋白質(zhì)的信息 含ID 名稱 種屬 下方是氨基酸序列 sp P51843 NR0B1 HUMANNuclearreceptorsubfamily0groupBmember1OS HomosapiensGN NR0B1PE 1SV 2MAGENHQWQGSILYNMLMSAKQTRAAPEAPETRLVDQCWGCSCGDEPGVGREGLLGGRNVALLYRCCFCGKDHPRQGSILYSMLTSAKQTYAAPKAPEATLGPCWGCSCGSDPGVGRAGLPGGRPVALLYRCCFCGEDHPRQGSILYSLLTSSKQTHVAPAAPEARPGGAWWDRSYFAQRPGGKEALPGGRATALLYRCCFCGEDHPQQGSTLYCVPTSTNQAQAAPEERPRAPWWDTSSGALRPVALKSPQVVCEAASAGLLKTLRFVKYLPCFQVLPLDQQLVLVRNCWASLLMLELAQDRLQFETVEVSEPSMLQKILTTRRRETGGNEPLPVPTLQHHLAPPAEARKVPSASQVQAIKCFLSKCWSLNISTKEYAYLKGTVLFNPDVPGLQCVKYIQGLQWGTQQILSEHTRMTHQGPHDRFIELNSTLFLLRFINANVIAELFFRPIIGTVSMDDMMLEMLCTKI 成都家教 成都家教網(wǎng) Polyphen2應(yīng)用 進(jìn)入網(wǎng)站 http genetics bwh harvard edu pph2 在這里以我們以前發(fā)現(xiàn)的DAX 1L262P這個突變舉例 在紅框出填入已經(jīng)查到的ID 下方FASTA數(shù)據(jù)可以不用輸 綠框中輸入突變氨基酸位置 在AA1中選擇L AA2中選擇突變后的P 最后點(diǎn)Submit 運(yùn)行畫面 每隔5 10秒點(diǎn)refresh刷新頁面 直至Results中出現(xiàn)View 然后點(diǎn)擊View 結(jié)果 一般突變預(yù)測看第二條圖HumVar的結(jié)果 分?jǐn)?shù)越接近1 0 損害可能越大 越接近0 損害可能性越小 結(jié)果分為benign possiblydamaging以及probablydamaging注 possibly為有可能 probably為很可能 成都家教 成都家教網(wǎng) 練習(xí) 小常所發(fā)現(xiàn)的SF 1基因一處SNP G146A 請用Polyphen2進(jìn)行預(yù)測 蛋白質(zhì)功能是否受到影響 最后結(jié)果 SIFT 進(jìn)入網(wǎng)站 http sift jcvi org 在singleproteintools中找到SIFTsequence 點(diǎn)擊打開進(jìn)入數(shù)據(jù)提交新頁面 填入自己email SIFT運(yùn)算時間在20min左右 你可以等 也可以讓他把郵件發(fā)送過來 蛋白質(zhì)FASTA數(shù)據(jù) 將下載好的蛋白質(zhì)Fasta數(shù)據(jù)上傳即可 或者將用記事本或瀏覽器打開的Fasta數(shù)據(jù)copy至此數(shù)據(jù)框中 蛋白質(zhì)序列可以截選 但必須有第一行的蛋白質(zhì)信息數(shù)據(jù) 此處填蛋白質(zhì)突變或SNP位點(diǎn)信息 如S578N L262P G146A等 成都家教 成都家教網(wǎng) SIFT預(yù)測ARS578N功能變化 在Uniport中搜索AndrogenReceptor 下載FASTA數(shù)據(jù) 如下圖為瀏覽器打開后的結(jié)果 sp P10275 ANDR HUMANAndrogenreceptorOS HomosapiensGN ARPE 1SV 2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCGSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ 此為第一行蛋白質(zhì)信息 如果采用copy至數(shù)據(jù)輸入框 而不是采用文件上傳方法 紅框中數(shù)據(jù)必須黏貼進(jìn)輸入框 而后面的蛋白質(zhì)序列只需黏貼需要部分 注意 一般來說用文件上傳方法比較簡單 但SIFT對氨基酸序列有要求 大于500的氨基酸序列不能分析 故像AR這種有919個AA的就不能采用直接上傳模式 而要將氨基酸序列裁剪過后按Fasta格式黏貼至數(shù)據(jù)框中 成都家教 成都家教網(wǎng) sp P10275 ANDR HUMANAndrogenreceptorOS HomosapiensGN ARPE 1SV 2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCGSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ 我們需要先編輯FASTA數(shù)據(jù) 在記事本中打開 首先找到第578位的S 紅色標(biāo)出 因為SIFT最佳預(yù)測大小為300 400左右的氨基酸序列 那么我們將之前的400個氨基酸刪除 藍(lán)色部分 那么我們的突變位點(diǎn)就從S578N變?yōu)镾178N 最后將末尾的139個氨基酸也一并刪除 咖啡色 保留中間389個氨基酸 加上第一行的蛋白質(zhì)信息 這就是我們需要提交的數(shù)據(jù) 成都家教 成都家教網(wǎng) 將剛才編輯好的數(shù)據(jù)填入這個框中 之前介紹過這個數(shù)據(jù)輸入框 此框中填入突變信息S178N 頁面中其他選項保持默認(rèn)就可以 一般不需要更改 最后提交就可以 成都家教 成都家教網(wǎng) OK 現(xiàn)在大家可以泡杯咖啡或茶 聊聊天 過個5 10分鐘就可以出結(jié)果 一般不超過20分鐘 如果出錯 會有錯誤信息提示給你 如果你填好了郵箱 也可以不必等 過一會收郵件就可以 結(jié)果會有一堆英文 看了頭痛 直接找到ScaledProbabilitiesforEntireProtein和Predictionsofsubstitutionsentered兩處鏈接 分別點(diǎn)擊進(jìn)去 ScaledProbabilitiesforEntireProtein給出了所提交氨基酸每個位點(diǎn)發(fā)生突變后的計算分?jǐn)?shù) 只要分?jǐn)?shù)小于0 05就認(rèn)為可能影響到蛋白質(zhì)功能而Predictionsofsub

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論