Polyphen2和SIFT教程_第1頁(yè)
Polyphen2和SIFT教程_第2頁(yè)
Polyphen2和SIFT教程_第3頁(yè)
Polyphen2和SIFT教程_第4頁(yè)
Polyphen2和SIFT教程_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、三個(gè)網(wǎng)址三個(gè)網(wǎng)址 Polyphen2:/pph2/ SIFT:/ Uniport database: / 這個(gè)網(wǎng)址用于查找蛋白質(zhì)序列和獲取這個(gè)網(wǎng)址用于查找蛋白質(zhì)序列和獲取FASTA格式格式數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備 兩個(gè)網(wǎng)站均為在線提交數(shù)據(jù),提交的數(shù)據(jù)文件格式可有以下兩種:第一種為蛋白質(zhì)的氨基酸序列,按照格式編寫(xiě)第二種為蛋白質(zhì)在Uniport database中的ID獲取蛋白質(zhì)序列或獲取蛋白質(zhì)序列或ID 可以在NCBI中查找,也可以直接在Uniport databa

2、se中查找查詢結(jié)果 仔細(xì)核對(duì)以上數(shù)據(jù),ID就是所在polyphen2中需要號(hào)碼,以human DAX-1為例,ID為P51843IDID蛋白質(zhì)名稱蛋白質(zhì)名稱種屬種屬 點(diǎn)擊所需要的蛋白質(zhì)ID鏈接,在出現(xiàn)的頁(yè)面中可以詳細(xì)查看DAX-1的信息,再次核對(duì)是否正確,注意右上角的幾列標(biāo)簽,如圖點(diǎn)擊,獲取點(diǎn)擊,獲取FASTAFASTA格式數(shù)據(jù),此數(shù)據(jù)可能會(huì)被下載,格式數(shù)據(jù),此數(shù)據(jù)可能會(huì)被下載,下載后可以用記事本程序打開(kāi),或者有時(shí)會(huì)在瀏覽器下載后可以用記事本程序打開(kāi),或者有時(shí)會(huì)在瀏覽器中直接打開(kāi),可以將其中數(shù)據(jù)全部復(fù)制備用,下方即中直接打開(kāi),可以將其中數(shù)據(jù)全部復(fù)制備用,下方即是打開(kāi)的是打開(kāi)的FASTAFAST

3、A數(shù)據(jù),最上面是蛋白質(zhì)的信息(含數(shù)據(jù),最上面是蛋白質(zhì)的信息(含IDID、名稱、種屬),下方是氨基酸序列名稱、種屬),下方是氨基酸序列sp|P51843|NR0B1_HUMAN Nuclear receptor subfamily 0 group B member 1 OS=Homo sapiens GN=NR0B1 PE=1 SV=2MAGENHQWQGSILYNMLMSAKQTRAAPEAPETRLVDQCWGCSCGDEPGVGREGLLGGRNVALLYRCCFCGKDHPRQGSILYSMLTSAKQTYAAPKAPEATLGPCWGCSCGSDPGVGRAGLPGGRPVALLYRC

4、CFCGEDHPRQGSILYSLLTSSKQTHVAPAAPEARPGGAWWDRSYFAQRPGGKEALPGGRATALLYRCCFCGEDHPQQGSTLYCVPTSTNQAQAAPEERPRAPWWDTSSGALRPVALKSPQVVCEAASAGLLKTLRFVKYLPCFQVLPLDQQLVLVRNCWASLLMLELAQDRLQFETVEVSEPSMLQKILTTRRRETGGNEPLPVPTLQHHLAPPAEARKVPSASQVQAIKCFLSKCWSLNISTKEYAYLKGTVLFNPDVPGLQCVKYIQGLQWGTQQILSEHTRMTHQGPHDRFIELNST

5、LFLLRFINANVIAELFFRPIIGTVSMDDMMLEMLCTKIPolyphen2應(yīng)用 進(jìn)入網(wǎng)站:/pph2/在這里以我們以前在這里以我們以前發(fā)現(xiàn)的發(fā)現(xiàn)的DAX-1 DAX-1 L262PL262P這個(gè)突變舉這個(gè)突變舉例,在紅框出填入例,在紅框出填入已經(jīng)查到的已經(jīng)查到的IDID,下,下方方FASTAFASTA數(shù)據(jù)可以數(shù)據(jù)可以不用輸;綠框中輸不用輸;綠框中輸入突變氨基酸位置;入突變氨基酸位置;在在AA1AA1中選擇中選擇L L,AA2AA2中選擇突變后中選擇突變后的的P P,最后點(diǎn),最后點(diǎn)SubmitSubmit運(yùn)行畫(huà)面每隔

6、每隔5-105-10秒點(diǎn)秒點(diǎn)refreshrefresh刷新頁(yè)刷新頁(yè)面,直至面,直至ResultsResults中出現(xiàn)中出現(xiàn)ViewView,然后點(diǎn)擊然后點(diǎn)擊ViewView結(jié)果一般突變預(yù)測(cè)一般突變預(yù)測(cè)看第二條圖看第二條圖HumVarHumVar的結(jié)果,的結(jié)果,分?jǐn)?shù)越接近分?jǐn)?shù)越接近1.01.0,損害可能越大,損害可能越大,越接近越接近0 0,損害,損害可能性越?。嚎赡苄栽叫。航Y(jié)果分為結(jié)果分為benignbenign,possibly possibly damagingdamaging以及以及probably probably damagingdamaging注:注:possiblypossib

7、ly為為有可能,有可能,probablyprobably為很可為很可能能練習(xí) 小常所發(fā)現(xiàn)的SF-1基因一處SNP:G146A,請(qǐng)用Polyphen2 進(jìn)行預(yù)測(cè),蛋白質(zhì)功能是否受到影響? 最后結(jié)果SIFT 進(jìn)入網(wǎng)站:/ 在single protein tools中找到SIFT sequence,點(diǎn)擊打開(kāi)進(jìn)入數(shù)據(jù)提交新頁(yè)面填入自己填入自己emailemail,SIFTSIFT運(yùn)算時(shí)間在運(yùn)算時(shí)間在20min20min左右,你左右,你可以等,也可以讓他把郵件發(fā)送過(guò)來(lái)可以等,也可以讓他把郵件發(fā)送過(guò)來(lái)蛋白質(zhì)蛋白質(zhì)FASTAFASTA數(shù)據(jù),將下載好的蛋白質(zhì)數(shù)據(jù),將下載好

8、的蛋白質(zhì)FastaFasta數(shù)據(jù)上傳即可數(shù)據(jù)上傳即可或者將用記事本或?yàn)g覽器打開(kāi)的或者將用記事本或?yàn)g覽器打開(kāi)的FastaFasta數(shù)數(shù)據(jù)據(jù)copycopy至此數(shù)據(jù)框中,蛋白質(zhì)序列可以至此數(shù)據(jù)框中,蛋白質(zhì)序列可以截選,但必須有截選,但必須有第一行的蛋白質(zhì)信息數(shù)第一行的蛋白質(zhì)信息數(shù)據(jù)據(jù)此處填蛋白質(zhì)突變或此處填蛋白質(zhì)突變或SNPSNP位點(diǎn)信息,位點(diǎn)信息,如如S578NS578N,L262PL262P,G146AG146A等等SIFT預(yù)測(cè)AR S578N功能變化 在Uniport中搜索Androgen Receptor,下載FASTA數(shù)據(jù),如下圖為瀏覽器打開(kāi)后的結(jié)果sp|P10275|ANDR_HUMA

9、N Androgen receptor OS=Homo sapiens GN=AR PE=1 SV=2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGV

10、EALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPI

11、DYYFPPQKTCLICGDEASGCHYGALTCGSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNP

12、TSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ此為第一行蛋白質(zhì)信息,如果采用此為第一行蛋白質(zhì)信息,如果采用copycopy至數(shù)據(jù)輸入框,而不是采用文件上傳方法,至數(shù)據(jù)輸入框,而不是采用文件上傳方法,紅框中數(shù)據(jù)必須黏貼進(jìn)輸入框,而后面的蛋白質(zhì)序列只需黏貼需要部分紅框中數(shù)據(jù)必須黏貼進(jìn)輸入框,而后面的蛋白質(zhì)序列只需黏貼需要部分注意:一般來(lái)說(shuō)用文件上傳方注意:一般來(lái)說(shuō)用文件上傳方法比較簡(jiǎn)單,但法比較簡(jiǎn)單,但SIFTSIFT對(duì)氨基酸序?qū)Π被嵝蛄杏幸螅笥诹杏幸?,大?00500的氨基酸序的氨基酸序列不能分

13、析,故像列不能分析,故像ARAR這種有這種有919919個(gè)個(gè)AAAA的就不能采用直接上傳模的就不能采用直接上傳模式,而要將氨基酸序列裁剪過(guò)式,而要將氨基酸序列裁剪過(guò)后按后按FastaFasta格式黏貼至數(shù)據(jù)框中格式黏貼至數(shù)據(jù)框中sp|P10275|ANDR_HUMAN Androgen receptor OS=Homo sapiens GN=AR PE=1 SV=2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQ

14、PQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAG

15、AAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCG CKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVV

16、KWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ我們需要先編輯我們需要先編輯FASTAFASTA數(shù)據(jù),在記事本中打開(kāi),首先找到第數(shù)據(jù),在記事本中打開(kāi),首先找到第578578位的位的S S(紅色標(biāo)出),(紅色標(biāo)出),因?yàn)橐驗(yàn)镾IFTSIFT最佳

17、預(yù)測(cè)大小為最佳預(yù)測(cè)大小為300-400300-400左右的氨基酸序列,那么我們將之前的左右的氨基酸序列,那么我們將之前的400400個(gè)氨基個(gè)氨基酸刪除(藍(lán)色部分),那么我們的突變位點(diǎn)就從酸刪除(藍(lán)色部分),那么我們的突變位點(diǎn)就從S578NS578N變?yōu)樽優(yōu)镾178NS178N,最后將末尾的,最后將末尾的139139個(gè)氨基酸也一并刪除(咖啡色),保留中間個(gè)氨基酸也一并刪除(咖啡色),保留中間389389個(gè)氨基酸,加上第一行的蛋白質(zhì)個(gè)氨基酸,加上第一行的蛋白質(zhì)信息,這就是我們需要提交的數(shù)據(jù)信息,這就是我們需要提交的數(shù)據(jù)將剛才編輯好的數(shù)據(jù)填入這個(gè)框中(之前介紹過(guò)將剛才編輯好的數(shù)據(jù)填入這個(gè)框中(之前介

18、紹過(guò)這個(gè)數(shù)據(jù)輸入框)這個(gè)數(shù)據(jù)輸入框)此框中填入突變信息此框中填入突變信息S178NS178N頁(yè)面中其他選項(xiàng)保持默認(rèn)就可頁(yè)面中其他選項(xiàng)保持默認(rèn)就可以,一般不需要更改,最后提以,一般不需要更改,最后提交就可以交就可以 現(xiàn)在大家可以泡杯咖啡或茶,聊聊天,過(guò)個(gè)5-10分鐘就可以出結(jié)果,一般不超過(guò)20分鐘,如果出錯(cuò),會(huì)有錯(cuò)誤信息提示給你。如果你填好了郵箱,也可以不必等,過(guò)一會(huì)收郵件就可以。 結(jié)果會(huì)有一堆英文,看了頭痛,直接找到Scaled Probabilities for Entire Protein和Predictions of substitutions entered兩處鏈接,分別點(diǎn)擊進(jìn)去。 Scaled Probabilities for Entire Protein給出了所提交氨基酸每個(gè)位點(diǎn)發(fā)生突變后的計(jì)算分?jǐn)?shù),只要分?jǐn)?shù)小于0.05就認(rèn)為可能影響到蛋白

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論