Polyphen2和SIFT教程

上傳人：心*** IP屬地：江西上傳時(shí)間：2021-12-09 格式：PPT 頁(yè)數(shù)：22 大?。?.14MB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩17頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、三個(gè)網(wǎng)址三個(gè)網(wǎng)址 Polyphen2：/pph2/ SIFT：/ Uniport database： / 這個(gè)網(wǎng)址用于查找蛋白質(zhì)序列和獲取這個(gè)網(wǎng)址用于查找蛋白質(zhì)序列和獲取FASTA格式格式數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備兩個(gè)網(wǎng)站均為在線提交數(shù)據(jù)，提交的數(shù)據(jù)文件格式可有以下兩種：第一種為蛋白質(zhì)的氨基酸序列，按照格式編寫(xiě)第二種為蛋白質(zhì)在Uniport database中的ID獲取蛋白質(zhì)序列或獲取蛋白質(zhì)序列或ID 可以在NCBI中查找，也可以直接在Uniport databa

2、se中查找查詢結(jié)果仔細(xì)核對(duì)以上數(shù)據(jù)，ID就是所在polyphen2中需要號(hào)碼，以human DAX-1為例，ID為P51843IDID蛋白質(zhì)名稱蛋白質(zhì)名稱種屬種屬點(diǎn)擊所需要的蛋白質(zhì)ID鏈接，在出現(xiàn)的頁(yè)面中可以詳細(xì)查看DAX-1的信息，再次核對(duì)是否正確，注意右上角的幾列標(biāo)簽，如圖點(diǎn)擊，獲取點(diǎn)擊，獲取FASTAFASTA格式數(shù)據(jù)，此數(shù)據(jù)可能會(huì)被下載，格式數(shù)據(jù)，此數(shù)據(jù)可能會(huì)被下載，下載后可以用記事本程序打開(kāi)，或者有時(shí)會(huì)在瀏覽器下載后可以用記事本程序打開(kāi)，或者有時(shí)會(huì)在瀏覽器中直接打開(kāi)，可以將其中數(shù)據(jù)全部復(fù)制備用，下方即中直接打開(kāi)，可以將其中數(shù)據(jù)全部復(fù)制備用，下方即是打開(kāi)的是打開(kāi)的FASTAFAST

3、A數(shù)據(jù)，最上面是蛋白質(zhì)的信息（含數(shù)據(jù)，最上面是蛋白質(zhì)的信息（含IDID、名稱、種屬），下方是氨基酸序列名稱、種屬），下方是氨基酸序列sp|P51843|NR0B1_HUMAN Nuclear receptor subfamily 0 group B member 1 OS=Homo sapiens GN=NR0B1 PE=1 SV=2MAGENHQWQGSILYNMLMSAKQTRAAPEAPETRLVDQCWGCSCGDEPGVGREGLLGGRNVALLYRCCFCGKDHPRQGSILYSMLTSAKQTYAAPKAPEATLGPCWGCSCGSDPGVGRAGLPGGRPVALLYRC

4、CFCGEDHPRQGSILYSLLTSSKQTHVAPAAPEARPGGAWWDRSYFAQRPGGKEALPGGRATALLYRCCFCGEDHPQQGSTLYCVPTSTNQAQAAPEERPRAPWWDTSSGALRPVALKSPQVVCEAASAGLLKTLRFVKYLPCFQVLPLDQQLVLVRNCWASLLMLELAQDRLQFETVEVSEPSMLQKILTTRRRETGGNEPLPVPTLQHHLAPPAEARKVPSASQVQAIKCFLSKCWSLNISTKEYAYLKGTVLFNPDVPGLQCVKYIQGLQWGTQQILSEHTRMTHQGPHDRFIELNST

5、LFLLRFINANVIAELFFRPIIGTVSMDDMMLEMLCTKIPolyphen2應(yīng)用進(jìn)入網(wǎng)站：/pph2/在這里以我們以前在這里以我們以前發(fā)現(xiàn)的發(fā)現(xiàn)的DAX-1 DAX-1 L262PL262P這個(gè)突變舉這個(gè)突變舉例，在紅框出填入例，在紅框出填入已經(jīng)查到的已經(jīng)查到的IDID，下，下方方FASTAFASTA數(shù)據(jù)可以數(shù)據(jù)可以不用輸；綠框中輸不用輸；綠框中輸入突變氨基酸位置；入突變氨基酸位置；在在AA1AA1中選擇中選擇L L，AA2AA2中選擇突變后中選擇突變后的的P P，最后點(diǎn)，最后點(diǎn)SubmitSubmit運(yùn)行畫(huà)面每隔

6、每隔5-105-10秒點(diǎn)秒點(diǎn)refreshrefresh刷新頁(yè)刷新頁(yè)面，直至面，直至ResultsResults中出現(xiàn)中出現(xiàn)ViewView，然后點(diǎn)擊然后點(diǎn)擊ViewView結(jié)果一般突變預(yù)測(cè)一般突變預(yù)測(cè)看第二條圖看第二條圖HumVarHumVar的結(jié)果，的結(jié)果，分?jǐn)?shù)越接近分?jǐn)?shù)越接近1.01.0，損害可能越大，損害可能越大，越接近越接近0 0，損害，損害可能性越?。嚎赡苄栽叫。航Y(jié)果分為結(jié)果分為benignbenign，possibly possibly damagingdamaging以及以及probably probably damagingdamaging注：注：possiblypossib

7、ly為為有可能，有可能，probablyprobably為很可為很可能能練習(xí) 小常所發(fā)現(xiàn)的SF-1基因一處SNP：G146A，請(qǐng)用Polyphen2 進(jìn)行預(yù)測(cè)，蛋白質(zhì)功能是否受到影響？最后結(jié)果SIFT 進(jìn)入網(wǎng)站：/ 在single protein tools中找到SIFT sequence，點(diǎn)擊打開(kāi)進(jìn)入數(shù)據(jù)提交新頁(yè)面填入自己填入自己emailemail，SIFTSIFT運(yùn)算時(shí)間在運(yùn)算時(shí)間在20min20min左右，你左右，你可以等，也可以讓他把郵件發(fā)送過(guò)來(lái)可以等，也可以讓他把郵件發(fā)送過(guò)來(lái)蛋白質(zhì)蛋白質(zhì)FASTAFASTA數(shù)據(jù)，將下載好的蛋白質(zhì)數(shù)據(jù)，將下載好

8、的蛋白質(zhì)FastaFasta數(shù)據(jù)上傳即可數(shù)據(jù)上傳即可或者將用記事本或?yàn)g覽器打開(kāi)的或者將用記事本或?yàn)g覽器打開(kāi)的FastaFasta數(shù)數(shù)據(jù)據(jù)copycopy至此數(shù)據(jù)框中，蛋白質(zhì)序列可以至此數(shù)據(jù)框中，蛋白質(zhì)序列可以截選，但必須有截選，但必須有第一行的蛋白質(zhì)信息數(shù)第一行的蛋白質(zhì)信息數(shù)據(jù)據(jù)此處填蛋白質(zhì)突變或此處填蛋白質(zhì)突變或SNPSNP位點(diǎn)信息，位點(diǎn)信息，如如S578NS578N，L262PL262P，G146AG146A等等SIFT預(yù)測(cè)AR S578N功能變化在Uniport中搜索Androgen Receptor，下載FASTA數(shù)據(jù)，如下圖為瀏覽器打開(kāi)后的結(jié)果sp|P10275|ANDR_HUMA

9、N Androgen receptor OS=Homo sapiens GN=AR PE=1 SV=2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGV

10、EALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPI

11、DYYFPPQKTCLICGDEASGCHYGALTCGSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNP

12、TSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ此為第一行蛋白質(zhì)信息，如果采用此為第一行蛋白質(zhì)信息，如果采用copycopy至數(shù)據(jù)輸入框，而不是采用文件上傳方法，至數(shù)據(jù)輸入框，而不是采用文件上傳方法，紅框中數(shù)據(jù)必須黏貼進(jìn)輸入框，而后面的蛋白質(zhì)序列只需黏貼需要部分紅框中數(shù)據(jù)必須黏貼進(jìn)輸入框，而后面的蛋白質(zhì)序列只需黏貼需要部分注意：一般來(lái)說(shuō)用文件上傳方注意：一般來(lái)說(shuō)用文件上傳方法比較簡(jiǎn)單，但法比較簡(jiǎn)單，但SIFTSIFT對(duì)氨基酸序?qū)Π被嵝蛄杏幸螅笥诹杏幸?，大?00500的氨基酸序的氨基酸序列不能分

13、析，故像列不能分析，故像ARAR這種有這種有919919個(gè)個(gè)AAAA的就不能采用直接上傳模的就不能采用直接上傳模式，而要將氨基酸序列裁剪過(guò)式，而要將氨基酸序列裁剪過(guò)后按后按FastaFasta格式黏貼至數(shù)據(jù)框中格式黏貼至數(shù)據(jù)框中sp|P10275|ANDR_HUMAN Androgen receptor OS=Homo sapiens GN=AR PE=1 SV=2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQ

14、PQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAG

15、AAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCG CKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVV

16、KWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWLQITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ我們需要先編輯我們需要先編輯FASTAFASTA數(shù)據(jù)，在記事本中打開(kāi)，首先找到第數(shù)據(jù)，在記事本中打開(kāi)，首先找到第578578位的位的S S（紅色標(biāo)出），（紅色標(biāo)出），因?yàn)橐驗(yàn)镾IFTSIFT最佳

17、預(yù)測(cè)大小為最佳預(yù)測(cè)大小為300-400300-400左右的氨基酸序列，那么我們將之前的左右的氨基酸序列，那么我們將之前的400400個(gè)氨基個(gè)氨基酸刪除（藍(lán)色部分），那么我們的突變位點(diǎn)就從酸刪除（藍(lán)色部分），那么我們的突變位點(diǎn)就從S578NS578N變?yōu)樽優(yōu)镾178NS178N，最后將末尾的，最后將末尾的139139個(gè)氨基酸也一并刪除（咖啡色），保留中間個(gè)氨基酸也一并刪除（咖啡色），保留中間389389個(gè)氨基酸，加上第一行的蛋白質(zhì)個(gè)氨基酸，加上第一行的蛋白質(zhì)信息，這就是我們需要提交的數(shù)據(jù)信息，這就是我們需要提交的數(shù)據(jù)將剛才編輯好的數(shù)據(jù)填入這個(gè)框中（之前介紹過(guò)將剛才編輯好的數(shù)據(jù)填入這個(gè)框中（之前介

18、紹過(guò)這個(gè)數(shù)據(jù)輸入框）這個(gè)數(shù)據(jù)輸入框）此框中填入突變信息此框中填入突變信息S178NS178N頁(yè)面中其他選項(xiàng)保持默認(rèn)就可頁(yè)面中其他選項(xiàng)保持默認(rèn)就可以，一般不需要更改，最后提以，一般不需要更改，最后提交就可以交就可以現(xiàn)在大家可以泡杯咖啡或茶，聊聊天，過(guò)個(gè)5-10分鐘就可以出結(jié)果，一般不超過(guò)20分鐘，如果出錯(cuò)，會(huì)有錯(cuò)誤信息提示給你。如果你填好了郵箱，也可以不必等，過(guò)一會(huì)收郵件就可以。結(jié)果會(huì)有一堆英文，看了頭痛，直接找到Scaled Probabilities for Entire Protein和Predictions of substitutions entered兩處鏈接，分別點(diǎn)擊進(jìn)去。 Scaled Probabilities for Entire Protein給出了所提交氨基酸每個(gè)位點(diǎn)發(fā)生突變后的計(jì)算分?jǐn)?shù)，只要分?jǐn)?shù)小于0.05就認(rèn)為可能影響到蛋白

人人文庫(kù)> 全部分類> 教育資料 > 課設(shè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

Polyphen2和SIFT教程

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

Polyphen2和SIFT教程

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔