![蛋白質(zhì)蛋白質(zhì)相互作用第二章_第1頁](http://file4.renrendoc.com/view/d67d47a9279e29e8bf5aab3ecbd7b9e2/d67d47a9279e29e8bf5aab3ecbd7b9e21.gif)
![蛋白質(zhì)蛋白質(zhì)相互作用第二章_第2頁](http://file4.renrendoc.com/view/d67d47a9279e29e8bf5aab3ecbd7b9e2/d67d47a9279e29e8bf5aab3ecbd7b9e22.gif)
![蛋白質(zhì)蛋白質(zhì)相互作用第二章_第3頁](http://file4.renrendoc.com/view/d67d47a9279e29e8bf5aab3ecbd7b9e2/d67d47a9279e29e8bf5aab3ecbd7b9e23.gif)
![蛋白質(zhì)蛋白質(zhì)相互作用第二章_第4頁](http://file4.renrendoc.com/view/d67d47a9279e29e8bf5aab3ecbd7b9e2/d67d47a9279e29e8bf5aab3ecbd7b9e24.gif)
![蛋白質(zhì)蛋白質(zhì)相互作用第二章_第5頁](http://file4.renrendoc.com/view/d67d47a9279e29e8bf5aab3ecbd7b9e2/d67d47a9279e29e8bf5aab3ecbd7b9e25.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
蛋白質(zhì)蛋白質(zhì)相互作用第二章第1頁,課件共88頁,創(chuàng)作于2023年2月生物信息學(xué)數(shù)據(jù)庫的種類核酸、蛋白序列數(shù)據(jù)庫基因組數(shù)據(jù)庫生物大分子三維結(jié)構(gòu)數(shù)據(jù)庫以上述數(shù)據(jù)庫及文獻(xiàn)為基礎(chǔ)的二次數(shù)據(jù)庫第2頁,課件共88頁,創(chuàng)作于2023年2月生物信息學(xué)數(shù)據(jù)庫資源截至2011年,生物信息學(xué)數(shù)據(jù)庫總數(shù)已經(jīng)達(dá)到1380個(gè),其中少數(shù)大型數(shù)據(jù)庫存儲(chǔ)著大多數(shù)生物信息原始數(shù)據(jù),絕大多數(shù)的數(shù)據(jù)庫是針對(duì)特定領(lǐng)域的數(shù)據(jù)提供檢索與分析。自2000年以來,NecleticAcidsResearch雜志每年的第一期會(huì)收集全世界的生物信息數(shù)據(jù)庫信息,每年的第七期會(huì)出版全世界生物信息分析工具信息。第3頁,課件共88頁,創(chuàng)作于2023年2月核酸序列數(shù)據(jù)庫內(nèi)容包括世界上所有已公布的核酸序列及其翻譯產(chǎn)物序列報(bào)告和相關(guān)注釋GenBank美國(guó)基因數(shù)據(jù)銀行
/Embl歐洲分子生物實(shí)驗(yàn)室
http://www.ebi.ac.uk/embl.htmlDDBJ日本國(guó)立遺傳研究所核酸數(shù)據(jù)庫
http://www.ddbj.nig.ac.jp第4頁,課件共88頁,創(chuàng)作于2023年2月蛋白質(zhì)序列數(shù)據(jù)庫SWISS-PROT(瑞士日內(nèi)瓦大學(xué))蛋白質(zhì)序列數(shù)據(jù)庫http://www.Expasy.chNCBI蛋白質(zhì)數(shù)據(jù)庫/entrezPIR蛋白質(zhì)序列信息資源庫(美、德)
內(nèi)容包括序列及功能信息、蛋白識(shí)別、蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)及其他功能第5頁,課件共88頁,創(chuàng)作于2023年2月NCBI數(shù)據(jù)庫NCBI(美國(guó)國(guó)家生物信息中心)成立于1988年,是NIH(國(guó)家衛(wèi)生研究院)的附屬機(jī)構(gòu)。主要任務(wù):建立公共數(shù)據(jù)庫(GenBank,dbSNP,OMIM等.)開展計(jì)算生物學(xué)方面的研究開發(fā)序列分析的軟件工具傳播生物醫(yī)學(xué)信息網(wǎng)址:第6頁,課件共88頁,創(chuàng)作于2023年2月在NCBI數(shù)據(jù)庫中查詢序列集成檢索系統(tǒng):
Entrez系統(tǒng)第7頁,課件共88頁,創(chuàng)作于2023年2月限定發(fā)表時(shí)間限定領(lǐng)域標(biāo)簽限定數(shù)據(jù)庫限定基因組位置限定修改時(shí)間限定序列片段限定分子類型排除選項(xiàng)第8頁,課件共88頁,創(chuàng)作于2023年2月GenBankflatfile(GBFF)格式數(shù)據(jù)。GBFF格式數(shù)據(jù)可分為三部分:第一部分為描述信息,第二部分為序列特征信息,第三部分為序列本身。第9頁,課件共88頁,創(chuàng)作于2023年2月第10頁,課件共88頁,創(chuàng)作于2023年2月第11頁,課件共88頁,創(chuàng)作于2023年2月在NCBI中進(jìn)行序列相似性比對(duì)序列相似性與功能相似性具有一定的相關(guān)性,但不絕對(duì)。對(duì)于某物種中新克隆的序列通過尋找其它物種中與之相似的序列有助于對(duì)該序列功能的預(yù)測(cè)。因此序列相似性比對(duì)常常是一個(gè)新克隆出的序列最先進(jìn)行的生物信息學(xué)分析。第12頁,課件共88頁,創(chuàng)作于2023年2月序列相似性比對(duì)工具BLASTBLAST:是BasicLocalAlignmentSearchTool基本局部比對(duì)搜索工具的英文縮寫。NCBI提供了網(wǎng)絡(luò)版的BLAST搜索在線服務(wù)(/BLAST/),該服務(wù)方便、免費(fèi),缺點(diǎn)是不利于大批量數(shù)據(jù)的比對(duì),并且也不能搜索自有的數(shù)據(jù)庫。NCBI提供該程序的單機(jī)版本,通過建立本地?cái)?shù)據(jù)庫可以實(shí)現(xiàn)批量比對(duì)及搜索自有數(shù)據(jù)庫。BLAST包含5個(gè)子程序:
blastnblastpblastXtblastntblastX第13頁,課件共88頁,創(chuàng)作于2023年2月QuerySequence氨基酸序列DNA序列tBLASTxBLASTxBLASTntBLASTnBLASTpNucleotideDatabaseProteinDatabaseNucleotideDatabaseNucleotideDatabaseProteinDatabaseTranslatedTranslatedTranslated第14頁,課件共88頁,創(chuàng)作于2023年2月程序名搜索序列數(shù)據(jù)庫內(nèi)容備注blastpProteinProtein比較氨基酸序列與蛋白質(zhì)數(shù)據(jù)庫使用取代矩陣尋找較遠(yuǎn)的關(guān)系,進(jìn)行SEG過濾blastnNucleotideNucleotide比較核酸序列與核酸數(shù)據(jù)庫尋找較高分值的匹配,對(duì)較遠(yuǎn)的關(guān)系不太適用blastxNucleotideProtein比較核酸序列理論上的六個(gè)讀碼框的所有轉(zhuǎn)換結(jié)果和蛋白質(zhì)數(shù)據(jù)庫用于新的DNA序列和ESTs的分析,可轉(zhuǎn)譯搜索序列tblastnProteinNucleotide比較蛋白質(zhì)序列和核酸序列數(shù)據(jù)庫,動(dòng)態(tài)轉(zhuǎn)換為六個(gè)讀碼框的結(jié)果用于尋找數(shù)據(jù)庫中沒有標(biāo)注的編碼區(qū),可轉(zhuǎn)譯數(shù)據(jù)庫序列tblastxNucleotideNucleotide比較核酸序列和核酸序列數(shù)據(jù)庫,經(jīng)過兩次動(dòng)態(tài)轉(zhuǎn)換為六個(gè)讀碼框的結(jié)果轉(zhuǎn)譯搜索序列與數(shù)據(jù)庫序列第15頁,課件共88頁,創(chuàng)作于2023年2月Blastx
目標(biāo)序列為ATGAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC6個(gè)讀碼框翻譯5’端到3’端第一位起始:ATGAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC第二位起始:TGAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC第三位起始:GAGTACCGCTAAATTAGTTAAATCAAAAGCGACCAATCTGCTTTATACCCGC3’端到5’端第一位起始:GCGGGTATAAAGCAGATTGGTCGCTTTTGATTTAACTAATTTAGCGGTACTCAT第二位起始:CGGGTATAAAGCAGATTGGTCGCTTTTGATTTAACTAATTTAGCGGTACTCAT第三位起始:GGGTATAAAGCAGATTGGTCGCTTTTGATTTAACTAATTTAGCGGTACTCAT第16頁,課件共88頁,創(chuàng)作于2023年2月第17頁,課件共88頁,創(chuàng)作于2023年2月BLAST原理Query:
GTACTGGACATGGACCCTACAGGAAGTACTGGACATTACTGGACATGACTGGACATGGCTGGACATGGATGGACATGGACGGACATGGACCGACATGGACCCACATGGACCCTCATGGACCCTA
…….Minimumwordsize=7Blastndefault=11Megablastdefault=28第18頁,課件共88頁,創(chuàng)作于2023年2月序列匹配的最低標(biāo)準(zhǔn)核酸BLAST需要一個(gè)精確的匹配蛋白BLAST需要在40個(gè)氨基酸內(nèi)有兩個(gè)匹配NeighborhoodwordsExactwordmatchATCGCCATGCTTAATTGGGCTT
CATGCTTAATT一個(gè)匹配GTQITVEDLFYNI
SEI
YYN兩個(gè)匹配第19頁,課件共88頁,創(chuàng)作于2023年2月BLASTn缺點(diǎn)的一個(gè)反例第20頁,課件共88頁,創(chuàng)作于2023年2月在NCBI中進(jìn)行序列相似性比對(duì)第21頁,課件共88頁,創(chuàng)作于2023年2月第22頁,課件共88頁,創(chuàng)作于2023年2月第23頁,課件共88頁,創(chuàng)作于2023年2月核酸數(shù)據(jù)庫參考RNA數(shù)據(jù)庫,參考染色體數(shù)據(jù)庫染色體數(shù)據(jù)庫est表達(dá)序列標(biāo)簽數(shù)據(jù)庫基因組勘測(cè)數(shù)據(jù)庫高通量基因組測(cè)序數(shù)據(jù)庫專利序列數(shù)據(jù)庫蛋白質(zhì)數(shù)據(jù)存儲(chǔ)數(shù)據(jù)庫alu_repeats數(shù)據(jù)庫序列標(biāo)簽位點(diǎn)數(shù)據(jù)庫
全基因組鳥槍序列拼接數(shù)據(jù)庫
轉(zhuǎn)錄組鳥槍序列拼接數(shù)據(jù)庫16S核糖體RNA序列數(shù)據(jù)庫第24頁,課件共88頁,創(chuàng)作于2023年2月第25頁,課件共88頁,創(chuàng)作于2023年2月第26頁,課件共88頁,創(chuàng)作于2023年2月第27頁,課件共88頁,創(chuàng)作于2023年2月第28頁,課件共88頁,創(chuàng)作于2023年2月第29頁,課件共88頁,創(chuàng)作于2023年2月第30頁,課件共88頁,創(chuàng)作于2023年2月BlastP第31頁,課件共88頁,創(chuàng)作于2023年2月打分矩陣:PAM30PAM70BLOSUM80BLOSUM62BLOSUM45PAM模型可用于尋找蛋白質(zhì)的進(jìn)化起源,而BLOSUM模型則用于發(fā)現(xiàn)蛋白質(zhì)的保守域。第32頁,課件共88頁,創(chuàng)作于2023年2月進(jìn)行比對(duì)的數(shù)據(jù)庫圖形化結(jié)果第33頁,課件共88頁,創(chuàng)作于2023年2月E值(E-value)表示僅僅因?yàn)殡S機(jī)性造成獲得這一比對(duì)結(jié)果的可能性。這一數(shù)值越接近零,發(fā)生這一事件的可能性越小。第34頁,課件共88頁,創(chuàng)作于2023年2月基因開放讀碼框的識(shí)別/gorf/gorf.html第35頁,課件共88頁,創(chuàng)作于2023年2月第36頁,課件共88頁,創(chuàng)作于2023年2月第37頁,課件共88頁,創(chuàng)作于2023年2月第38頁,課件共88頁,創(chuàng)作于2023年2月/GENSCAN.html第39頁,課件共88頁,創(chuàng)作于2023年2月預(yù)測(cè)單位編號(hào)類型正負(fù)鏈起始終止位點(diǎn)長(zhǎng)度分值及概率第40頁,課件共88頁,創(chuàng)作于2023年2月第41頁,課件共88頁,創(chuàng)作于2023年2月CpG島定義:位于多種脊椎動(dòng)物已知基因轉(zhuǎn)錄起始位點(diǎn)周圍、由胞嘧啶(C)和鳥嘧啶(G)組成的串聯(lián)重復(fù)序列。CpG雙核苷酸在人類基因組中的分布很不均一,而在基因組的某些區(qū)段,CpG保持或高于正常概率,這些區(qū)段被稱作CpG島,在哺乳動(dòng)物基因組中的1~2kb的DNA片段,它富含非甲基化的CpG雙倍體。CpG島主要位于基因的啟動(dòng)子(promotor)和第一外顯子區(qū)域,約有60%以上基因的啟動(dòng)子含有CpG島。GC含量大于50%,長(zhǎng)度超過200bp。
第42頁,課件共88頁,創(chuàng)作于2023年2月CpG島區(qū)域預(yù)測(cè)http://www.ebi.ac.uk/Tools/emboss/cpgplot/第43頁,課件共88頁,創(chuàng)作于2023年2月第44頁,課件共88頁,創(chuàng)作于2023年2月轉(zhuǎn)錄終止信號(hào)預(yù)測(cè)在mRNA終止密碼子的下游位置上一般有加尾信號(hào),其主要標(biāo)志位AATAAA序列,稱為多聚腺苷酸信號(hào),簡(jiǎn)稱PolyA信號(hào),據(jù)此可以預(yù)測(cè)基因終止位點(diǎn)。第45頁,課件共88頁,創(chuàng)作于2023年2月第46頁,課件共88頁,創(chuàng)作于2023年2月啟動(dòng)子區(qū)域的預(yù)測(cè)/molbio/proscan/第47頁,課件共88頁,創(chuàng)作于2023年2月第48頁,課件共88頁,創(chuàng)作于2023年2月可變剪切和轉(zhuǎn)錄多樣性數(shù)據(jù)庫ASTD該數(shù)據(jù)庫是有EBI開發(fā)的可變剪切和轉(zhuǎn)錄多樣性數(shù)據(jù)庫(alternativesplicingandtranscriptdiversity,ASTD),能提供可變剪切時(shí)間(alternativesplicingevent),轉(zhuǎn)錄產(chǎn)物(transcriptproduct),選擇性轉(zhuǎn)錄起始位點(diǎn)(TSS)及polyA位點(diǎn)等詳細(xì)信息。第49頁,課件共88頁,創(chuàng)作于2023年2月電子克隆該方法基于EST和基因組數(shù)據(jù)庫,運(yùn)用生物信息學(xué)知識(shí)和計(jì)算機(jī)技術(shù)對(duì)EST或基因組數(shù)據(jù)庫進(jìn)行同源比對(duì),然后拼接出基因的編碼序列。首先,我們要有某個(gè)基因的一段EST序列作為種子序列,通過它來電子克隆該基因。我們選用擬南芥中的AMP1基因作為起始序列,克隆油菜(Brassicanapa)的AMP1基因。第50頁,課件共88頁,創(chuàng)作于2023年2月第51頁,課件共88頁,創(chuàng)作于2023年2月比對(duì)獲得13條同源序列第52頁,課件共88頁,創(chuàng)作于2023年2月油菜的這些EST序列與擬南芥AMP1基因序列高度同源。第53頁,課件共88頁,創(chuàng)作于2023年2月第54頁,課件共88頁,創(chuàng)作于2023年2月將序列存儲(chǔ)為FASTA個(gè)格式的文件,下載下來。第55頁,課件共88頁,創(chuàng)作于2023年2月第56頁,課件共88頁,創(chuàng)作于2023年2月EST序列拼接對(duì)得到的13個(gè)EST按照它們的重疊區(qū)域進(jìn)行序列拼接,合為一條長(zhǎng)的序列。該過程被稱為Contig,可以使用的軟件是CAP3,網(wǎng)址為http://pbil.univ-lyon1.fr/cap3.php第57頁,課件共88頁,創(chuàng)作于2023年2月第58頁,課件共88頁,創(chuàng)作于2023年2月得到Contig1序列以后,重復(fù)進(jìn)行Blastn比對(duì)油菜的EST序列,再次進(jìn)行序列延長(zhǎng),直到序列不能再延長(zhǎng)為止。第59頁,課件共88頁,創(chuàng)作于2023年2月以上做的是親緣關(guān)系較近的電子克隆,應(yīng)用Blastn比對(duì)程序較容易獲得比對(duì)結(jié)果,但如果對(duì)于物種親緣關(guān)系較遠(yuǎn)的物種則上述方法就不容易找到匹配序列。我們可以嘗試使用tblastn和tblastx程序進(jìn)行比對(duì)。下面我們應(yīng)用擬南芥的AMP1基因?qū)λ綞ST做電子克隆。第60頁,課件共88頁,創(chuàng)作于2023年2月第61頁,課件共88頁,創(chuàng)作于2023年2月第62頁,課件共88頁,創(chuàng)作于2023年2月第63頁,課件共88頁,創(chuàng)作于2023年2月第64頁,課件共88頁,創(chuàng)作于2023年2月堿基總數(shù)大于50000的序列的拼接應(yīng)用online的CAP3程序允許的最大堿基總數(shù)為50000,對(duì)于堿基總數(shù)大于50000的可選擇其它軟件進(jìn)行拼接。這里我們用VectorNTI軟件進(jìn)行拼接。第65頁,課件共88頁,創(chuàng)作于2023年2月打開ContigExpressProject程序,導(dǎo)入FASTA格式的文件第66頁,課件共88頁,創(chuàng)作于2023年2月第67頁,課件共88頁,創(chuàng)作于2023年2月第68頁,課件共88頁,創(chuàng)作于2023年2月第69頁,課件共88頁,創(chuàng)作于2023年2月第70頁,課件共88頁,創(chuàng)作于2023年2月......第71頁,課件共88頁,創(chuàng)作于2023年2月關(guān)于電子克隆的一些問題對(duì)于親緣關(guān)系較遠(yuǎn)的物種宜選擇tblastx序列比對(duì)EST,這樣能獲得較多的同源EST。但如果EST數(shù)量太多,則需要設(shè)定一定條件篩選掉一部分匹配較差的EST。EST中經(jīng)?;煊休d體序列,應(yīng)注意在拼接前去除載體部分。第72頁,課件共88頁,創(chuàng)作于2023年2月克隆載體的去除載體的去除可以使用NCBI提供的網(wǎng)上工具VecScreen,網(wǎng)址為/VecScreen/VecScreen.html
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 門診輸液室護(hù)士工作總結(jié)
- 幼教行業(yè)助理工作總結(jié)
- 電影行業(yè)技巧提升總結(jié)
- 國(guó)家課程:《機(jī)械制造裝備設(shè)計(jì)》第一章
- 2025-2030全球管式爐行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025-2030全球工業(yè)應(yīng)用移動(dòng)機(jī)器人行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025年全球及中國(guó)電動(dòng)低升降托盤車行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025年全球及中國(guó)塑料3D打印長(zhǎng)絲行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2025-2030全球工業(yè)膠囊填充機(jī)行業(yè)調(diào)研及趨勢(shì)分析報(bào)告
- 2025年全球及中國(guó)微米級(jí)氧化鋯行業(yè)頭部企業(yè)市場(chǎng)占有率及排名調(diào)研報(bào)告
- 2024年北京東城社區(qū)工作者招聘筆試真題
- 《敏捷項(xiàng)目管理》課件
- 統(tǒng)編版(2024新版)七年級(jí)上學(xué)期道德與法治期末綜合測(cè)試卷(含答案)
- 黑龍江省哈爾濱市2024屆中考數(shù)學(xué)試卷(含答案)
- 前程無憂測(cè)評(píng)題庫及答案
- 高三日語一輪復(fù)習(xí)助詞「と」的用法課件
- 物業(yè)管理服務(wù)房屋及公用設(shè)施維修養(yǎng)護(hù)方案
- 五年級(jí)上冊(cè)小數(shù)遞等式計(jì)算200道及答案
- 帶拼音生字本模板(可A4打印)
- 超高大截面框架柱成型質(zhì)量控制
- 森林法講解課件
評(píng)論
0/150
提交評(píng)論