![基因組注釋詳解_第1頁](http://file4.renrendoc.com/view/9ed2e78e6beef7be2572f4b77b5ed69c/9ed2e78e6beef7be2572f4b77b5ed69c1.gif)
![基因組注釋詳解_第2頁](http://file4.renrendoc.com/view/9ed2e78e6beef7be2572f4b77b5ed69c/9ed2e78e6beef7be2572f4b77b5ed69c2.gif)
![基因組注釋詳解_第3頁](http://file4.renrendoc.com/view/9ed2e78e6beef7be2572f4b77b5ed69c/9ed2e78e6beef7be2572f4b77b5ed69c3.gif)
![基因組注釋詳解_第4頁](http://file4.renrendoc.com/view/9ed2e78e6beef7be2572f4b77b5ed69c/9ed2e78e6beef7be2572f4b77b5ed69c4.gif)
![基因組注釋詳解_第5頁](http://file4.renrendoc.com/view/9ed2e78e6beef7be2572f4b77b5ed69c/9ed2e78e6beef7be2572f4b77b5ed69c5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
基因組注釋基因組測(cè)序相關(guān)技術(shù)發(fā)展
198119861989199119941998200020022003200620072008Inthecomingfuture200920102005AffylaunchesGeneExpressionmicroarraysRiseofGenbankdatabasesfromDNAsequencingABIcommercializesfirstautomatedDNAsequencerLowhangingfruit:cysticfibrosismutationidentified3700DNAAnalyzerinHumanGenomeProject;DNAsequencinggoesindustrialFirstmicroarraypublication-onArabidopsisILMNlaunchesgeneexpressionarraysHumanGenomeProject&CeleraGenomicscompletesfirstdraftgenomeHapmapprojectlaunchedHapmap1stphasedatareleaseAffy&ILMNbothlaunched100KgenotypingarraysRiseofGenomeWideAssociationStudies(GWAS)RocheGSFLXlaunchedILMNboughtSolexa;launchesGAABISOLiD1.0Launched!TheSequencingShakeup!!SOLiD3.0:100GBoutofthebox!The3rdGenerationSequencingwillbelaunchedILMNHiSeq2000launched<2weeks~$1,0000.010.101.0010.00100.001,000.0010,000.00100,000.00$MThroughput
(Gb)CostofperHumanGenomeInnovationofNGSthroughput3Gb6Gb20-30Gb0204060801001202402007200820092010199020012012200720100.001Moore’sLaw更低的價(jià)格使得基于測(cè)序的科研和臨床應(yīng)用越來越被接受13years~$3,000,000,000200Gb-300Gb測(cè)序技術(shù)的發(fā)展帶來測(cè)序價(jià)格的下降Illumina/Solexa/GIIxGeneticAnalyzer50~95GB/runIllumina/Solexa/HiSeq200GB/runRoche/454GenomeSequencerFLX500Mb/runAppliedBiosystemsSOLiD4100GB/runAppliedBiosystemsSOLiD/HQ300GB/run成熟的二代測(cè)序技術(shù)平臺(tái)高通量測(cè)序服務(wù)未知基因組測(cè)序(Denovogenomesequencing)基因組重測(cè)序(Wholegenomeresequencing)實(shí)驗(yàn)數(shù)據(jù)分析MatePair測(cè)序構(gòu)建Scaffold30X的覆蓋率
(454&(SolexaorSOLiD))序列預(yù)處理(質(zhì)量控制)基因組拼接(基于reference拼接)注釋(基因功能、代謝通路、比較基因組)SNP發(fā)現(xiàn)及注釋實(shí)驗(yàn)數(shù)據(jù)分析30X以上的覆蓋率
(Solexa
orSOLiD)序列預(yù)處理(質(zhì)量控制)基因組分型技術(shù)SNP、Indel、CNV、染色體結(jié)構(gòu)變異及注釋與表型相關(guān)的全基因組關(guān)聯(lián)分析和功能連鎖性分析高通量測(cè)序服務(wù)外顯子捕獲測(cè)序(Targetexomecapture)全基因組甲基化測(cè)序(DNAmethylationsequencing)實(shí)驗(yàn)數(shù)據(jù)分析>30X的覆蓋率
(SolexaorSOLiD)序列預(yù)處理(質(zhì)量控制)基因組分型技術(shù)SNP、Indel、CNV、染色體結(jié)構(gòu)變異及注釋與表型相關(guān)的全基因組關(guān)聯(lián)分析和功能連鎖性分析實(shí)驗(yàn)數(shù)據(jù)分析30X以上的覆蓋率(Solexa
orSOLiD)序列預(yù)處理(質(zhì)量控制)甲基化位點(diǎn)檢測(cè)及注釋高通量測(cè)序服務(wù)轉(zhuǎn)錄組測(cè)序(RNA-seqsequencing)microRNA測(cè)序(microRNAsequencing)實(shí)驗(yàn)數(shù)據(jù)分析mRNA打斷、反轉(zhuǎn)錄、加接頭Denovo454構(gòu)建轉(zhuǎn)錄圖譜Reference
barcode建庫Solexa,SOLiD
序列預(yù)處理(質(zhì)量控制)表達(dá)豐度統(tǒng)計(jì)注釋(功能、代謝通路、表達(dá)差異比較)未知轉(zhuǎn)錄本的分析實(shí)驗(yàn)數(shù)據(jù)分析microRNA提取、兩頭加接頭、反轉(zhuǎn)錄、建庫
(Solexa
orSOLiD)序列預(yù)處理(質(zhì)量控制)已知microRNA豐度統(tǒng)計(jì)未知microRNA預(yù)測(cè)及豐度統(tǒng)計(jì)高通量測(cè)序服務(wù)元基因組測(cè)序(meta-genomesequencing)未知病毒檢測(cè)(Unknown
virusdetecting)實(shí)驗(yàn)數(shù)據(jù)分析DNA提取、建庫序列預(yù)處理(質(zhì)量控制)拼接、注釋(功能、代謝通路)豐度統(tǒng)計(jì)、比較元基因組實(shí)驗(yàn)數(shù)據(jù)分析低量RNA、DNA處理、建庫與宿主、微生物、病毒數(shù)據(jù)庫比較未知病毒的發(fā)現(xiàn)及預(yù)測(cè)兩種測(cè)序策略:基于BAC的方法:先把基因組打碎成200-300kb的片段并制成BAC文庫,再選擇一些BAC進(jìn)一步打碎成3kb左右的小片段,測(cè)序并拼接。全基因組鳥槍法:把基因組直接打碎成3kb左右的小片段,測(cè)序并拼接?;贐AC的方法全基因組DNA隨機(jī)打成大片段選擇并克隆大片段排序,選擇再打碎,克隆,測(cè)序,拼接全基因組鳥槍法基因組DNA
隨機(jī)打碎
測(cè)序并拼接
拼接軟件的新需求能充分利用正反向測(cè)序的配對(duì)信息,避免重復(fù)序列造成的錯(cuò)誤拼接能處理數(shù)以百萬甚至千萬計(jì)的數(shù)據(jù)
程序并行化高效率比對(duì)能逐步拼接基因組注釋SequenceGENESCANORFFinderGENEMARKGenePrediction…BlastnFastaHomologySearchTranscriptionRegulatoryRegionDomainIdentify(HMMER,BLIMPS)Transmembrane(TMAP,TMHMM)LocalizationSites(Psort)Physical&ChemicalPara(PI/MW,EXTCOEF)Post-translationalmodifications(NetNGlyc…)ProteinAnnotation…GeneOntologyPathwayPredictedGeneOrGene原核(Prokaryote)基因編碼區(qū)啟動(dòng)子轉(zhuǎn)錄起始位點(diǎn)非翻譯區(qū)被轉(zhuǎn)錄區(qū)起始密碼子終止密碼子5’3’上游
轉(zhuǎn)錄終止位點(diǎn)下游基因組注釋SequenceGENESCANORFFinderGENEMARKGenePrediction…BlastnFastaHomologySearchTranscriptionRegulatoryRegionDomainIdentify(HMMER,BLIMPS)Transmembrane(TMAP,TMHMM)LocalizationSites(Psort)Physical&ChemicalPara(PI/MW,EXTCOEF)Post-translationalmodifications(NetNGlyc…)ProteinAnnotation…GeneOntologyPathwayPredictedGeneOrGene開放閱讀框ORF
(OpenReadingFrame)一段序列從起始密碼子(startcodon)開始,到終止密碼子(stopcodon)結(jié)束,而且其中不包含其它終止密碼子。微生物基因發(fā)現(xiàn)要解決的問題微生物基因組中80%-90%的序列參與編碼主要問題:如果有兩個(gè)或更多重疊的閱讀框,哪一個(gè)是基因(假定只可能有一個(gè))最可靠的方法–
同源搜索(使用BLAST或FASTA等)主要困難:在無已知同源性信息的情況下尋找基因預(yù)測(cè)軟件GetORFWebAccess
http://bioweb.pasteur.fr/seqanal/interfaces/getorf.htmlApplication(DownloadEmboss)
GETORF:AdvancedOptions
i.Codetouse:選擇不同的codonusagetable,包含有:
(1)Standard
(2)Standard(withalternativeinitiationcodons)
(3)VertebrateMitochondrial
(4)YeastMitochondrial
(5)Mold,Protozoan,CoelenterateMitochondrialandMycoplasma/Spiroplasma
(6)InvertebrateMitochondrial
(7)CiliateMacronuclearandDasycladacean
(8)EchinodermMitochondrial
(9)EuplotidNuclear
(10)Bacterial
(11)AlternativeYeastNuclear
(12)AscidianMitochondrial
(13)FlatwormMitochondrial
(14)BlepharismaMacronuclear
(15)ChlorophyceanMitochondrial
(16)TrematodeMitochondrial
(17)Scenedesmusobliquus
(18)ThraustochytriumMitochondrialGETORF:AdvancedOptionsii.最小的開放閱讀框由多少個(gè)核甘酸組成,預(yù)設(shè)值為30,也就是10個(gè)氨基酸。iii.Typeofoutput:可選擇不同的輸入結(jié)果,包含有:
(1)TranslationofregionsbetweenSTOPcodons
(2)TranslationofregionsbetweenSTARTandSTOPcodons
(3)NucleicsequencesbetweenSTOPcodons
(4)NucleicsequencesbetweenSTARTandSTOPcodons
(5)NucleotidesflankingSTARTcodons
(6)NucleotidesflankinginitialSTOPcodons
(7)NucleotidesflankingendingSTOPcodonsfastagcgphylipemblswissncbinbrfgenbankigcodatastrideracedbstadentextfitchmsfclustalphylipphylip3asn1Metagenomics
CommunityGenomics●EnvironmentalGenomicsWhoisthere?–diversity&abundanceWhattheyaredoing?–Metabolic&interactionWhytheyarethere?–EcologicalrelationsSpeciescomplexityAcidminedrainage1 100 1000 10000SeawaterHumangutSoilThecultivation-independentanalysisofthecollectivegenomesofmicrobialpopulationsobtaineddirectlyfromtheenvironmentTheComplexityofMetagenomicsAABCDA’Isolatedgenome–singlesourceofDNAMetagenome–multiplesourceofDNAXGenomeAnnotation,Metagenomics?readsassembliesgenesannotationTraditionalgenomicsreadsassembliesORFsannotationMetagenomics???
HugeMultipleorganismsFragmental
HugePartialORFsWrongORFsQ:Solution?
A:Clustering.ProteinfamiliesNovelfamiliesORFvalidation
HugeMultipleorganismsUnevencoverage真核生物的基因的完整結(jié)構(gòu)
及它的表達(dá)過程transcriptionRNAsplicingproteintranslationexon1DNAexon2exon3intron1intron2promotergtgtagagupstreamdownstream5’UTR3’UTRgtgtagagPrimaryRNAtranscript3`5’MatureRNAUTSuga,uaa,uag3`aaa…5’基因識(shí)別找出在一段DNA序列中,是否存在ORF,亦及“基因”。判明基因的結(jié)構(gòu),包括起止位置,外顯子/內(nèi)含子邊界,啟動(dòng)子,polyA區(qū)域,非轉(zhuǎn)譯區(qū)(UTR)等。預(yù)測(cè)真基因和“假基因”(pseudogene)及可能的剪切位點(diǎn)。基于同源性的基因預(yù)測(cè)法“從頭開始”(Abinitio)預(yù)測(cè)法綜合使用以上兩種方法:如TwinScan其它方法:如數(shù)字信號(hào)處理,Z曲線,等基因預(yù)測(cè)方法分類基于序列相似性的基因預(yù)測(cè)將基因組序列與EST(expressedsequencetag,表達(dá)序列標(biāo)記)或cDNA等相比較(用Sim4等方法),從而找出與mRNA相對(duì)應(yīng)的區(qū)域。將基因組序列與蛋白質(zhì)數(shù)據(jù)庫相比較(用BLASTX等方法),從而找出可能的編碼區(qū)。將預(yù)測(cè)得到的多肽與蛋白質(zhì)數(shù)據(jù)庫相比較將基因組序列與同源性相近物種的基因組相比較,找出保守區(qū)域。優(yōu)點(diǎn):基于已有的生物學(xué)數(shù)據(jù),因此結(jié)果更有生物學(xué)意義缺點(diǎn):
受限于已有的生物學(xué)數(shù)據(jù)數(shù)據(jù)庫可能存在的誤差對(duì)于相似程度應(yīng)如何定義基于同源性的基因預(yù)測(cè)法優(yōu)缺點(diǎn)同源搜索HomologySearcha.序列局部相似比較。試圖發(fā)現(xiàn)有生物意義保守序列,而不一定要全局相似??梢杂删植肯嗨频贸鰞尚蛄锌赡苡邢嗤δ芑蚬δ芟嚓P(guān)。b.比較得到的是相似性,并非同源性,我們必須根據(jù)相似性結(jié)合其他證據(jù)做出判斷。BlastWeb:/blast/Application:/BLAST/download.shtml如何正確看待比較結(jié)果BLAST找出的結(jié)果僅僅是表示兩條序列之間有局部相似,與同源性關(guān)系不大,認(rèn)定功能相同或相關(guān)也不是充分的。一定要結(jié)合其他的分析結(jié)果判斷。BLAST結(jié)果中相似部分需要認(rèn)真仔細(xì)觀察??纯聪嗨频牟糠质巧锷瞎δ苤匾谋J夭糠?,還是一些無關(guān)緊要的重復(fù)序列結(jié)合已知的信息(比如該蛋白不可能有某種功能和可能有某種功能),注意在比較中排在后面的是否與其他已知信
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)保理念下的現(xiàn)代家居設(shè)計(jì)風(fēng)格
- 現(xiàn)代飲食文化與胃腸健康的平衡
- 生產(chǎn)環(huán)境下的操作規(guī)范與質(zhì)量控制
- 現(xiàn)代企業(yè)網(wǎng)絡(luò)攻擊的防范與應(yīng)對(duì)
- 現(xiàn)代企業(yè)決策分析與科學(xué)決策
- 2023三年級(jí)語文下冊(cè) 第八單元 口語交際:趣味故事會(huì)配套說課稿 新人教版
- Unit5 Humans and nature Lesson 1 A sea story 說課稿-2024-2025學(xué)年高中英語北師大版(2019)必修第二冊(cè)001
- 2024-2025學(xué)年新教材高中數(shù)學(xué) 第五章 三角函數(shù) 5.7 三角函數(shù)的應(yīng)用(2)說課稿 新人教A版必修第一冊(cè)
- 2023八年級(jí)數(shù)學(xué)下冊(cè) 第18章 平行四邊形18.1 平行四邊形的性質(zhì)第2課時(shí) 平行四邊形的性質(zhì)定理3說課稿 (新版)華東師大版
- 2023二年級(jí)語文上冊(cè) 第二單元 2 樹之歌配套說課稿 新人教版
- (人衛(wèi)版第九版?zhèn)魅静W(xué)總論(一))課件
- 壓力性損傷護(hù)理質(zhì)控細(xì)則及集束化管理措施
- 《批判性思維原理和方法》全套教學(xué)課件
- 產(chǎn)后康復(fù)-腹直肌分離
- 丙烯-危險(xiǎn)化學(xué)品安全周知卡
- 粉條加工廠建設(shè)項(xiàng)目可行性研究報(bào)告
- 《配電網(wǎng)設(shè)施可靠性評(píng)價(jià)指標(biāo)導(dǎo)則》
- 2024年國(guó)家電網(wǎng)招聘之通信類題庫附參考答案(考試直接用)
- CJJ 169-2012城鎮(zhèn)道路路面設(shè)計(jì)規(guī)范
- 食品企業(yè)日管控周排查月調(diào)度記錄及其報(bào)告格式參考
- 產(chǎn)品質(zhì)量法解讀課件1
評(píng)論
0/150
提交評(píng)論