核酸序列分析_第1頁
核酸序列分析_第2頁
核酸序列分析_第3頁
核酸序列分析_第4頁
核酸序列分析_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

關(guān)于核酸序列分析第1頁,講稿共80頁,2023年5月2日,星期三一、分子質(zhì)量、堿基組成、堿基分布二、序列變換三、限制性酶切分析第一節(jié)核酸序列的基本分析(DNAMAN軟件的應(yīng)用)第2頁,講稿共80頁,2023年5月2日,星期三一、核酸測序中載體序列的識別與去除1、利用NCBI的數(shù)據(jù)庫許多數(shù)據(jù)庫中收集了常用的測序載體序列。如果用戶面對的是大批量序列的分析任務(wù),則需要將這些載體數(shù)據(jù)庫下載后進(jìn)行分析。使用Blast程序?qū)Υ祟悢?shù)據(jù)庫進(jìn)行相似性分析即可得知目的序列中是否含有載體序列。(/VecScreen/VecScreen.html)。如果是,那么在對測序數(shù)據(jù)進(jìn)行進(jìn)一步分析之前必須將載體序列去除。(Example)第二節(jié)核酸序列高級分析(數(shù)據(jù)庫及軟件的使用)第3頁,講稿共80頁,2023年5月2日,星期三2、利用SequencherTM軟件美國基因編碼公司(GeneCodesCorp.)所開發(fā)的SequencherTM軟件在識別載體序列方面具有很強(qiáng)的功能。SequencherTM軟件被多個公司用于測序數(shù)據(jù)的分析和管理。該公司同時提供該軟件的演示版,可通過訪問其網(wǎng)址獲得(/home.html)。第4頁,講稿共80頁,2023年5月2日,星期三第5頁,講稿共80頁,2023年5月2日,星期三第6頁,講稿共80頁,2023年5月2日,星期三第7頁,講稿共80頁,2023年5月2日,星期三第8頁,講稿共80頁,2023年5月2日,星期三第9頁,講稿共80頁,2023年5月2日,星期三3、其他人工序列的分析與去除

測序克隆中往往也含有來自于宿主菌核酸序列的污染,或者目的克隆的確來自于該宿主菌。這兩種情況均可通過BlastN軟件直接對GenBank或EMBL數(shù)據(jù)庫進(jìn)行相似性分析進(jìn)行判斷。顯然任何與大腸桿菌和釀酒酵母的序列具有高度一致性的序列必須慎重對待。一些生物如大腸桿菌含有可移動的遺傳物質(zhì)如插入序列。在進(jìn)行克隆構(gòu)建以便測序的過程中,這些序列有時會插入到所構(gòu)建的克隆,導(dǎo)致目的序列測序的干擾。BlastN程序可以很方便地鑒定此類結(jié)果。如果是這樣的話,此類序列則值得懷疑。第10頁,講稿共80頁,2023年5月2日,星期三二、核酸序列的電子延伸1、簡介隨著人類基因組計劃的深入進(jìn)行,很多實驗室采用cDNA文庫大規(guī)模測序的策略獲得了大量表達(dá)序列標(biāo)簽(expressedsequencetag,EST)和較長的cDNA序列。然而在大多數(shù)情況下,人們只能獲得EST序列或較長的cDNA序列。全長cDNA序列的獲得一直是制約新基因發(fā)現(xiàn)的瓶頸。第11頁,講稿共80頁,2023年5月2日,星期三同時,很多實驗室采用差異顯示PCR(differentdisplayPCR,DD-PCR)、代表性差異分析(representationaldifferenceanalysis,RDA)等技術(shù)發(fā)現(xiàn)了大量具有潛在應(yīng)用價值的新基因片段,也同時面臨著全長cDNA序列難以獲得的問題。在實驗方面,或者通過篩選cDNA文庫,或者通過RACE實驗等去獲得新基因的全長cDNA序列,均需要投入較大的精力。第12頁,講稿共80頁,2023年5月2日,星期三而在另一方面,公共數(shù)據(jù)庫如GenBank/EMBL已經(jīng)擁有了大量的表達(dá)序列標(biāo)簽(/dbEST)。這些EST序列在很多時候和研究者所感興趣的基因序列相重疊,可能代表了同一條cDNA序列。因而,從生物信息學(xué)的原理出發(fā),基于公共數(shù)據(jù)庫中的EST序列或者較長cDNA序列對新獲得的EST序列進(jìn)行電子延伸,就成為很多研究者關(guān)注的焦點。第13頁,講稿共80頁,2023年5月2日,星期三這一方案實際上來自于最初的克隆測序過程。例如,在對一個長為1.5kb的序列進(jìn)行測序過程中,如果每次測序只能獲得500bp的有效序列,則至少需進(jìn)行4次測序,而且所有測序結(jié)果的末端必須相互重疊,以便根據(jù)末端重疊序列將該4次測序所獲得的序列片段進(jìn)行組裝,才能獲得全長序列。1500kb500kb500kb500kb500kb第14頁,講稿共80頁,2023年5月2日,星期三2、基本過程(1)將待分析的核酸序列(稱為種子序列)采用Blast軟件搜索GenBank的EST數(shù)據(jù)庫,選擇與種子序列具有較高同源性的EST序列(一般要求在重疊40個堿基范圍內(nèi)有95%以上有同源性)(稱為匹配序列)(2)將匹配序列和種子序列裝配產(chǎn)生新生序列,此過程稱為片段重疊群分析(contiganalysis)(3)然后再以此新生序列作為種子序列重復(fù)上述過程,直至沒有新的匹配序列入選,從而生成最后的新生序列,作為對種子序列的延伸產(chǎn)物。第15頁,講稿共80頁,2023年5月2日,星期三3、利用UniGene數(shù)據(jù)庫進(jìn)行電子延伸利用blastn程序,選擇數(shù)據(jù)庫“EST”進(jìn)行序列同源性檢索。選擇同源性比分最高的一條EST序列,點擊右邊的UniGene超鏈接,將參與形成UniGeneCluster的所有核酸序列下載到本地,利用SequencherTM軟件或者其他的序列裝配軟件進(jìn)行組裝,形成較長的新生序列。第16頁,講稿共80頁,2023年5月2日,星期三第17頁,講稿共80頁,2023年5月2日,星期三第18頁,講稿共80頁,2023年5月2日,星期三第19頁,講稿共80頁,2023年5月2日,星期三第20頁,講稿共80頁,2023年5月2日,星期三第21頁,講稿共80頁,2023年5月2日,星期三4、存在的不足無法直接通過此種方法獲得多種剪切形式之間的差異,真正的cDNA序列還需通過對延伸后的序列設(shè)計全長引物,經(jīng)過反轉(zhuǎn)錄PCR(RT-PCR)即可證實是否對原序列的有效延伸。第22頁,講稿共80頁,2023年5月2日,星期三三、基因的電子表達(dá)譜分析GenBank/EMBL等數(shù)據(jù)庫在其EST數(shù)據(jù)庫中積累了大量序列的基因表達(dá)信息。電子表達(dá)譜分析原理是:將待分析序列與EST數(shù)據(jù)庫進(jìn)行序列對庫檢索,獲得與待分析核酸序列具有高同源性的EST序列的UniGene編號后,就可通過參與形成UniGeneCluster的序列的組織/細(xì)胞來源來間接地反映分析序列在何種組織中表達(dá)體現(xiàn)在字段cDNASources中。第23頁,講稿共80頁,2023年5月2日,星期三四、核酸序列的電子基因定位分析對核酸序列進(jìn)行電子基因定位(即基因的染色體定位),通過所定位區(qū)帶的相鄰基因簇,間接地提示該基因的功能,是核酸序列分析的一個重要方面。進(jìn)行電子基因定位策略是:利用基因組序列定位A、將待分析序列進(jìn)行對基因組數(shù)據(jù)庫的同源性檢索B、得到確定基因組序列后點擊“GenomeView”觀察其基因組結(jié)構(gòu)C、點擊用紅色標(biāo)記所指示的染色體列表中選擇所對應(yīng)的染色體及區(qū)域。第24頁,講稿共80頁,2023年5月2日,星期三五、cDNA對應(yīng)的基因組序列分析EST和cDNA的基因組序列查詢對于了解該基因組結(jié)構(gòu)包括extron/intron結(jié)構(gòu)、轉(zhuǎn)錄調(diào)控區(qū)域以及何種轉(zhuǎn)錄因子對該基因的表達(dá)進(jìn)行調(diào)控等均十分重要。同時,如果對所獲得cDNA不能完全確定的情況下,也可參考基因組的序列進(jìn)行校正。在人類基因組計劃推動下,NCBI、EMBL、和SangerCentre均提供了基因組序列的同源性分析途徑。第25頁,講稿共80頁,2023年5月2日,星期三1、通過從NCBI查詢?nèi)炕蚪M數(shù)據(jù)庫進(jìn)行序列的分析聯(lián)網(wǎng)至/genome/seq/HsBlast.html可直接對已經(jīng)公布的基因組序列進(jìn)行查詢。2、通過從Sanger中心查詢?nèi)炕蚪M數(shù)據(jù)庫進(jìn)行序列的分析http://www.sanger.ac.uk/cgi-bin/blast/submitblast/hgp第26頁,講稿共80頁,2023年5月2日,星期三六、基于核酸序列對齊分析的功能預(yù)測對庫比較、多序列以及序列之間的兩兩比較、同源性比較及結(jié)果的顯著性評價、分子進(jìn)化樹的繪制。第27頁,講稿共80頁,2023年5月2日,星期三七、可讀框架分析原理——Kozak序列:AUG上游的第三個核苷酸,常常是嘌呤,且多數(shù)是A;緊跟在AUG后面的核苷酸,常常也是嘌呤,但多數(shù)情況下是G。AUG附近的核苷酸序列中以ANNAUGN和GNNAUGPu(T/G)的利用率最高,而沒有起始功能AUG附近的核苷酸序列則無此保守性。/gorf/gorf.html第28頁,講稿共80頁,2023年5月2日,星期三第29頁,講稿共80頁,2023年5月2日,星期三第30頁,講稿共80頁,2023年5月2日,星期三第31頁,講稿共80頁,2023年5月2日,星期三第32頁,講稿共80頁,2023年5月2日,星期三八、基因組序列中的編碼區(qū)/內(nèi)含子結(jié)構(gòu)分析真核基因外顯子-內(nèi)含子連接區(qū)外顯子-內(nèi)含子連接區(qū)就是指外顯子和內(nèi)含子的交界,又稱邊界序列。重要特征:

(1)內(nèi)含子的兩端序列之間沒有廣泛的同源性,不能互補(bǔ)。不能通過形成發(fā)卡式二級結(jié)構(gòu)。(2)外顯子-內(nèi)含子連接區(qū)序列很短,但高度保守。第33頁,講稿共80頁,2023年5月2日,星期三GT-AG法則:幾乎在所有高等真核生物基因中每個內(nèi)含子5′端起始的兩個堿基都是GT,3′端最后兩個堿基總是AG。目前最好并最流行的軟件是GRAIL(GeneRecognitionAnalysisInternetLink)套裝軟件/Grail-1.3/。第34頁,講稿共80頁,2023年5月2日,星期三第35頁,講稿共80頁,2023年5月2日,星期三第36頁,講稿共80頁,2023年5月2日,星期三第37頁,講稿共80頁,2023年5月2日,星期三也可以利用GeneFinder軟件(/urllists/genefind.htm)進(jìn)行基因組序列的內(nèi)含子/外顯子分析。第38頁,講稿共80頁,2023年5月2日,星期三第39頁,講稿共80頁,2023年5月2日,星期三九、基因啟動子、增強(qiáng)子、轉(zhuǎn)錄因子結(jié)合位點分析1、通過EBI匿名FTP獲得數(shù)據(jù)庫2、聯(lián)網(wǎng)至/seq_tools/promoter.html可對基因組序列進(jìn)行啟動子分析。第40頁,講稿共80頁,2023年5月2日,星期三十、重復(fù)序列分析1、RepBase

真核生物DNA中重復(fù)序列數(shù)據(jù)庫,由GeneticInformationResearchInstitute,GIRI維護(hù),其網(wǎng)址為:/server/RepBase/。2、著名的RepeatMasker程序即基于此進(jìn)行工作(/RM/RepeatMasker.html)。第41頁,講稿共80頁,2023年5月2日,星期三第三節(jié)PCR引物設(shè)計第42頁,講稿共80頁,2023年5月2日,星期三一、基本過程PCR是在試管內(nèi)有DNA模版、引物和四種脫氧核糖核苷酸存在條件下,由DNA聚合酶催化的DNA合成反應(yīng)?;痉磻?yīng)過程分為三步:1、變性變性是指通過加熱使DNA雙鏈間的氫鍵斷裂,形成兩條單鏈的過程。加熱到92~95℃可使一切復(fù)雜的DNA都達(dá)到變性的目的。2、退火退火是指在溫度降低的過程中,DNA的復(fù)性過程,即變性后的兩條單鏈在堿基互補(bǔ)基礎(chǔ)上形成氫鍵,結(jié)合成雙鏈。第43頁,講稿共80頁,2023年5月2日,星期三3、延伸

從引物的3′一端開始,沿DNA模版,由DNA聚合酶催化的DNA新鏈的合成反應(yīng)。上述三步反應(yīng)構(gòu)成一個循環(huán)。在下一個循環(huán)中,前一循環(huán)的產(chǎn)物再變性為兩條單鏈作為模版,這樣往復(fù)循環(huán),即可使靶序列大大擴(kuò)增。第44頁,講稿共80頁,2023年5月2日,星期三二、PCR的引物1、引物長度以15~30個堿基為宜。過短會影響到擴(kuò)增的特異性。若擴(kuò)增產(chǎn)物≤500堿基,引物長度為16~18堿基即可。若擴(kuò)增4~5kb的大片段,引物最好不要少于24個堿基。2、引物二聚體及二級結(jié)構(gòu)

盡量避免在引物分子之間或引物分子內(nèi)部有過多的互補(bǔ)堿基。如果很難完全避免引物分子內(nèi)二級結(jié)構(gòu),也要盡可能地避免在引物3′一端出現(xiàn)二級結(jié)構(gòu)。3′一端有二級結(jié)構(gòu)的引物不能有效引發(fā)延伸。第45頁,講稿共80頁,2023年5月2日,星期三3、堿基分布的均衡性

避免嘌呤或嘧啶的堆積,避免連續(xù)出現(xiàn)4個以上的同一堿基。各種堿基最好分布均勻。4、引物在模版上結(jié)合位點的唯一性

保證擴(kuò)增產(chǎn)物的特異性。第46頁,講稿共80頁,2023年5月2日,星期三5、堿基配對的嚴(yán)格性一般要求引物與模版間的堿基能完全配對特殊實驗?zāi)康?,部分堿基不配對是許可的。但要求引物3′一端必須與模版配對。如:①在5′一端引入酶切位點。②點突變。③設(shè)計簡并引物。第47頁,講稿共80頁,2023年5月2日,星期三6、引物的Tm值(解鏈溫度)

在允許范圍內(nèi),選擇較高的溫度,可大大減少引物和模版之間非特異性結(jié)合,從而提高PCR的特異性。引物容易復(fù)性到模版上的溫度是Tm值減去15~25℃,但為了提高PCR的特異性,在實際應(yīng)用中常常將退火溫度設(shè)定為Tm值減去5~15℃。在實驗之初,寧可選用較低的退火溫度,首先得到有PCR合成產(chǎn)物之后再逐步提高退火溫度,以提高反應(yīng)的特異性。兩條引物的Tm盡可能相等或接近,最好相差不超過3℃。第48頁,講稿共80頁,2023年5月2日,星期三7、引物的內(nèi)部穩(wěn)定性

引物的5′端互補(bǔ)序列應(yīng)該是相對穩(wěn)定結(jié)構(gòu),而3′端應(yīng)在堿基配對的情況下盡可能為低穩(wěn)定結(jié)構(gòu)。

3′端應(yīng)該選用A、T少選用G、C,這種引物有更高的引發(fā)效率,且能有效地避免假引發(fā)。第49頁,講稿共80頁,2023年5月2日,星期三二、引物設(shè)計軟件的引物設(shè)計功能主要體現(xiàn)在:1、引物分析評價功能,以“Oligo6”最優(yōu)秀。2、引物的自動搜索功能。以“PrimerPremier”為最強(qiáng)且方便使用在自動搜索的基礎(chǔ)上還要輔以人工分析。引物設(shè)計軟件以“Premier”進(jìn)行自動搜索,“Oligo”進(jìn)行分析評價,如此可快速設(shè)計出成功率很高的引物。第50頁,講稿共80頁,2023年5月2日,星期三引物設(shè)計限制性內(nèi)切酶位點分析DNA基元(motif)查找同源性分析第51頁,講稿共80頁,2023年5月2日,星期三設(shè)計簡并引物簡并引物:根據(jù)一段氨基酸序列反推到DNA來設(shè)計引物,由于遺傳密碼的簡并性,會遇到部分堿基的不確定性。設(shè)計的引物實際上是多個序列的混和物。第52頁,講稿共80頁,2023年5月2日,星期三軟件共給出八種生物亞結(jié)構(gòu)的不同遺傳密碼規(guī)則:纖毛蟲大核(CiliateMacronuclear)無脊椎動物線粒體(InvertebrateMitochondrion)支原體(Mycoplasma)植物線粒體(PlantMitochondrion)原生動物線粒體(ProtozoanMitochondrion)一般標(biāo)準(zhǔn)(Standard)脊椎動物線粒體(VertebrateMitochondrion)酵母線粒體(YeastMitochondrion)第53頁,講稿共80頁,2023年5月2日,星期三第54頁,講稿共80頁,2023年5月2日,星期三第55頁,講稿共80頁,2023年5月2日,星期三第56頁,講稿共80頁,2023年5月2日,星期三第57頁,講稿共80頁,2023年5月2日,星期三第58頁,講稿共80頁,2023年5月2日,星期三第59頁,講稿共80頁,2023年5月2日,星期三PCR模板及產(chǎn)物位置所選的上下游引物的一些性質(zhì)四種重要指標(biāo)的分析引物的最佳退火溫度對引物進(jìn)行修飾編輯第60頁,講稿共80頁,2023年5月2日,星期三

此外還要注意:不同的引物3’端末位堿基在錯配位置導(dǎo)致不同的擴(kuò)增效率,末位堿基為A的錯配效率明顯高于其他3個堿基,因此應(yīng)當(dāng)避免在引物的3’端使用堿基A。第61頁,講稿共80頁,2023年5月2日,星期三△G值是指DNA雙鏈形成所需的自由能,反映了雙鏈結(jié)構(gòu)內(nèi)部堿基對的相對穩(wěn)定性。應(yīng)當(dāng)選用3’端△G值較低(絕對值不超過9),而5’端和中間的△G值相對較高的引物。引物二聚體及發(fā)夾結(jié)構(gòu)的能值過高(超過4.5kcal/mol)易導(dǎo)致產(chǎn)生引物二聚體帶。鄰近6至7個堿基組成的亞單位在一個指定數(shù)據(jù)庫文件中的出現(xiàn)頻率。該頻率高則可增加錯誤引發(fā)的可能性。選取引物時,宜選用3’端Frq值相對較低的片段。第62頁,講稿共80頁,2023年5月2日,星期三選好上下游引物后檢查:1、引物二聚體尤其是3’端二聚體形成的可能性。2、發(fā)夾結(jié)構(gòu)(hairpin);與二聚體相同,發(fā)夾結(jié)構(gòu)的能值越低越好。一般來說,這兩項結(jié)構(gòu)的能值以不超過4.5為好3、GC含量以45-55%為宜。4、如果模板不是基因組DNA,而是特定模板序列,最好還進(jìn)行Falseprimingsite的檢測。第63頁,講稿共80頁,2023年5

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論