轉(zhuǎn)錄組學(xué)主要技術(shù)及其應(yīng)用研究-_第1頁
轉(zhuǎn)錄組學(xué)主要技術(shù)及其應(yīng)用研究-_第2頁
轉(zhuǎn)錄組學(xué)主要技術(shù)及其應(yīng)用研究-_第3頁
轉(zhuǎn)錄組學(xué)主要技術(shù)及其應(yīng)用研究-_第4頁
轉(zhuǎn)錄組學(xué)主要技術(shù)及其應(yīng)用研究-_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、轉(zhuǎn)錄組學(xué)主要技術(shù)及其應(yīng)用研究姓名:梁迪專業(yè):微生物學(xué)年級:2013學(xué)號:3130179二零一四年六月十五日轉(zhuǎn)錄學(xué)主要技術(shù)及其應(yīng)用研究摘要:轉(zhuǎn)錄組(transcriptome是特定組織或細胞在某一發(fā)育階段或功能狀態(tài)下轉(zhuǎn)錄出來的所有RNA的集合。轉(zhuǎn)錄組學(xué)研究能夠從整體水平研究基因功能以及基因結(jié)構(gòu),揭示特定生物學(xué)過程以及疾病發(fā)生過程中的分子機理。目前,轉(zhuǎn)錄組學(xué)研究技術(shù)主要包括兩種:基于雜交技術(shù)的微陣列技術(shù)(microarray和基于測序技術(shù)的轉(zhuǎn)錄組測序技術(shù),包括表達序列標(biāo)簽技術(shù)(Expression Sequence Tags Technology,EST、基因表達系列分析技術(shù)(Serial ana

2、lysis of gene expression,SAGE、大規(guī)模平行測序技術(shù)(Massively parallel signature sequencing,MPSS、以及RNA 測序技術(shù)(RNA sequencing,RNA-seq。文章主要介紹了以上轉(zhuǎn)錄組學(xué)主要研究技術(shù)的原理、技術(shù)特點及其應(yīng)用,并就這些技術(shù)面臨的挑戰(zhàn)和未來發(fā)展前景進行了討論,為其今后的研究與應(yīng)用提供參考。關(guān)鍵詞:轉(zhuǎn)錄組學(xué);微陣列技術(shù);轉(zhuǎn)錄組測序技術(shù);應(yīng)用Study on the main technologies of transcriptomicsand their applicationAbstract: The t

3、ranscriptome is the complete set of transcripts for certain type of cells or tissues in a specific developmental stage or physiological condition. Transcriptome analysis can provide a comprehensive understanding of molecularmechanisms involved in specific biological processes and diseases from the i

4、nformation on gene structure and function. Currently, transcriptomics technology mainly includes microarry -based on hybridization technology and transcriptome sequencing-based on sequencing technology, involving Expression sequence tags technology, Serial analysis of gene expression, Massively para

5、llel signature sequencing and RNA sequencing. The detailed principles, technical characteristics and applications of the main transcriptomics technologies are reviewed here, and the challenges and application potentials of these technologies in the future are also discussed. This will present the us

6、eful information for other researchers. Keywords: transcriptomics ; microarray ; transcriptome sequencing; application隨著后基因組時代的到來,轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)、代謝組學(xué)等各種組學(xué)技術(shù)相繼出現(xiàn),其中轉(zhuǎn)錄組學(xué)是率先發(fā)展起來以及應(yīng)用最廣泛的技術(shù)1。1 轉(zhuǎn)錄組和轉(zhuǎn)錄組學(xué)轉(zhuǎn)錄組概念是最先由V eclalesuc和Kinzler等人于1997年提出2。轉(zhuǎn)錄組(transcriptome廣義上是指某個組織或細胞在特定生長階段或生長條件所轉(zhuǎn)錄出來的RNA總和,包括編碼蛋白質(zhì)的mRNA和各種

7、非編碼RNA,如rRNA、tRNA、snoRNA、snRNA、microRNA及其他非編碼RNA等。但狹義上通常僅以mRNA為研究對象。由轉(zhuǎn)錄組的定義可見,其包含了特定的時間和空間限定,這與基因組的概念不同。因此,同一組織或細胞在不同生長條件、生長階段,其轉(zhuǎn)錄組是不同的。通過遺傳學(xué)中心法則我們可以知道,遺傳信息的傳遞是以信使RNA(mRNA為“橋梁”,從DNA傳遞到蛋白質(zhì)。由此可見,轉(zhuǎn)錄組的研究不僅可以解釋細胞或組織的基因組的功能元件,揭示分子成分,還可以用來認識生物學(xué)進程和疾病發(fā)生機制3,4。轉(zhuǎn)錄組學(xué)(transcriptomics是功能基因組學(xué)(Functional Genomics研究的

8、重要組成部分,是一門在整體水平上研究細胞中所有基因轉(zhuǎn)錄及轉(zhuǎn)錄調(diào)控規(guī)律的學(xué)科5,6。隨著人類基因組計劃HGP( Human Genome Project的完成,科學(xué)家也逐漸認識到對基因結(jié)構(gòu)序列的研究僅僅是基因組學(xué)研究的一部分,并不能揭示所有的生命奧秘,所以接下來需要解決的問題是:研究這些基因序列的功能、參與的生命過程、表達調(diào)控方式,以及這些基因在不同的時空條件下的表達差異等。這些問題都需要功能基因組學(xué)技術(shù)來解決,而轉(zhuǎn)錄組學(xué)技術(shù)是功能基因組學(xué)研究的重要組成部分。對基因及其轉(zhuǎn)錄表達產(chǎn)物功能研究的功能基因組學(xué),將為疾病控制和新藥開發(fā)、作物和畜禽品種的改良提供新思路,為人類解決健康問題、食物問題、能源問

9、題和環(huán)境問題提供新方法。2 轉(zhuǎn)錄組學(xué)研究的方法在早期,由于測序價格昂貴、基因序列數(shù)目有限,轉(zhuǎn)錄組學(xué)研究者只能進行極少數(shù)特定基因的結(jié)構(gòu)功能分析和表達研究。最近十幾年,分子生物學(xué)技術(shù)的快速發(fā)展使高通量分析成為可能,這為真正意義上的轉(zhuǎn)錄組學(xué)的研究奠定了基礎(chǔ)。這些高通量研究方法主要可以分為兩類:一類是基于雜交的方法,主要是指微陣列技術(shù)(Microarray;一類是基于測序的方法,這類方法包括表達序列標(biāo)簽技術(shù)(Expression Sequence Tags Technology,EST、基因表達系列分析技術(shù)(Serial analysis of gene expression,SAGE、大規(guī)模平行測序

10、技術(shù)(Massively parallel signature sequencing,MPSS、RNA 測序技術(shù)(RNA sequencing, RNA-seq。其中,Microarray 和EST 技術(shù)是較早發(fā)展起來的先驅(qū)技術(shù),SAGE、MPSS 和RNA-seq 是高通量測序條件下的轉(zhuǎn)錄組學(xué)研究方法轉(zhuǎn)錄組學(xué)研究有助于了解特定生命過程中相關(guān)基因的整體表達情況,進而從轉(zhuǎn)錄水平初步揭示該生命過程的代謝網(wǎng)絡(luò)及其調(diào)控機理。2.1 微陣列技術(shù)(Microarry微陣列技術(shù)是分子生物學(xué)領(lǐng)域具有里程碑式意義的重大突破,它可以同時測量不同樣本中成千上萬個基因在不同環(huán)境和不同狀態(tài)下的表達水平?;虮磉_數(shù)據(jù)是基

11、于DNA 微陣列技術(shù)而產(chǎn)生的反映基因轉(zhuǎn)錄產(chǎn)物mRNA 豐度值的一組數(shù)據(jù)。數(shù)據(jù)中蘊含著豐富的基因活動信息,通過對這些數(shù)據(jù)中所隱含的基因活動信息進行分析,就可以解答一些生物學(xué)領(lǐng)域的問題。如基因的表達在不同環(huán)境中有哪些差異,基因的表達在特定條件下有哪些變化,基因之間有哪些相關(guān)性,以及在不同條件下基因的活動受到哪些影響等等7。DNA微陣列基本制作原理為大規(guī)模集成電路所控制的機器人在尼龍膜或硅片固相支持物表面,有規(guī)律地合成成千上萬個代表不同基因的寡核苷酸“探針”,或液相合成探針后由陣列器(arrayer或機器人點樣于固相支持物表面。這些“探針”可與用放射標(biāo)記物32P或熒光物如熒光素、麗絲胺等標(biāo)記的目的材

12、中的DNA或cDNA互補核酸序列相結(jié)合,通過放射自顯影或激光共聚焦顯微鏡掃描后,對雜交結(jié)果進行計算機軟件處理分析,獲得雜交信號的強度及分布模式圖,以此反映目的材料中有關(guān)基因表達強弱的表達譜。該技術(shù)仍以基因連鎖、連鎖不平衡、限制性長度多態(tài)性、可變串聯(lián)重復(fù)序列及單核苷酸多態(tài)性標(biāo)記等基因定位方法為基礎(chǔ),采用分子雜交等多種技術(shù)方法為手段,進行遺傳作圖,對不同材料中的多個基因表達模式進行平行對比分析,是一種高產(chǎn)出的、新的基因分析方法。以尼龍膜為固相支持物的DNA微陣列和以硅片為固相支持物的DNA芯片,二者在原理上相同,僅在支持物及檢測手段等方面略有不同。在微陣列里最大的一類DNA microarray根

13、據(jù)探針分子的構(gòu)成又可以分為cDNA微陣列和寡核苷酸微陣列。(1cDNA微陣列cDNA微陣列是指對各種生物隨機克隆和隨機測序所得的cDNA片段進行歸類,并把每一類cDNA 片段的代表克隆(代表一個獨立基因經(jīng)過體外擴增,得到大小和序列不同的片段分別經(jīng)過純化后,利用機械手高速將它們高密度有序地點樣固定在玻片硅晶片或尼龍膜上,從而制備成cDNA微陣列,以此對各基因的表達情況進行同步分析。它的特點是造價低、適用面廣、研制周期短、靈活性高。而缺點是點陣密度相對比較低。同時,cDNA微陣列由于基因長短不一,導(dǎo)致溶解溫度Tm各異,眾多的基因在同一張芯片上雜交,使得雜交條件很難同一,這樣也使得其分辨能力受到限制

14、。(2寡核苷酸微陣列寡核苷酸微陣列的主要原理與cDNA微陣列類似,主要是通過堿基互補配對原則進行雜交,來檢測對應(yīng)片斷是否存在、存在量的多少。它與cDNA芯片的本質(zhì)差別在于寡核苷酸的探針片斷相對較短(一般是20-70nt的寡聚核苷酸序列。寡聚核苷酸微陣列的探針經(jīng)過優(yōu)化,長度基本一致,并且Tm也相差不大,所以相比較cDNA微陣列它具有以下優(yōu)點:1.無需擴增,防止擴增失敗影響實驗;2.減少非特異性雜交,能夠有效的區(qū)分同源序列的基因;3.雜交溫度均一,提高了雜交效率;4.減少了微陣列片上探針的二級結(jié)構(gòu)。上述特點使得寡核苷酸微陣列的應(yīng)用日益廣泛。但是當(dāng)寡核苷酸序列較短時,單一的序列不足以代表整個基因,所

15、以又需要用多段序列,從而提高了制作成本。(1表達差異的研究1995年Schena等用了48個PCR擴增的cDNA探針點制的微陣列片分析了野生型和轉(zhuǎn)基因的擬南芥中基因表達差異,并與Northern blot作了比較。發(fā)現(xiàn)Microarray能夠很好的檢測到基因表達水平上的差異,并且能夠在同一張玻片上使用不同的熒光染料同步進行差異比較。近年來,研究多集中于突變型與野生型、環(huán)境脅迫與正常生長型、激素處理與未處理或者不同組織器官之間的比較。Ma等8利用寡核苷酸微陣列研究了玉米3個雄性不育突變體和可育植株花藥4個發(fā)育階段的基因表達情況,檢測到了近9200個正反義轉(zhuǎn)錄本。通過比較每個突變體與其可育花藥的基

16、因表達差異,篩選到了一大批可能與花藥分化相關(guān)的重要轉(zhuǎn)錄因子和調(diào)控因子。Schena等9用人外周血淋巴細胞的cDNA文庫構(gòu)建一個代表1 046個基因的cDNA微陣列,來檢測體外培養(yǎng)的T細胞對熱休克反應(yīng)后不同基因表達的差異。發(fā)現(xiàn)有5個基因在處理后存在非常明顯的高表達,11個基因中度表達增加和6個基因表達明顯抑制。(2尋找可能致病基因或疾病相關(guān)基因Moch等利用腫瘤微陣列芯片(5184個cDNA片段發(fā)現(xiàn)了腎細胞癌的腫瘤標(biāo)志物基因,并與正常細胞進行比較。在532份標(biāo)本中檢測到與胞漿纖維表達有關(guān)的一類基因陽性率為51%-61%,命名為vimentin。追蹤觀察,有Vimentin表達的患者,預(yù)后極差。M

17、och等利用腫瘤微陣列芯片(5184個cDNA 片段發(fā)現(xiàn)了腎細胞癌的腫瘤標(biāo)志物基因,并與正常細胞進行比較。在532份標(biāo)本中檢測到與胞漿纖維表達有關(guān)的一類基因陽性率為51%-61%,命名為vimentin。(3基因點突變及多態(tài)性檢測現(xiàn)用于治療AIDS的藥物主要是病毒逆轉(zhuǎn)錄酶RT和蛋白酶PRO的抑制劑,但在用藥312月后常出現(xiàn)耐藥,其原因是rt、pro基因產(chǎn)生一個或多個點突變,rt基因四個常見突變位點是Asp67Asn、Lys70Arg、Thr215Phe/Tyr和Lys219Gln,四個位點均突變較單一位點突變后對藥物的耐受能力成百倍增加10。如將這些基因突變部位的全部序列構(gòu)建為DNA芯片,則可

18、快速地檢測待測病人是一個還是多個基因突變,這對指導(dǎo)治療和預(yù)后而具有十分重要的意義。Lee等11用含有135 000個探針的DNA微陣列分析了人線粒體基因組DNA多態(tài)性變化。該組探針互補于人線粒體基因組全長16.6 kb,將之與不同個體來源的基因組DNA雜交,發(fā)現(xiàn)人線粒體基因組存在16 493位TC突變,16 223位CT等多位點突變的DNA多態(tài)性特征。DNA微陣列或芯片幾乎可用于所有核酸雜交技術(shù)的各個方面,而在同時比較各組織或同一組織在不同狀態(tài)下上成千上萬個基因的表達狀況、DNA序列分析等方面具有更大的優(yōu)越性12. 有人譽贊“微陣列技術(shù)鋪平了通往21世紀(jì)的醫(yī)學(xué)之路”13,相信在不久的將來, D

19、NA芯片或微陣列技術(shù)將會廣泛應(yīng)用于基礎(chǔ)及臨床醫(yī)學(xué)各個方面,而發(fā)揮出巨大的經(jīng)濟、社會效益。隨著微陣列技術(shù)的廣泛應(yīng)用,其內(nèi)在缺陷也日益暴露出來,成為其發(fā)展的瓶頸。第一,技術(shù)水平還需要不斷提高。非特異性雜交是微陣列技術(shù)的亟待解決的問題,目前,對于這個問題,在實驗中一般采用提高雜交溫度的方法,減少非特異性序列間的相互影響。然而在提高雜交溫度的同時,又很可能造成微陣列靈敏性的降低,使一些應(yīng)該能夠檢測到的基因表達狀況得不到準(zhǔn)確的反映,研究者只能在其中尋找平衡;第二,不同時間不同地點不同平臺的微陣列結(jié)果難于比較。操作者本身造成的實驗誤差不可避免,還有樣品DNA在取樣上的誤差,此外,由于實驗儀器和操作平臺的差

20、別,包括不同實驗地點的差別,也導(dǎo)致了相同樣本檢測到的表達基因相差很大14;第三,數(shù)據(jù)處理難度大。由于微陣列往往集成了成千上萬個基因信息,而且微陣列信號中往往摻雜了大量的背景噪音,最終大量的微陣列數(shù)據(jù),如何與生物體內(nèi)在的因素相結(jié)合,所以,微陣列技術(shù)中最大的挑戰(zhàn)來源于數(shù)據(jù)的處理和數(shù)據(jù)的挖掘。2.2 表達序列標(biāo)簽技術(shù)(EST基因表達序列標(biāo)簽(expressed Sequence tags,ESTs為長約200-800bp的cDNA部分序列。最早利用EST 技術(shù)是1991年Adms用人腦組織cDNA得到的EST進行的,當(dāng)時人類基因組計劃剛剛開始,一些科學(xué)家就主張cDNA測序應(yīng)該先于基因組測序進行,原因

21、是基因組的編碼區(qū)代表了基因組絕大部分信息,而且是對我們直接有用的,而編碼區(qū)長度只有總基因組長度的3%因此可以用最低的代價、最短的時間獲取最多最有用的信息。有了EST的方法之后,人們可以用比cDNA測序更低的費用而得到等量的信息,因此EST技術(shù)已成為目前發(fā)現(xiàn)新基因的強有力的信息工具。一個典型的真核生物mRNA分子由5-U TR (5 端轉(zhuǎn)錄非翻譯區(qū)、ORF (開放閱讀框架、3-U TR (3 端轉(zhuǎn)錄非翻譯區(qū)和poly (A 四部分組成,其cDNA具有對應(yīng)的結(jié)構(gòu)。對于任何一個基因,其5-UTR 和3-U TR都是特定的,即每條cDNA的5端或3端的有限序列可特異性地代表生物體某種組織在特定的時空條

22、件下的一個表達基因。來自某一組織的足夠數(shù)量的ESTs可代表某種組織中基因的表達情況 1 。EST 的數(shù)目可以反映某個基因的表達情況,一個基因的拷貝數(shù)越多,其表達越豐富,測得的相應(yīng)EST 就越多。所以,通過對生物體EST的分析可以獲得生物體內(nèi)基因的表達情況和表達豐度。要獲得生物體EST 信息,通常應(yīng)先構(gòu)建其某個代表性組織的cDNA文庫,然后從中隨機挑取大量克隆,根據(jù)載體的通用引物進行測序,一般可以得到其5或3端的200-500 bp的堿基序列,然后將測得的EST序列與網(wǎng)上已有的EST數(shù)據(jù)庫進行比較,根據(jù)同源性大小,可以初步鑒定出哪些EST 代表已知基因,哪些EST代表未知基因,并可以對生物體基因

23、的表達豐度進行分析。以EST 分析基因表達豐度的原理是這樣的:基因x的高水平表達將導(dǎo)致高水平的mRNAx合成,而與mRNA x相對應(yīng)的cDNA在cDNA文庫中的含量也會很豐富。所以,在對cDNA 文庫中的大量克隆進行隨機測序后,統(tǒng)計與基因x的mRNA相對應(yīng)的EST數(shù)目,就可估計原先mRNA群體中的mRNA x的豐度。而且,以與mRNA x相對應(yīng)的EST 數(shù)目除以所得到的EST 總數(shù),就可得到mRNA x 絕對豐度的估計值。White等人稱這種以cDNA 測序來估計基因表達水平的方法為“電子Northern”(electronic Northern 或“數(shù)字Northern”(digital N

24、orthern。EST構(gòu)建的技術(shù)路線為:提取樣品的總RNA 或帶有polyA的mRNA 構(gòu)建cDNA文庫,隨機挑取大量克隆進行EST測序?qū)y得的EST序列進行組裝、拼接對網(wǎng)上己有的EST數(shù)據(jù)庫進行同源性比較確定EST代表的是己知基因還是未知基因?qū)蜻M行定位、結(jié)構(gòu)、功能檢測分析。(1基因組物理圖譜的繪制通過已知的EST序列設(shè)計引物對基因組BAC文庫進行PCR能產(chǎn)生擴增條帶的那個克隆就是EST在染色體上的位置,這個EST就可以被定位在幾號染色體上,進而亞定位至染色體的某個區(qū)段。另外也可以用EST序列提供的探針與基因組BAC文庫雜交,同樣能將某個已知EST在染色體上定位和亞定位。EST 與STS(

25、特定序列位點在基因組作圖上有相同的作用,而且EST位點還直接與一個表達的基因位置相對應(yīng)。(2基因的電子克隆電子克隆技術(shù)是以算法為核心,以計算機和互聯(lián)網(wǎng)為工具,利用現(xiàn)有的表達序列標(biāo)簽(EST 和生物信息數(shù)據(jù)庫,對其中大量EST進行分類、整合、組裝,直接獲得大片段或cDNA 全長的方法。由于EST 序列是全世界很多實驗室隨機產(chǎn)生的,所以屬于同起來, 通過EST assembly 程序在EST 庫中搜索與之高度重疊的EST ,并將它們組裝成一致序列(consensus sequence ,再用它檢索數(shù)據(jù)庫并逐次放寬匹配條件,重復(fù)組裝以獲得盡可能長的或全長cDNA 序列。電子克隆技術(shù)的出現(xiàn),可充分利用

26、現(xiàn)有的信息資源,別是利用其它模式生物的EST信息,快速發(fā)現(xiàn)有用基因。但該技術(shù)也有局限,如果參數(shù)限制條件太低,很可能會得到錯誤結(jié)果;而參數(shù)條件限制太高,就可能沒有結(jié)果。對于所拼接出來的基因還需要從生物學(xué)意義上進行分離和鑒定。(3分離鑒定新基因?qū)δ骋惶禺惤M織或某一生長發(fā)育階段的cDNA文庫進行隨機的部分測序,得到大量EST,將這些EST 作查詢項在dbEST中進行同源查找,同時將由EST推出的氨基酸序列作為查詢項在PIR中查找類似物,很就可以識別這些基因到底是什么基因;對于那些在以上數(shù)據(jù)庫中沒有找到類似物的EST,再把它們置于6個ORF下,翻譯出推定的氨基酸序列,將可能的氨基酸序列作為查詢項,在P

27、IR數(shù)據(jù)庫中查找類似物,果有類似物,就認為這個EST代表著這個蛋白的基因。對于通過EST數(shù)據(jù)庫和PIR數(shù)據(jù)庫已識別的EST,還可以通過探針雜交從cDNA文庫中分離我們所感興趣的那個全長cDNA克隆。對于那些在dbEST和PIR 數(shù)據(jù)庫中都沒有類似物的EST,就可能是完全新的基因,需要進一步識別和研究它。(4 通過EST尋找SSR和SNP分子標(biāo)記從EST數(shù)據(jù)庫中篩選SSR和SNP的主要優(yōu)點在于,這樣篩選出來的SSR和SNP分子標(biāo)記直接與基因的編碼區(qū)相對應(yīng),即得到的往往是基因相關(guān)標(biāo)記(gene-associated markers;另外,從EST中篩選SSR和SNP 比從基因組中篩選費用要小得多。

28、篩選的大致步驟為:EST重疊群的組裝;通過對大量重復(fù)的EST進行序列比較,識別出候選SSR或SNP;對候選SSR或SNP進行確認。總之,通過對大量EST數(shù)據(jù)的歸納整理是尋找SSR和SNP以構(gòu)建高密度遺傳圖譜的最經(jīng)濟的方法。除了以上用途外,EST還在基因結(jié)構(gòu)分析(內(nèi)含子、外顯子識別、基因表達及重組蛋白表達的分析中具有重要作用。(5RNAi技術(shù)的研究結(jié)合GA TEW AY技術(shù)和基因轉(zhuǎn)化技術(shù)用于突變體庫建立的RNAi技術(shù),開發(fā)出了pHellsgate 系列載體,將該技術(shù)與cDNA文庫構(gòu)建技術(shù)和大規(guī)模EST測序技術(shù)相結(jié)合,使得大規(guī)模基因的敲除成為了可能。RNAi 指外源性雙鏈RNA (dsRNA 能抑

29、制細胞內(nèi)與其序列同源的基因的表達。在進化上,這可能是生物調(diào)控基因表達及抵御病毒侵染或轉(zhuǎn)座子誘導(dǎo)DNA突變的一種共生有的生理機制。該技術(shù)最大的優(yōu)點就是可以獲得大規(guī)模的缺失突變體,為基因功能的研究提供了很好的研究工具,同時EST作為序列標(biāo)簽,可以很好地實現(xiàn)表型相關(guān)的基因克隆。EST技術(shù)己成為一種強有力的工具,幫助人們揭示基因組所包含的信息,使基因組研究進入一個新的階段。隨著“后基因組”時代的到來,生物信息學(xué)在基因功能研究中發(fā)揮著越來越重要的作用。而EST數(shù)據(jù)處理和分析是生物信息學(xué)分析的核心任務(wù)之一,它為新基因的克隆和功能分析提供了新的出發(fā)點。EST數(shù)據(jù)庫為新基因的發(fā)現(xiàn)和基因表達研究提供了大量的信息

30、和分析材料,也為DNA分子標(biāo)記的開發(fā)奠定了基礎(chǔ)。但是,目前EST研究還存在許多問題。第一,大量EST序列信息整理的問題。隨著EST數(shù)據(jù)的不斷增加,利用生物信息學(xué)方法建立高通量、自動化的EST數(shù)據(jù)分析平臺,己成為EST研究急需解決的問題之一;第二,EST文庫中基因表達豐度的問題。植物基因組極其龐大,某一特定組織在特定時期的基因表達頻率各不相同。在獲取有用的、新的EST方面效率較低,人力物力浪費嚴(yán)重;第三,就世界范圍來講,如何避免不同研究機構(gòu)對同一物種進行重復(fù)測序,協(xié)調(diào)好科學(xué)家之間的分工,加快植物EST 計劃的進程,也是一個需要解決的問題。2.3新一代高通量測序技術(shù)(1基因表達系列分析技術(shù)(SAG

31、ESAGE技術(shù)是由Velculescu 等人15在1995 提出,是一種可以定量并同時分析大量轉(zhuǎn)錄本的方法。1998年,Powell16利用生物素標(biāo)記的PCR引物合成生物素標(biāo)記的接頭,并利用鏈霉抗生物素蛋白磁珠綁定接頭,這就有效地去除了一些多余的接頭,從而提高了SAGE技術(shù)分析的效率。SAGE 技術(shù)大致理論依據(jù)有兩點:第一,來自cDNA特定位置的一段9-13bp 的序列能夠包含有足夠的信息作為確認唯一一種轉(zhuǎn)錄物的SAGE標(biāo)簽(9個堿基能夠分辨49個不同轉(zhuǎn)錄物;第二,將來自不同cDNA 的SAGE 標(biāo)簽集于同一個克隆中進行測序,就可以獲得連續(xù)的短序列SAGE標(biāo)簽,而這些SAGE標(biāo)簽可以顯示對應(yīng)的

32、基因的表達情況。SAGE 技術(shù)的主要技術(shù)路線:1將提取的總RNA,通過生物素標(biāo)記的oligo(dT引物合成cDNA,用錨定酶(一般為4 堿基的限制性內(nèi)切酶酶切,利用鏈霉抗生物素蛋白磁珠收集酶切后cDNA片段的3部分。2將收集的cDNA 片段分為兩等份,分別加上含有標(biāo)簽酶(一種類限制酶,在距離識別位點大概20 堿基處酶切DNA 雙鏈識別位點的接頭A 和B。3將連有接頭A 或B 的cDNA 短片段分別用標(biāo)簽酶酶切,再將兩份樣品混合,以連接形成雙標(biāo)簽,這樣就可以用與接頭A、B 互補的引物擴增。4用錨定酶酶切PCR 富集的產(chǎn)物,得到雙標(biāo)簽片段,將10-50個標(biāo)簽序列置于一個克隆中進行測序。5對得到的標(biāo)

33、簽數(shù)據(jù)進行處理。為了適應(yīng)不同的試驗需要,目前出現(xiàn)了許多新型SAGE 技術(shù),如superSAGE、robust longSAGE、PCR-SAGE、SAR-SAGE等17。雖然SAGE 技術(shù)可以快速、大量分析細胞或組織的基因表達狀態(tài),但不能完全保證檢測到一些低豐度的mRNA,因而限制該技術(shù)的應(yīng)用。(2大規(guī)模平行測序技術(shù)(MPSSMPSS 技術(shù)是由Brenner 等18在2000 年建立的以測序為基礎(chǔ)的大規(guī)模高通的基因分析技術(shù)。其方法的理論基礎(chǔ)19是:一個標(biāo)簽序列(一般10-20bp含有其對應(yīng)cDNA 的足夠識別信息,將標(biāo)簽序列與某種長的連續(xù)分子連接在一起,可以便于克隆和測序分析,而每個標(biāo)簽序列的

34、出現(xiàn)頻率又能夠代表其相應(yīng)基因的表達量。MPSS 技術(shù)的方法包括兩個基本過程:第一,cDNA 片段、標(biāo)簽和微球體的結(jié)合;第二,測序反應(yīng)。具體步驟為:1利用生物素標(biāo)記的oligo(dT引物將mRNA 反轉(zhuǎn)錄成cDNA 雙鏈,再將合成的生物素標(biāo)記的cDNA 片段用Dpn 限制性內(nèi)切酶(酶切位點是GATC消化。2將消化并純化后的片段克隆到含有32bp TAG 序列的標(biāo)簽(tag載體中,這樣就可以通過與標(biāo)簽中序列互補的引物擴增插入的片段,再通過酶切,獲得線性化的PCR 擴增產(chǎn)物(含有cDNA 序列和特異性的32bp 標(biāo)簽序列。3每個微球體含有一種與32bp 標(biāo)簽序列互補的序列(anti-tag,PCR

35、擴增產(chǎn)物片段通過32bp 標(biāo)簽與anti-tag 雜交,進而連接到微球體上,每個微球體大概可以承載104-105個相同的cDNA 拷貝,將微球體排列在一個表面上。4測序反應(yīng)過程,將接頭、Bbv酶(S 型限制性酶,可以酶切距離識別位點9-13個堿基識別位點和識別序列(recognition sequence結(jié)合在微球體上的cDNA 片段上末端的4個游離堿基,加入16 種不同的熒光標(biāo)記的解碼器探針與接頭雜交,獲得相應(yīng)的熒光信號,以讀取這4個堿基的序列,經(jīng)Bbv酶消化后,在cDNA 片段上再次產(chǎn)生4個堿基末端,去掉酶切序列后可以進行下一輪的分析,這樣經(jīng)過5次反應(yīng)就可以測出每一個微球體上長度為17bp

36、 的cDNA序列。該技術(shù)的特點是可以分析未知序列的基因、基因組覆蓋度高、能測得低表達豐度的基因、實驗效率高,但要選擇合適的標(biāo)簽序列,如果出現(xiàn)基因和標(biāo)簽之間的非特異性,將容易產(chǎn)生分析錯誤。(3RNA 測序技術(shù)(RNA-seq該技術(shù)首先將細胞中的所有轉(zhuǎn)錄產(chǎn)物反轉(zhuǎn)錄為cDNA文庫(利用最新的SMS技術(shù)可略去這一步,直接對RNA進行測序20,然后將cDNA文庫中的DNA隨機剪切為小片段(或先將RNA片段化后再轉(zhuǎn)錄,在cDNA 兩端加上接頭利用新一代高通量測序儀測序,直到獲得足夠的序列,所得序列通過比對(有參考基因組或從頭組裝(denovoas-sembling,無參考基因組形成全基因組范圍的轉(zhuǎn)錄譜。(

37、1SAGE技術(shù)能夠同時檢測到大量的基因轉(zhuǎn)錄本,一個測序反應(yīng)可得到40個左右標(biāo)簽序列。同時,由于SAGE技術(shù)的靈敏度很高,可以檢測出低豐度表達的基因,所以通過該技術(shù)不僅能夠很全面的獲得基因表達的數(shù)目、表達豐度等信息。因此,SAGE技術(shù)是一種預(yù)測基因數(shù)目和發(fā)現(xiàn)新基因的有效途徑。SAGE還可用于在不同生理狀態(tài)、不同環(huán)境、或不同生長階段的細胞或組織的基因表達圖譜構(gòu)建,對不同狀態(tài)下基因表達水平的定量或定性比較。目前,通過SAGE技術(shù)對疾病組織與正常組織的基因表達差異的進行比較應(yīng)用較多,而且己發(fā)現(xiàn)了許多在癌癥組織中上調(diào)表達的基因。這些上調(diào)基因,尤其那些是在正常組織中不表達或少量表達的基因,很可能成為有用的

38、腫瘤診斷和預(yù)測指標(biāo)或潛在的治療位點。(2MPSS一方面可提供某一cDNA在體內(nèi)特定發(fā)育階段的拷貝數(shù),另一方面還可測定出相應(yīng)cDNA 17 bp的序列,所以這就為在轉(zhuǎn)錄水平上進行基因表達分析提供了強有力的定性和定量手段,很明顯,這一技術(shù)首先可以應(yīng)用于不同豐度基因的差異表達分析,制作基因轉(zhuǎn)錄圖譜,這無疑將加速新基因克隆和基因功能的分析。MPSS所獲得的基因序列可提供PCR引物,可通過比較Gen Bank EST 數(shù)據(jù)庫等進行Pre-meiotic and tapetal cell types. Plant J, 2007, 50:637一648. 9 Schena M, Shalon D, Hel

39、ler R, et al. Parallel human genome analysis: microarray-based expression monitoring of 1000 genes.Proc Natl Acad Sci USA, 1996,93(20: 1061410619. 10 Lipshutz D, Morris D, Chee M,et al. Using oligonucleotide probe arrays to access genetic diversity. BioTechniques, 1995, 19(3: 442447 11 Lee M, Yang R

40、, Hubbell E,et al. Accessing genetics information with high-density DNA arrays. Science, 1996,274: 610613 12 Ramsay G. DNA chips: state-of-the art. Nature Biotechnology,1998,16: 4044. 13 Nelson N. Microarrays pave the way to 21stcenetury medicine. Journal of the National Cancer Institute, 1996,88(22

41、: 18031805. 14 Tan PK, Downey TJ, Spitznagel EL et al. Evaluation of gene expression measurements from commercial microarray platforms. ucleic Acids Res. 2003 Oct 1;31(19:5676-84. 15 Velculescu V E, Zhang L, Vogelstein B, et al. Serial analysis of gene expression J. Science, 1995, 270 (5235:484-487.

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論