LncRNA芯片分析-自己總結(jié)_第1頁
LncRNA芯片分析-自己總結(jié)_第2頁
LncRNA芯片分析-自己總結(jié)_第3頁
LncRNA芯片分析-自己總結(jié)_第4頁
LncRNA芯片分析-自己總結(jié)_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、· lncRNA芯片分析lncRNA芯片分析 修改時(shí)間2010/6/16 13:57:12 點(diǎn)擊3210次  1. 歸一化       lncRNA芯片采用的歸一化的方法為quantile normalization。 2. 差異LncRNA的篩選       lncRNA芯片中既有l(wèi)ncRNA的探針又有mRNA的探針,分別做差異基因的篩選,篩選方法同表達(dá)譜的篩選方法是一致的,參見表達(dá)譜的差異基因篩選。 3. 差異lncRNA的重注釋    &#

2、160;  lncRNA芯片注釋不完善,因此需要將篩選出來的lncRNA進(jìn)行重注釋。將差異lncRNA在基因組上位置上下游延伸,以尋找lncRNA附近的有功能的基因。 差異lncRNA重注釋示例 4. 差異lncRNA靶基因的預(yù)測(cè)       lncRNA可能通過調(diào)控相應(yīng)的mRNA發(fā)揮功能,因此有必要預(yù)測(cè)lncRNA的靶基因。我們提取差異lncRNA和mRNA的序列,首先用blast進(jìn)行初篩,之后用RNAplex進(jìn)行進(jìn)一步篩選,以預(yù)測(cè)lncRNA可能調(diào)控的mRNA。 差異lncRNA靶基因預(yù)測(cè)結(jié)果示例 5. 差異lncRNA與靶基因共

3、表達(dá)網(wǎng)絡(luò)       預(yù)測(cè)出lncRNA的靶基因后,并可進(jìn)一步在mRNA的數(shù)據(jù)中探尋該mRNA是否發(fā)生表達(dá)量的變化。由此構(gòu)建差異lncRNA與靶基因相互作用網(wǎng)絡(luò)圖。 差異lncRNA與靶基因相互作用網(wǎng)絡(luò)圖。方框代表lncRNA,圓形代表mRNA。連線表示可能的調(diào)控關(guān)系。節(jié)點(diǎn)面積越大,表示調(diào)控的mRNA越多,預(yù)示該lncRNA在調(diào)控網(wǎng)絡(luò)中所起的作用可能越大。 6. 差異lncRNA與差異mRNA的共表達(dá)分析       SBC Human lncRNA芯片能同時(shí)檢測(cè)出差異表達(dá)的lncRNA和mRN

4、A。我們將差異lncRNA和差異mRNA在一組樣品中進(jìn)行共表達(dá)分析,可以發(fā)現(xiàn)與某個(gè)lncRNA具有相同表達(dá)模式的mRNA。       要求:每組數(shù)據(jù)3個(gè)或3個(gè)以上生物學(xué)重復(fù) 實(shí)驗(yàn)組: 對(duì)照組: lncRNA與mRNA共表達(dá)分析作用圖,圓形帶圈代表lncRNA,圓形代表mRNA。紅色為上調(diào)基因,綠色為下調(diào)基因。  7. 差異lncRNA靶基因的GO analysis       對(duì)lncRNA的靶基因進(jìn)行GO Ontology的生物學(xué)的分類,根據(jù)Fisher's Exact T

5、est,得到p-value,得到lncRNA靶基因?qū)?yīng)的顯著性功能,從而了解lncRNA的功能。 8. 差異lncRNA靶基因的pathway analysis       對(duì)lncRNA靶基因按照Pathway的主要公共數(shù)據(jù)庫KEGG和Biocarta來進(jìn)行分類,對(duì)Pathway中的基因進(jìn)行基于離散分布的顯著性分析,得到與實(shí)驗(yàn)?zāi)康挠酗@著聯(lián)系的Pathway 分類,由這些pathway對(duì)應(yīng)相應(yīng)的靶基因,從而獲得該分類即導(dǎo)致lncRNA差異的最重要Pathway。 9. 差異lncRNA的轉(zhuǎn)錄因子的預(yù)測(cè)    

6、60;  提取lncRNA TSS的上游2000bp,下游500bp,利用HMM的算法根據(jù)TRANSFAC8.1數(shù)據(jù)庫預(yù)測(cè)其轉(zhuǎn)錄因子。  1) 芯片數(shù)據(jù)預(yù)處理:對(duì)實(shí)驗(yàn)數(shù)據(jù)質(zhì)量評(píng)估,預(yù)處理及均一化處理。2) 差異表達(dá)lncRNA及mRNA 的篩選:根據(jù)客戶提供樣本量的大小與分布或?qū)嶒?yàn)?zāi)康?,?yīng)用倍數(shù)法、多重假設(shè)檢驗(yàn)等手段,對(duì)兩條件或多條件下的表達(dá)差異的lncRNA和mRNA分別進(jìn)行計(jì)算和篩選。 表達(dá)模式聚類分析:針對(duì)芯片結(jié)果進(jìn)行樣本及差異表達(dá)lncRNA和mRNA的聚類,尋找屬于同一表達(dá)趨勢(shì)的基因或樣本。 GO和pathway顯著性富集分析:差異基因,應(yīng)用數(shù)據(jù)庫進(jìn)行功能富集分析

7、,挖掘具有統(tǒng)計(jì)學(xué)意義的差異表達(dá)基因的功能類別。顯著性P值越小,則它隨機(jī)聚集差異表達(dá)基因的概率越小,其功能相關(guān)性的非隨機(jī)性就越小,該功能模塊有較大的可能與疾病(或藥物作用) 相關(guān)。 蛋白互作網(wǎng)絡(luò)分析:研究與指定蛋白質(zhì)相互作用的其他蛋白質(zhì)的信息,以使研究人員能夠更加深入地認(rèn)清相關(guān)蛋白質(zhì)的功能,更清楚地理解其調(diào)控機(jī)制。3) lncRNA-mRNA共表達(dá)分析:對(duì)于每一個(gè)差異表達(dá)的lncRNAs,計(jì)算得到與之共表達(dá)的編碼基因。4) lncRNA表達(dá)模式分析:考察差異表達(dá)LncRNAs 的表達(dá)模式,將LncRNAs 以及與該LncRNAs 顯著共表達(dá)的編碼基因的表達(dá)模式繪制heatmap。5) lncRN

8、A功能預(yù)測(cè):篩選出表達(dá)顯著相關(guān)的lncRNA-mRNA 關(guān)系對(duì),利用成熟的mRNA 的功能來推導(dǎo)lncRNA 的功能,對(duì)異常表達(dá)lncRNA 顯著相關(guān)的mRNA 進(jìn)行功能富集分析。6) lncRNA cis作用機(jī)制研究:對(duì)于感興趣的差異表達(dá)lncRNAs,搜索其上下游100K范圍內(nèi)的所有編碼基因,并與該lncRNAs 有顯著共表達(dá)的基因取交集。這些在基因組上臨近、且表達(dá)模式上共表達(dá)的基因很可能被該lncRNAs 所調(diào)控。7) lncRNA trans作用機(jī)制研究:計(jì)算LncRNAs 共表達(dá)的編碼基因,集合與轉(zhuǎn)錄因子/染色質(zhì)調(diào)控復(fù)合物的靶基因集合的交集,利用超幾何分布計(jì)算該交集的富集程度,得到與

9、lncRNAs 顯著相關(guān)的轉(zhuǎn)錄因子,從而識(shí)別可能與lncRNAs 聯(lián)合發(fā)揮調(diào)控作用的轉(zhuǎn)錄因子/染色質(zhì)調(diào)控因子。 lncRNA-轉(zhuǎn)錄因子二元關(guān)系及網(wǎng)絡(luò)分析 lncRNA-轉(zhuǎn)錄因子-靶基因三元關(guān)系及網(wǎng)絡(luò)分析綜述長(zhǎng)鏈非編碼RNA(lncRNA) 來源: 新藥篩選中心   /點(diǎn)擊: 1464lncRNA長(zhǎng)鏈非編碼RNA(long noncoding RNA,lncRNA)是一類不編碼蛋白的RNA 分子,長(zhǎng)度在200bp 以上,起初被認(rèn)為是RNA 聚合酶II 轉(zhuǎn)錄的副產(chǎn)物,不具有生物學(xué)功能;近期的研究表明lncRNA 具有保守的二級(jí)結(jié)構(gòu),可以與蛋白、DNA 和RNA 相互作用,參與多

10、種生物學(xué)過程的調(diào)控,尤其在腫瘤當(dāng)中發(fā)揮了重要的調(diào)控角色,如染色質(zhì)修飾、轉(zhuǎn)錄激活和抑制、轉(zhuǎn)錄后調(diào)解以及作為miRNA 的誘導(dǎo)分子干擾基因的表達(dá)等。隨著高通量測(cè)序技術(shù)的發(fā)展,越來越多的lncRNA 被注釋,但是絕大多數(shù)的lncRNA 的功能仍然不清楚,因此lncRNA 的研究是一片非常廣闊的未知領(lǐng)域,具有極大的研究?jī)r(jià)值和意義。 lncRNA介紹長(zhǎng)鏈非編碼RNA(long non-coding RNA,lncRNA)是一類轉(zhuǎn)錄本長(zhǎng)度超過200nt、不編碼蛋白的RNA。lncRNA起初被認(rèn)為是基因組轉(zhuǎn)錄的“噪音”,不具有生物學(xué)功能。然而,近年來的研究表明lncRNA能在表觀遺傳、轉(zhuǎn)錄及轉(zhuǎn)錄后

11、水平上調(diào)控基因表達(dá),參與了X染色體沉默、基因組印記以及染色質(zhì)修飾、轉(zhuǎn)錄激活、轉(zhuǎn)錄干擾、核內(nèi)運(yùn)輸?shù)榷喾N重要的調(diào)控過程,與人類疾病的發(fā)生、發(fā)展和防治都有著密切聯(lián)系。為何細(xì)胞不惜耗費(fèi)能量對(duì)這些非編碼RNA的表達(dá)和定位進(jìn)行嚴(yán)格調(diào)控呢?這些RNA分析究竟有何功能?RNA測(cè)序技術(shù)的發(fā)展使人們得以初窺這一神秘分子,現(xiàn)在lncRNA的許多相關(guān)信息都可以再新數(shù)據(jù)庫中查到,例如Broad研究所、哈佛大學(xué)和麻省理工共同開發(fā)的Human Body Map lincRNAs catalog。雖然近年來關(guān)于lncRNA的研究進(jìn)展迅猛,但是現(xiàn)在人們了解到的lncRNA只是冰山一角,絕大部分的lncRNA的功能仍然是不清楚的

12、。隨著研究的推進(jìn),各類lncRNA的大量發(fā)現(xiàn),lncRNA的研究作為RNA研究的新領(lǐng)域,已經(jīng)成為一個(gè)非常吸引人的方向,有待廣大科學(xué)家去探尋。lncRNA研究當(dāng)前面臨的一個(gè)主要挑戰(zhàn)是,研究工具還在不斷開發(fā)和改進(jìn)中,而lncRNA研究中非常關(guān)鍵的一步就是發(fā)現(xiàn)與特定疾病相關(guān)的lncRNA?,F(xiàn)階段,基因芯片技術(shù)發(fā)展趨于成熟穩(wěn)定,在此平臺(tái)上,通過設(shè)計(jì)不同檢測(cè)lncRNA探針篩選lncRNA是一種準(zhǔn)確快捷的方法。  lncRNA特征lncRNA通常較長(zhǎng),具有mRNA樣結(jié)構(gòu),有些具有poly(A)尾巴,有些沒有poly(A)尾巴,分化過程中有動(dòng)態(tài)的表達(dá)與不同的剪接方式,與編碼基因相比,l

13、ncRNA表達(dá)量更低。 組織特異性:不同組織之間的lncRNA表達(dá)量不同。 時(shí)空特異性:同一組織或器官的不同生長(zhǎng)階段,其中的lncRNA表達(dá)量也會(huì)變化。 lncRNA啟動(dòng)子同樣可以結(jié)合轉(zhuǎn)錄因子,如Oct3/4,Nanog,CREB,Sp1,c-myc,Sox2與p53,局部染色質(zhì)組蛋白同樣具有特征性的修飾方式與結(jié)構(gòu)特征。 大多數(shù)的lncRNA在組織分化發(fā)育過程中,都具有明顯的時(shí)空表達(dá)特異性,如有人針對(duì)小鼠的1300個(gè)lncRNA進(jìn)行研究,發(fā)現(xiàn)在腦組織中的不同部位,lncRNA具有不同的表達(dá)模式。 在腫瘤與其他疾病中有特征性的表達(dá)方式。 lncRNA的亞細(xì)胞位置上也呈多樣化,在細(xì)胞核、細(xì)胞質(zhì)和細(xì)

14、胞器均有分布,甚至某些lncRNA具有獨(dú)特的亞細(xì)胞位置,有可能是全新的亞細(xì)胞構(gòu)成。    lncRNA功能 lncRNA可從染色質(zhì)重塑、轉(zhuǎn)錄調(diào)控及轉(zhuǎn)錄后加工等多種層面實(shí)現(xiàn)對(duì)基因表達(dá)的調(diào)控:a) lncRNA通過招募染色質(zhì)重塑復(fù)合物至特定的基因組位點(diǎn)使其發(fā)生催化活性。如HOTAIR21,Xist、RepA和Kcnqot1招募Polycomb complex至HoxD位點(diǎn),使得X染色體或Kcnq1功能域的組蛋白H3 第27位賴氨酸發(fā)生3甲基化(me3K27),誘導(dǎo)異染色質(zhì)形成,從而抑制該區(qū)域基因表達(dá)。b) lncRNA通過多種機(jī)制進(jìn)行轉(zhuǎn)錄水平調(diào)控。

15、lncRNA結(jié)合到基因cyclin D1上,招募RNA結(jié)合蛋白TLS來調(diào)控蛋白CBP和p300的組蛋白乙酰轉(zhuǎn)移酶活性,進(jìn)而抑制cyclin D1轉(zhuǎn)錄。c) 超保守增強(qiáng)子轉(zhuǎn)錄出lncRNA-Evf2,該lncRNA能激活轉(zhuǎn)錄因子DLX2,進(jìn)而調(diào)控基因Dlx6轉(zhuǎn)錄。d) DHFR次要啟動(dòng)子區(qū)域轉(zhuǎn)錄出的lncRNA與該基因主要啟動(dòng)子區(qū)域結(jié)合形成三聚體,抑制轉(zhuǎn)錄因子TFIID結(jié)合,從而使基因DHFR發(fā)生沉默。e) 反義lncRNA能夠與剪接體(splicesome)中鋅指同源mRNA Zeb2的5'剪切位點(diǎn)結(jié)合,使內(nèi)含子未被剪切掉,而該內(nèi)含子序列中保留有內(nèi)部核糖體進(jìn)入位點(diǎn)(IRE位點(diǎn)),翻譯過

16、程中識(shí)別并結(jié)合該位點(diǎn),導(dǎo)致Zeb2基因表達(dá)和翻譯。 lncRNA分子機(jī)制隨著lncRNA功能逐步顯現(xiàn),其與靶點(diǎn)的作用機(jī)制成為進(jìn)一步的熱點(diǎn)。早期認(rèn)為原位調(diào)控是LncRNA作用的唯一機(jī)制,它通過招募形成染色質(zhì)修飾復(fù)合物而沉默鄰近基因轉(zhuǎn)錄,例如IGF2R反義RNA(antisense of IGF2RRNA,AIR)、XIST等。而Hox基因反義基因間RNA(Hox antisense intergenic RNA,HOTAIR)的發(fā)現(xiàn)提示LncRNA可能存在遠(yuǎn)程調(diào)控。同源異型基因(homeotic genes,HOX)在細(xì)胞增殖與定向分化中起關(guān)鍵作用,人類Hox基因簇約含100個(gè)ncRN

17、A基因,其中HOTAIR定位于HOXC基因座12q13.13。HOTAIR的5'端可招募結(jié)合多梳蛋白抑制復(fù)合物2(polycomb repressive complex2,PRC2),借助PRC2上三個(gè)H3K27甲基化酶EZH2、SUZ12和EED,使另一基因座HOXD上長(zhǎng)約40kb的序列轉(zhuǎn)錄沉默,從而在乳腺上皮細(xì)胞內(nèi)使細(xì)胞內(nèi)轉(zhuǎn)錄傾向于胚胎成纖維細(xì)胞樣表型。超過20%的LncRNA能夠通過結(jié)合PRC2或其他類似復(fù)合物發(fā)揮作用,提示LncRNA的遠(yuǎn)程調(diào)控機(jī)制在生物體內(nèi)廣泛存在。其作用機(jī)制如下圖所示,主要包括以下幾種情況:1) 在編碼蛋白基因的上游啟動(dòng)子區(qū)(橘色)轉(zhuǎn)錄,從而干擾鄰近蛋白編碼

18、基因(藍(lán)色)的表達(dá)(如酵母SER3基因);2) 抑制RNA 聚合酶,或介導(dǎo)染色質(zhì)重構(gòu)和組蛋白修飾,而影響基因(藍(lán)色)表達(dá);3) lncRNA(紫色)與編碼蛋白基因的轉(zhuǎn)錄本形成互補(bǔ)雙鏈,干擾mRNA的剪切,進(jìn)而產(chǎn)生不同的剪切形式;4) lncRNA(紫色)與編碼蛋白基因的轉(zhuǎn)錄本形成互補(bǔ)雙鏈,在Dicer酶作用下產(chǎn)生內(nèi)源性的siRNA,調(diào)控基因的表達(dá)水平;5) lncRNA(綠色)結(jié)合在特定蛋白質(zhì)上調(diào)節(jié)相應(yīng)蛋白的活性;6) 作為結(jié)構(gòu)組分與蛋白質(zhì)形成核酸蛋白質(zhì)復(fù)合體;7) 結(jié)合在特定蛋白上從而改變?cè)摰鞍椎陌|(zhì)定位;8) 可作為小分子RNA(如miRNA)的前體分子。 lncRNA芯片數(shù)據(jù)分

19、析策略1) 芯片數(shù)據(jù)預(yù)處理:對(duì)實(shí)驗(yàn)數(shù)據(jù)質(zhì)量評(píng)估,預(yù)處理及均一化處理。2) 差異表達(dá)lncRNA及mRNA 的篩選:根據(jù)客戶提供樣本量的大小與分布或?qū)嶒?yàn)?zāi)康?,?yīng)用倍數(shù)法、多重假設(shè)檢驗(yàn)等手段,對(duì)兩條件或多條件下的表達(dá)差異的lncRNA和mRNA分別進(jìn)行計(jì)算和篩選。 表達(dá)模式聚類分析:針對(duì)芯片結(jié)果進(jìn)行樣本及差異表達(dá)lncRNA和mRNA的聚類,尋找屬于同一表達(dá)趨勢(shì)的基因或樣本。 GO和pathway顯著性富集分析:差異基因,應(yīng)用數(shù)據(jù)庫進(jìn)行功能富集分析,挖掘具有統(tǒng)計(jì)學(xué)意義的差異表達(dá)基因的功能類別。顯著性P值越小,則它隨機(jī)聚集差異表達(dá)基因的概率越小,其功能相關(guān)性的非隨機(jī)性就越小,該功能模塊有較大的可能與疾病(或藥物作用) 相關(guān)。 蛋白互作網(wǎng)絡(luò)分析:研究與指定蛋白質(zhì)相互作用的其他蛋白質(zhì)的信息,以使研究人員能夠更加深入地認(rèn)清相關(guān)蛋白質(zhì)的功能,更清楚地理解其調(diào)控機(jī)制。3) lncRNA-mRNA共表達(dá)分析:對(duì)于每一個(gè)差異表達(dá)的lncRNAs,計(jì)算得到與之共表達(dá)的編碼基因。4) lncRNA表達(dá)模式分析:考察差異表達(dá)LncRNAs 的表達(dá)模式,將LncRNAs 以及與該LncRNAs 顯著共表達(dá)的編碼基因的表達(dá)模式繪制heatmap。5) lnc

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論