




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第十二章非編碼RNA與復(fù)雜疾病第一頁,共190頁。人類基因組的蛋白質(zhì)編碼區(qū)的總和占總基因組長度為1%~2%,那么其他98%的基因組有什么功能呢(junkdna)?(1)42%的基因組是插入編碼序列的內(nèi)含子序列;人類基因平均每個基因有7個內(nèi)含子。但這么冗長的內(nèi)含子序列有什么生物學(xué)功能呢?(2)其他55%的基因組的功能是什么?【注:90%以上的基因組都是轉(zhuǎn)錄的!】人類基因組草圖帶給科學(xué)家們的困惑第二頁,共190頁。第三頁,共190頁。人類基因組絕大部分都被轉(zhuǎn)錄成RNA,細(xì)胞內(nèi)非編碼RNA的數(shù)量是編碼RNA的上百倍。這促使許多科學(xué)家認(rèn)為生物體復(fù)雜性被隱藏在它們所輸出的非編碼RNA內(nèi),而非編碼序列內(nèi)。第四頁,共190頁。第五頁,共190頁。non-codingRNA,ncRNA不能翻譯成蛋白的功能性RNA分子Housekeepingnon-codingRNAtRNAs、rRNAs、snRNAsetc.Regulatorynon-codingRNAsmallnon-codingRNAsiRNA、miRNA、piRNA
etc.Longnon-codingRNA(lncRNA,>200nt)第六頁,共190頁。第七頁,共190頁。第一節(jié)引言
Section1Introduction第八頁,共190頁。隨著ncRNA在復(fù)雜疾病中的研究深入,研究者發(fā)現(xiàn)其在疾病的發(fā)生發(fā)展過程中起著巨大的作用,其功能異常能夠?qū)е赂鞣N人類復(fù)雜疾病的發(fā)生。這將使ncRNA可能成為疾病診斷、預(yù)后的新的生物學(xué)標(biāo)記(biomark),并為更進(jìn)一步理解復(fù)雜疾病的發(fā)病機(jī)理提供了新的手段。第九頁,共190頁。第二節(jié)
非編碼RNA與其靶基因
Section2Non-codingRNAsandTargets第十頁,共190頁。(一)miRNA的發(fā)現(xiàn)一、miRNA概述
miRNAwasfirstdiscoveredin1993byVictorAmbrosatHarvard(lin-4)ThesecondmiRNALet-7wasdiscoveredin2000byFrankSlackasapostdocatHarvard
(GaryRuvkunlab)第十一頁,共190頁。ThediscoveryofmiRNAsVictorAmbrosGaryRuvkun第十二頁,共190頁。第十三頁,共190頁。microRNAshadbeenneglectedforsomanyyearsbecauseoftheirsmallsize.Theunderlyingreasonis:peopleneverdreamthatsmallRNAswillhaveimportantbiologicalroles.第十四頁,共190頁。ThenumberoftheidentifiedmiRNAsisgrowingrapidlyinrecentyears.Release21(July2014)ofthemiRBasedatabasehaveadded4196newhairpinsequencesand5441newmatureproductsRelease20contains24521entriesrepresentinghairpinprecursormiRNAs,expressing30424maturemiRNAproducts,in206species.第十五頁,共190頁。ThesemiRNAsarefromprimates,rodents嚙齒類,birds,fish,worms,flies,plantsandviruses.Thedataarefreelyavailabletoallthroughthewebinterfaceat.第十六頁,共190頁。Sincearound2007,theoverwhelmingmajorityofmicroRNAsdepositedinmiRBasehavebeenpredictedfromsmallRNAdeepsequencingexperiments.第十七頁,共190頁。miRNA的生物合成過程maturemiRNAPrecursormiRNAPrimarymiRNAmiRNAgene轉(zhuǎn)錄剪切剪切miRNA(二)miRNA的生物合成第十八頁,共190頁。RNApolyII/IIIDroshaDicer幾百~幾千堿基約70~90堿基約22堿基第十九頁,共190頁。miRNA例子第二十頁,共190頁。ThemiRNAgenesandStructureofpri-miRNAsPri-miRNAsbearthe5’capand3’poly(A)tails第二十一頁,共190頁。(三)miRNA的特點、作用機(jī)制及分類microRNA命名規(guī)則hsa-miR-181a-2*hsa人,mus小鼠,rat大鼠let,lin,mir,miR,181:編號,按注冊順序a:與已注冊的miRNA序列高度同源第二十二頁,共190頁。2:由不同染色體上的DNA序列轉(zhuǎn)錄加工而成的具有相同成熟體序列的miRNA,則在后面加上阿拉伯?dāng)?shù)字以區(qū)分*:如果一個前體的2個臂分別產(chǎn)生miRNA,則根據(jù)克隆實驗,在表達(dá)水平較低的miRNA后加“*”;或進(jìn)行如下命名hsa-miR-188-5p(或hsa-miR-188-3p)5p:表示從5‘端的臂加工而來;3p:表示從3‘端的臂加工而來第二十三頁,共190頁。hsa-mir-188二級結(jié)構(gòu)hsa-miR-188-5phsa-miR-188-3p5’3’第二十四頁,共190頁。miRNA/miRNA-starVS-5p/-3pthedominantstrandcouldchangeindifferentbiologicalsettingsleadingtodifferentnamesdescribingthesamemolecule第二十五頁,共190頁。5parm(placenta)tothe3parm(heart,liver,andkidney)第二十六頁,共190頁。物理位置特點miRNA基因以單拷貝、多拷貝和基因簇等多種形式存在于基因組中。miRNA簇(miRNAclusters)是指在染色體上彼此緊密相鄰的兩個或者多個miRNA構(gòu)成的miRNA群miRNA傾向于成簇出現(xiàn)在染色體上;通常定義50kb的距離為一簇同一簇中的miRNA傾向是共表達(dá)的miRNA一般特點—miRNA家族/簇第二十七頁,共190頁。序列(特別是種子序列)高度同源的miRNA被歸為一個miRNA家族同一家族中的miRNA并不一定是成簇的。第二十八頁,共190頁。seed第二十九頁,共190頁。miRNA的一般特點序列特點非編碼性成熟的miRNA5′端為單一磷酸基團(tuán),3′端為羥基,這一特點使它與大多數(shù)寡核苷酸和功能RNA的降解片段區(qū)別開來;第三十頁,共190頁。表達(dá)特點miRNA具有時序性以及組織特異性在特定的時間,組織中才會表達(dá)保守性特點在物種間高度保守第三十一頁,共190頁。miRNA的作用機(jī)制通過和靶基因3′UTR(3′非翻譯區(qū))結(jié)合導(dǎo)致RNA誘導(dǎo)的沉默復(fù)合體(RNA-inducedsilencingcomplex,簡稱RISC)降解其靶mRNA或阻礙其靶的翻譯。第三十二頁,共190頁。RISC轉(zhuǎn)錄后層面調(diào)控基因表達(dá)第三十三頁,共190頁。二、基于序列的miRNA靶基因預(yù)測方法miRNA靶基因預(yù)測遵循的基本原則miRandaTargetScan第三十四頁,共190頁。ThreeClassesofmiRNATargetSites(Brenneckeetal.PlosBiology2005)第三十五頁,共190頁。(一)miRNA靶基因預(yù)測遵循的原則和基本步驟miRNA的“種子區(qū)”與mRNA的3′UTR序列堿基互補(bǔ)靶點在多物種間的序列保守性miRNA與mRNA形成雙鏈結(jié)構(gòu)的熱力學(xué)穩(wěn)定性靶基因二級結(jié)構(gòu)和靶點外的序列對靶基因預(yù)測的影響遵循的原則第三十六頁,共190頁。miRNA靶位點預(yù)測的難點:miRNA與靶位點的不完全互不配對第三十七頁,共190頁。基本步驟在3′UTR上探尋和miRNA“種子區(qū)”完全互補(bǔ)的序列;計算miRNA和這些序列結(jié)合產(chǎn)生的自由能下降值,對靶點進(jìn)行篩選;對靶點進(jìn)行物種間序列比對,利用物種保守性進(jìn)一步篩選。
第三十八頁,共190頁。(三)TargetScanTargetScan主要考慮物種間保守的miRNA靶基因,并且在TargetScan中首次提出了“種子匹配”(seedmatch)的概念。第三十九頁,共190頁。TargetScan算法的基本步驟在TargetScan算法中,“種子匹配”被定義為miRNA5′端的第2~8位堿基與mRNA3′UTR上的一段7nt(nucleotide)序列完全互補(bǔ),miRNA上的這7個核苷酸被稱為miRNA“種子區(qū)”。從種子區(qū)開始向miRNA兩側(cè)尋找互補(bǔ)堿基,允許G-U配對,直到出現(xiàn)堿基錯配為止。在物種保守方面,TargetScan算法發(fā)現(xiàn)隨著物種數(shù)目的增多,預(yù)測的靶基因數(shù)目逐漸減少,但預(yù)測結(jié)果的準(zhǔn)確率得到提高。第四十頁,共190頁。三、基于表達(dá)信息預(yù)測miRNA靶基因Huang等人利用在88個組織中同時檢測了miRNA和mRNA表達(dá)的數(shù)據(jù),并結(jié)合貝葉斯方法開發(fā)了靶基因預(yù)測算法GenMiR++,得到了104個人類miRNA的高精度靶基因,并通過實驗證實了預(yù)測的let-7b靶基因,結(jié)果表明,與基于序列的方法相比,利用相同樣本中同時檢測miRNA和mRNA的表達(dá)譜可以更準(zhǔn)確的預(yù)測miRNA靶基因。(Huang,UsingexpressionprofilingdatatoidentifyhumanmicroRNAtargets.Nat.Methods.)第四十一頁,共190頁。第四十二頁,共190頁。第四十三頁,共190頁。四、基于高通量測序結(jié)果預(yù)測miRNA靶基因ArgonauteCLIP-SeqRIP-CLIPpSILACDegradome-Seq第四十四頁,共190頁。
Agobindsinaternary三元的complextobothmiRNAandmRNA,withsufficientlyclosecontactstoallowUV-crosslinkingtoeitherRNA;mRNAtagswillbeintheimmediatevicinityofmiRNAbindingsites.第四十五頁,共190頁。ArgonauteCLIP-Seq第四十六頁,共190頁。ArgonauteCLIP-SeqArgonauteCLIP-Seq,又稱為HITS-CLIP(ultravioletcross-linkingandimmune-precipitationandandhigh-throughputsequencing),即紫外交聯(lián)免疫共沉淀與高通量測序偶聯(lián)技術(shù)。CLIP技術(shù)是研究RNA結(jié)合蛋白(或者RNA)體內(nèi)結(jié)合靶標(biāo)的新技術(shù)。通過紫外交聯(lián)將RNA結(jié)合蛋白與體內(nèi)結(jié)合的RNA分子進(jìn)行固定,用Ago蛋白的抗體免疫共沉淀之后酶解未受蛋白保護(hù)的RNA,可以獲得Ago蛋白直接結(jié)合的RNA序列。第四十七頁,共190頁。針對AGO蛋白的CLIP-seq技術(shù)能夠在全基因組范圍內(nèi)鑒定與AGO蛋白結(jié)合的小RNA及其mRNA靶標(biāo)。Chi,SW,Zang,JB,Mele,A,Darnell,RB.2009.ArgonauteHITS-CLIPdecodesmicroRNA-mRNAinteractionmaps.Nature.460:479-86。第四十八頁,共190頁。FurthermoreHITS-CLIPreadsdonotpreciselypinpointthepositionofcrosslinkingbetweentheRNAandprotein,andthuscanonlyidentifyatargetedregion(~100-nt)asopposedtoaspecifictargetsite.第四十九頁,共190頁。第五十頁,共190頁。2010年,GeneW.Yeo采用AGO-CLIPseq技術(shù)在線蟲中鑒定了Argonaute的結(jié)合位點,發(fā)現(xiàn)其不僅結(jié)合mRNA的3’UTR區(qū)域,也會結(jié)合編碼外顯子區(qū)域,還發(fā)現(xiàn)Argonaute大量結(jié)合的區(qū)域?qū)τ趍iRNA的功能非常重要,揭示了其新的自我調(diào)控的功能。要想獲得檢測區(qū)域被哪個miRNA調(diào)控,還需結(jié)合預(yù)測算法第五十一頁,共190頁。第五十二頁,共190頁。五、整合已有知識預(yù)測miRNA靶基因
在當(dāng)前的miRNA靶基因預(yù)測研究中,研究人員逐漸意識到單一依靠序列信息或表達(dá)信息已不能繼續(xù)提高miRNA靶基因預(yù)測效能。整合功能信息、蛋白質(zhì)互作信息、表達(dá)信息、序列信息以及當(dāng)前實驗證實的miRNA靶基因等已有資源預(yù)測miRNA靶基因十分必要。第五十三頁,共190頁。miRNA靶點優(yōu)化算法第五十四頁,共190頁。第五十五頁,共190頁。第五十六頁,共190頁。六、lncRNA概述及靶基因識別lncRNA定義lncRNA特點lncRNA作用機(jī)制第五十七頁,共190頁。DefinitionoflncRNALongnon-codingRNAs(longncRNAs,lncRNAs)arenon-proteincodingtranscriptslongerthan200nucleotides(Perkel2013).lncRNAsaretranscriptsthatare>200nucleotidesinlengthanddonothavethepotentialtoencodeforproteinsexceedinglengthsof≥30aminoacids(MercerTR.Nat.Rev.Genet.2009,LiXMed.Res.Rev.2012
).
第五十八頁,共190頁。ThissomewhatarbitrarylimitdistinguisheslongncRNAsfromsmallregulatoryRNAssuchasmiRNAs,siRNAs,piRNAs,snoRNAs,andothershortRNAs.第五十九頁,共190頁。LargescaleRNA-seq
indicatethatlncRNAnumberintheorderoftensofthousandsinmammals.9277manuallyannotatedgenesproducing14880transcripts(GENCODEv7).Thenumberofproteincodinggenesinourgenomehasbeenreviseddownwardmultipletimeswhereasthenumberofknownnonproteincodingtranscriptshasincreasedexponentiallyoverthepastdecade.第六十頁,共190頁。FeaturesoflncRNAs第六十一頁,共190頁。第六十二頁,共190頁。第六十三頁,共190頁。FeaturesoflncRNAslncRNAsaregeneratedbythesametranscriptionalmachineryasareothermRNAslncRNAsarewithsimilarhistone-modificationprofiles,splicingsignals.H3K4me3,H3K36me3lncRNAsarepredominantlylocalizedinthechromatinandnucleus,andafractionappeartobepreferentiallyprocessedintosmallRNAs.第六十四頁,共190頁。lncRNAexpressionTissue-specificlncRNAsexpressedinthebrain.第六十五頁,共190頁。第六十六頁,共190頁。conservationManysmallRNAs,suchasmiRNAsorsnoRNAs,exhibitstrongconservationacrossdiversespecies(Bentwich2005).Incontrast,ingenerallncRNAslackstrongconservation,whichisoftencitedasevidenceofnon-functionality(Brosius2005;Struhl2007).DespitelowconservationoflongncRNAsingeneral,itshouldbenotedthatmanylongncRNAsstillcontainstronglyconservedelements第六十七頁,共190頁。生化鑒定和功能研究尚處于起步階段,目前僅有大約100多種已知功能的lncRNAs。AsofDecember2012,~127LncRNAshavebeenfunctionallyannotatedin
LncRNAdb
(adatabaseofliteraturedescribedLncRNAs)(Amral2011).lncRNA通過表觀遺傳學(xué)調(diào)控、轉(zhuǎn)錄調(diào)控、轉(zhuǎn)錄后調(diào)控、蛋白活性調(diào)控等多種方式調(diào)控相關(guān)基因的作用第六十八頁,共190頁。第六十九頁,共190頁。LncRNAasScaffoldforTranscriptionRepression第七十頁,共190頁。HOTAIRandPRC2第七十一頁,共190頁。lncRNAasmiRNADecoyPolisenoetal,Nat2011第七十二頁,共190頁。lncRNA研究存在的問題lncRNA的定義>200nt,過于武斷l(xiāng)ncRNA的命名原則:目前根據(jù)功能、結(jié)構(gòu)、作用方式等命名lncRNA相關(guān)數(shù)據(jù)庫的內(nèi)容不夠全,注釋內(nèi)容不夠豐富第七十三頁,共190頁。lncRNA生物學(xué)功能的闡明lncRNA功能預(yù)測的工具不多區(qū)分功能性和非功能性非編碼轉(zhuǎn)錄本種類和功能復(fù)雜,使不同的lncRNA研究結(jié)果之間的借鑒意義并不高第七十四頁,共190頁。七、ncRNA數(shù)據(jù)資源ncRNA常用數(shù)據(jù)庫第七十五頁,共190頁。miRBase是一個集miRNA序列、注釋信息以及預(yù)測的靶基因數(shù)據(jù)為一體的數(shù)據(jù)庫,是目前存儲miRNA信息最主要的公共數(shù)據(jù)庫之一網(wǎng)址:(一)miRBase數(shù)據(jù)庫第七十六頁,共190頁。第七十七頁,共190頁。
TarBase是一個目前使用廣泛的存儲實驗檢測的miRNA與靶基因間關(guān)系的數(shù)據(jù)庫,涵蓋多種實驗方法檢測的超過65000個miRNA與靶基因關(guān)系對。其網(wǎng)址為:(二)TarBase數(shù)據(jù)庫第七十八頁,共190頁。TarBase數(shù)據(jù)庫界面介紹第七十九頁,共190頁。(三)microRNA.org數(shù)據(jù)庫microRNA.org數(shù)據(jù)庫包含miRNA靶基因以及表達(dá)譜數(shù)據(jù)網(wǎng)址:miRNA靶基因數(shù)據(jù)主要是利用miRanda算法預(yù)測得來miRNA表達(dá)譜數(shù)據(jù)來自一個針對人類主要器官和細(xì)胞系的小RNA庫測序計劃第八十頁,共190頁。(四)lncRNA相關(guān)數(shù)據(jù)庫因為lncRNA是一個非常新的研究領(lǐng)域,lncRNA在疾病中的作用的研究還是起步階段,數(shù)據(jù)量還不夠大,因此,相關(guān)的數(shù)據(jù)庫也是處于起步階段,相關(guān)數(shù)據(jù)庫還不多,也不夠豐富。第八十一頁,共190頁。第三節(jié)
非編碼RNA多態(tài)和復(fù)雜疾病
Section3Non-codingRNAPolymorphismsandComplexDisease第八十二頁,共190頁。miRNA多態(tài)(miRNApolymorphisms)是影響miRNA功能的多態(tài),可能發(fā)生在miRNA形成和行使功能的任一個過程,以插入、刪除、擴(kuò)增或染色體異位的形式出現(xiàn),最終導(dǎo)致miRNA綁定位點或者功能的缺失(獲得),是人類基因組一類新的功能多態(tài)。不僅會影響miRNA的產(chǎn)生和表達(dá),而且會影響miRNA與靶基因的結(jié)合從而影響靶基因的表達(dá)。介紹第八十三頁,共190頁。影響蛋白質(zhì)參與miRNA合成與成熟,導(dǎo)致新的miRNA生成和靶基因的調(diào)控。第八十四頁,共190頁。一、位于miRNA基因內(nèi)部影響miRNA生物學(xué)形成的多態(tài)在染色體基因組水平上單個核苷酸變異引起的miRNA序列多態(tài)性對miRNA的轉(zhuǎn)錄、形成、輸出和調(diào)控具有重要影響。第八十五頁,共190頁。Saunders,M.A.等對人類474個miRNAs的SNPs進(jìn)行系統(tǒng)的分析發(fā)現(xiàn)單核苷酸多態(tài)在miRNA序列內(nèi)的密度低于其周圍的側(cè)翼序列。第八十六頁,共190頁。49個pre-miRNA內(nèi)存在65個SNPs位點,其中3個miRNAs的種子序列存在SNPs。第八十七頁,共190頁。(一)位于pri/pre-miRNA基因序列內(nèi)部Saunders,M.A.和Duan等人利用生物信息學(xué)的方法研究發(fā)現(xiàn)在pri/pre-miRNA內(nèi)部存在單核苷酸多態(tài)。位于pri/pre-miRNA內(nèi)部的多態(tài)會影響miRNA的表達(dá),產(chǎn)生新的miRNA以及影響miRNA與靶基因的結(jié)合,甚至與疾病的風(fēng)險相關(guān)。第八十八頁,共190頁。1.影響miRNA的表達(dá)Duan等人在研究miR-125時發(fā)現(xiàn),該基因位點存在SNP,含有miR-125a-G/U兩種等位,其中miR-125a-U能夠顯著影響DGCR8與pri-miRNA-125a的結(jié)合與剪接,使成熟的miR-125a生成減少,使miR-125a對靶基因Lin-128的翻譯抑制作用減弱。第八十九頁,共190頁。第九十頁,共190頁。2.產(chǎn)生新的miRNAmiR-146a前體會產(chǎn)生miR-146a(正鏈)和miR-146a*(負(fù)鏈)兩種miRNA。在miR-146a前體的莖環(huán)上存在的SNP(rs2910164)不僅會影響miR-146a的表達(dá),而且會導(dǎo)致miR-146a*C和miR-146a*G兩種miRNA的產(chǎn)生。第九十一頁,共190頁。(二)位于成熟的miRNA序列內(nèi)部成熟的miRNA與mRNA的3′UTR區(qū)域結(jié)合對mRNA進(jìn)行轉(zhuǎn)錄后調(diào)控。miRNA與mRNA結(jié)合的區(qū)域包括兩部分:種子區(qū)域,這一部分區(qū)域要求與mRNA嚴(yán)格匹配;種子區(qū)域附近的3′端方向,允許一定的程度的錯配位于成熟miRNA序列的這些多態(tài)會影響對靶基因的調(diào)控,消除、弱化、增強(qiáng)或者產(chǎn)生新的結(jié)合靶點。第九十二頁,共190頁。目前的研究發(fā)現(xiàn),位于miRNA種子區(qū)域的多態(tài)不僅會影響靶結(jié)合位點,還影響miRNA的表達(dá)。例如位于miR-125a種子區(qū)域的多態(tài)顯著的抑制了pri/pre-miRNA過程,導(dǎo)致miRNA表達(dá)的減少。第九十三頁,共190頁。二、miRNA靶點的多態(tài)miRNA靶點的多態(tài)性靶基因上影響miRNA與靶基結(jié)合的序列多態(tài)性。這些多態(tài)性位點可以影響miRNA對靶基因表達(dá)的調(diào)控。越來越多研究發(fā)現(xiàn)與多種疾病的發(fā)病風(fēng)險有關(guān)。第九十四頁,共190頁。miRNA靶點多態(tài)可分為:miRNA結(jié)合位點上的多態(tài)性miRNA結(jié)合位點上下游的多態(tài)性第九十五頁,共190頁。miRNA結(jié)合位點上(或上下游)的多態(tài)性與疾病與疾病相關(guān)的miRNA結(jié)合位點上的多態(tài)性舉例位于整聯(lián)蛋白基因-4(IGBT-4)miRNA結(jié)合位點的SNP(rs743553)與乳腺癌發(fā)病密切相關(guān)(Brendle等)。位于GEMIN3基因miRNA結(jié)合位點的SNP(rs197414)與膀胱癌發(fā)病密切相關(guān)(Yang等)。第九十六頁,共190頁。位于靶點附近的多態(tài)位點可能會改變mRNA的二級結(jié)構(gòu)從而影響miRNA與靶基因的結(jié)合;或影響miRNA與3′UTR上其他調(diào)控元件的協(xié)同作用(間接影響)例如,HLA-G基因3’UTR區(qū)的SNP影響miR-148a,miR-148b和miR-152與HLA-G結(jié)合,從而與哮喘的發(fā)病風(fēng)險相關(guān)(Zheng等)。第九十七頁,共190頁。五、lncRNA多態(tài)與復(fù)雜疾病近些年,高通量技術(shù)(如GWAS,全基因組關(guān)聯(lián)分析)已經(jīng)確定大量和疾病相關(guān)的SNP。因此,如果該SNP是位于一個lncRNA上的話,很可能是該SNP影響了該lncRNA的功能,從而和疾病有關(guān)。第九十八頁,共190頁。第九十九頁,共190頁。乳頭狀甲狀腺癌(papillarythyroidcarcinoma,PTC)相關(guān)的風(fēng)險SNP(rs944289)位于一個lncRNA(PTCSC3)的上游3.2kb處,這個風(fēng)險SNP可以影響該lncRNA的表達(dá),并闡明了這個SNP通過影響lncRNA功能導(dǎo)致乳頭狀甲狀腺癌發(fā)生的致病機(jī)制。例子第一百頁,共190頁。第一百零一頁,共190頁。第一百零二頁,共190頁。數(shù)據(jù)資源miRNASNPmiRNA-relatedSNPstheirpotentialtargetlossandgaininformationdbSMR數(shù)據(jù)庫一個分析基因3′UTR上的SNP對miRNA與靶點結(jié)合關(guān)系影響的數(shù)據(jù)庫。第一百零三頁,共190頁。PolymiRTS數(shù)據(jù)庫
整合了序列多態(tài)性位點數(shù)據(jù)、表型數(shù)據(jù)和基因表達(dá)譜數(shù)據(jù),來挖掘潛在的可以用于解釋表達(dá)數(shù)量性狀位點和表型數(shù)量性狀位點效應(yīng)的miRNA靶基因的結(jié)合區(qū)域上的多態(tài)性位點,并把這些多態(tài)稱作PolymiRTS。第一百零四頁,共190頁。lincSNP數(shù)據(jù)庫簡介
LincSNP是一個整合的數(shù)據(jù)庫,為了識別和注釋人類lncRNA上疾病相關(guān)的SNP而構(gòu)建的全面的綜合數(shù)據(jù)庫。目前該數(shù)據(jù)庫中包括大約140,000疾病相關(guān)的SNP,這些SNP位于大約5000個人類的lncRNA周圍。這個數(shù)據(jù)庫也包含了注釋的,實驗證實的SNP-lncRNA-疾病的關(guān)聯(lián)數(shù)據(jù)以及疾病相關(guān)的lncRNA數(shù)據(jù),并提供了友好的界面和有效的工具獲得疾病相關(guān)的SNP以及l(fā)ncRNA。第一百零五頁,共190頁。LincSNP數(shù)據(jù)庫()Ning,etal,BMCbioinformatics,2014第一百零六頁,共190頁。第四節(jié)
非編碼RNA表達(dá)譜與復(fù)雜疾病
Section4Non-codingRNAExpressionProComplexDisease第一百零七頁,共190頁。癌癥的本質(zhì)歸結(jié)為各種原因引起的基因結(jié)構(gòu)和功能的異常一、ncRNA表達(dá)譜識別癌癥相關(guān)ncRNA致癌基因的高表達(dá)抑癌基因的低表達(dá)miRNA和lncRNA作為兩類重要的基因調(diào)控子,其表達(dá)變化將會對靶基因的活動產(chǎn)生深遠(yuǎn)的影響復(fù)雜疾病的診斷和治療研究中必定會引入miRNA及l(fā)ncRNA第一百零八頁,共190頁。(一)miRNA表達(dá)譜1.ncRNA的特征低豐度、組織特異性、發(fā)育階段特異性、疾病狀態(tài)特異性2.ncRNA表達(dá)檢測技術(shù)Northern印跡、克?。╟loning)、定量PCR擴(kuò)增、SAGE技術(shù)、磁珠技術(shù)和寡核苷酸芯片技術(shù)、新一代測序技術(shù)第一百零九頁,共190頁。miRNA表達(dá)譜microRNA芯片制作和分析流程制作芯片差異表達(dá)miRNA數(shù)據(jù)分析miRNA表達(dá)譜預(yù)處理第一百一十頁,共190頁。1.ncRNA表達(dá)數(shù)據(jù)來源GeneExpressionOmnibus(GEO)數(shù)據(jù)庫、ArrayExpress數(shù)據(jù)庫、SequenceReadArchive(SRA)2.miRNA表達(dá)譜數(shù)據(jù)標(biāo)準(zhǔn)化中值處理mRNA表達(dá)譜數(shù)據(jù)標(biāo)準(zhǔn)化方法并不能簡單地應(yīng)用于miRNA表達(dá)譜數(shù)據(jù),目前仍沒有統(tǒng)一有效的標(biāo)準(zhǔn)化方法可用于miRNA表達(dá)譜第一百一十一頁,共190頁。smallRNAseqlibrarypreparation(Directional)第一百一十二頁,共190頁。ApipelineforsmallRNAannotation(seeinGEDGalaxy)Sequencereads(fastaformat)Bowtiepre-miRNA(miRBase)UnmatchedreadsUnmatchedreadsTransposonsUnmatchedreadsGenesUnmatchedreadsUnmatchedreadsRemainingunmatchedsequencesBowtieBowtieNoncodingRNAsBowtieBowtieBowtieIntergenicregionsViruses,transgenes,etc…h(huán)ierarchicalannotationofsequencedatasetsMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCountMatchedreads(fasta)ReadCount第一百一十三頁,共190頁。第一百一十四頁,共190頁。豐度數(shù)據(jù)(count)預(yù)處理數(shù)據(jù)過濾-去除低質(zhì)量的或噪聲數(shù)據(jù)點,去除序列標(biāo)簽匹配性差的表達(dá)值重復(fù)數(shù)據(jù)合并–加和,代表同一個基因的標(biāo)簽的tag(或完全相同讀段)的表達(dá)數(shù)目相加缺失數(shù)據(jù)的處理–一般不補(bǔ)缺失值,因為0是有意義的,可以發(fā)現(xiàn)某種條件下不表達(dá)的基因數(shù)據(jù)標(biāo)準(zhǔn)化–RPM(ReadsPerMillionreads)第一百一十五頁,共190頁。miRNA表達(dá)譜M個miRNAN1個疾病樣本、N2個正常樣本第一百一十六頁,共190頁。利用表達(dá)譜尋找復(fù)雜疾病相關(guān)miRNA差異表達(dá)分析——尋找異常表達(dá)miRNAFoldchange、T-test、ANOVA、SAM等低通量實驗證實第一百一十七頁,共190頁。生物學(xué)證實TargetgenesmiRNA功能1功能n功能2功能注釋/功能富集表型miRNA功能預(yù)測和病理假設(shè)miRNA表達(dá)的失調(diào)和許多復(fù)雜疾病相關(guān),比如心血管類疾病和癌癥等第一百一十八頁,共190頁。miRNA與癌癥miRNA表達(dá)譜的基因組范圍研究指出原發(fā)癌中存在miRNA的表達(dá)變化特異的miRNA表達(dá)譜與特定類型的癌癥有關(guān),提示其有用于診斷的潛能第一百一十九頁,共190頁。癌癥的本質(zhì)歸結(jié)為各種原因引起的基因結(jié)構(gòu)和功能的異常致癌基因的高表達(dá)抑癌基因的低表達(dá)某些miRNA作用靶基因是重要的癌通路組成部分,參與了癌基因網(wǎng)絡(luò)調(diào)控miRNA第一百二十頁,共190頁。miRNA表達(dá)的變化認(rèn)為是發(fā)生癌癥的共同特征oncogenicmiRNAs(oncomiRs)第一百二十一頁,共190頁。Proliferation
Invasionmetastasis
AngiogenesisApoptosisOncogenicmiRNAsTumorSuppressormiRNAsCancer表達(dá)降低表達(dá)升高第一百二十二頁,共190頁。mir-17-92cluster—asoncogenicmiRNAsc-MYCmir-17Promote‘stemcell’properties第一百二十三頁,共190頁。mir-17-92clusterislocatedataamplifiedregionDNAinB-celllymphomas.Here,wehaveshownthatonemiRNApolycistronisnotonlythesubjectoftumour-specificamplification,butthatitisalsooverexpressedintumoursandtumourcelllines,andcanactasanoncogeneinvivo.Adetailed,mechanisticunderstandingofhowthisnon-codingRNAclusteractsasanoncogeneisatpresenthamperedbythelackofavalidatedbiochemicalstrategyforidentifyingmiRNAtargets.第一百二十四頁,共190頁。mir-17-92cluster—astumoursuppressorc-MYC17-5p,20aE2F1mir-17ProliferationGrowth第一百二十五頁,共190頁。Loss-of-heterozygosityofthechromosomalregionencompassingthemir-17cluster(13q31)hasbeenobservedinhumanmalignancies.NegativeregulationofE2F1translationbymiR-17-5pandmiR-20aprovidesamechanismtodampenthisreciprocalactivation,promotingtightlycontrolledexpressionofc-MycandE2F1geneproducts.Itsuggeststhatthemir-17cluster,bydecreasingE2F1expression,tightlyregulatesc-Myc-mediatedcellularproliferation.
第一百二十六頁,共190頁。ItisthuslikelythatthesemiRNAsinfluencecellproliferationandtumorigenesisinacell-typespecificmanner,dependingonthemilieuoftargetmRNAsthatareexpressed.第一百二十七頁,共190頁。與癌癥相關(guān)的miRNA第一百二十八頁,共190頁。JournalofThoracicOncology:December2011-Volume6第一百二十九頁,共190頁。癌癥中的ncRNA表達(dá)ncRNA表達(dá)譜可作為特定癌癥的表型標(biāo)簽癌癥中的ncRNA表達(dá)變化是因還是果,需要對ncRNA功能的進(jìn)一步研究第一百三十頁,共190頁。二、ncRNA表達(dá)譜分類人類癌癥許多研究已經(jīng)表明編碼蛋白的轉(zhuǎn)錄本(mRNA)可以有效地區(qū)分各種癌癥。這些與癌癥相關(guān)的轉(zhuǎn)錄本作為一種可靠的生物學(xué)標(biāo)記(biomark)已被廣泛應(yīng)用于各種癌癥的分型研究。我們將采用Lu等人發(fā)表于2005年nature期刊miRNA表達(dá)譜數(shù)據(jù)來探索基于miRNA表達(dá)水平的癌癥分類。第一百三十一頁,共190頁。首先GEO數(shù)據(jù)庫GSE2564獲取所有相關(guān)數(shù)據(jù),其中包括334個樣本的原始miRNA表達(dá)數(shù)據(jù),預(yù)處理后的miRNA表達(dá)數(shù)據(jù),探針信息,樣本信息等。該表達(dá)譜數(shù)據(jù)包含用兩個芯片平臺檢測的334個樣本的miRNA表達(dá)譜。所采用的預(yù)處理過程包括基于控制探針的標(biāo)準(zhǔn)化,修正表達(dá)強(qiáng)度偏低的探針,刪除所有控制探針,以及對表達(dá)值進(jìn)行以2為底的對數(shù)轉(zhuǎn)換。第一百三十二頁,共190頁。采用層次聚類方法平均鏈路算法,皮爾森相關(guān)系數(shù)可以明顯看出具有共同組織發(fā)育起源的樣本被聚到一起。第一百三十三頁,共190頁。第一百三十四頁,共190頁。
除了上述所用到218個樣本,該數(shù)據(jù)還包括了檢測自73個急性淋巴細(xì)胞白血病患者骨髓樣本的miRNA表達(dá)水平。第一百三十五頁,共190頁。利用t檢驗方法對正常組織與腫瘤組織的miRNA表達(dá)水平進(jìn)行比較,并使用隨機(jī)擾動的方法為每個miRNA產(chǎn)生一個p值,最后對p值進(jìn)行bonferroni校正。第一百三十六頁,共190頁。第一百三十七頁,共190頁。2012年8月28日《GenomeBiology》,斯坦福大學(xué)醫(yī)學(xué)院研究人員進(jìn)行首個大型的癌癥lncRNA表達(dá)譜分析。對64個腫瘤樣品高通量RNA-seq測序,在各種腫瘤類型之間找出差異表達(dá)的1065個lncRNA(圖12-13)。因此lncRNA可以成為生物標(biāo)志物。第一百三十八頁,共190頁。圖12-13lncRNA表達(dá)譜分類人類癌癥第一百三十九頁,共190頁。GliomageneexpressiondatausedinthisstudywereobtainedfromthepubliclyavailableGEO.AffymetrixHG-U133Plus2.0platform2448lncRNAtranscriptswithcorrespondingAffymetrixprobeIDsSignificanceAnalysisofMicroarrayswasusedtodeterminethedifferentiallyexpressedlncRNAs≥2-fold,FDR<10%第一百四十頁,共190頁。DifferentiallyexpressedlncRNAprobesetsbetweennormalbrainsandgliomasAtotalof129lncRNAprobesets(correspondingto102lncRNAs)identifiedassignificantlydifferentbetweennormalbraintissuesandgliomasbySAM.第一百四十一頁,共190頁。Blue---normalbraintissues;yellow---gliomasamples.第一百四十二頁,共190頁。三、ncRNA表達(dá)譜與mRNA表達(dá)譜的整合分析隨著檢測技術(shù)的不斷發(fā)展,生物學(xué)資源的大量涌現(xiàn),生物信息學(xué)研究者已經(jīng)不僅僅局限于使用一種數(shù)據(jù)資源第一百四十三頁,共190頁。表型數(shù)據(jù)
互作網(wǎng)絡(luò)表達(dá)數(shù)據(jù)
SNP整合整合多種類型的生物數(shù)據(jù)(如各種表達(dá)譜數(shù)據(jù)、互作網(wǎng)絡(luò)、調(diào)控網(wǎng)絡(luò)、SNP數(shù)據(jù)、表型數(shù)據(jù)等)來解決特定復(fù)雜的生物醫(yī)學(xué)問題第一百四十四頁,共190頁。剖析重大疾病相關(guān)miRNA的調(diào)控機(jī)制和功能生物學(xué)證實TargetgenesmiRNA功能1功能n功能2表型背景信息???HITS-CLIP第一百四十五頁,共190頁。ItisclearthatmiRNAshavemanydifferenttargets—dozensinsomecases,hundredsinothers—butdependingonthecellsinvolved,itseemslikelythatonlyasmallnumberofthemhaveacrucialroleincancerpathogenesis.
naturereviewsgenetics(2009)第一百四十六頁,共190頁。預(yù)測疾病背景下miRNA調(diào)控的靶基因數(shù)據(jù)mRNA表達(dá)譜第一百四十七頁,共190頁。miRNA表達(dá)譜第一百四十八頁,共190頁。miRNA-mRNA靶向關(guān)系第一百四十九頁,共190頁。皮爾森相關(guān)系數(shù)第一百五十頁,共190頁。第一百五十一頁,共190頁。第一百五十二頁,共190頁。AhubmiRNAsignaturepredictssurvivalinglioma第一百五十三頁,共190頁。第一百五十四頁,共190頁。第一百五十五頁,共190頁。前提假設(shè)miRNAsimplicatedinaspecifictumorphenotypewillshowaberrantregulationoftheirtargetgenesAkeydifferencefromothermethodsisthatweidentifieddysregulatednetworkedges(regulations)insteadofdysregulatednodes(miRNAs)toassembledisease-relatedsignatures.第一百五十六頁,共190頁。miRNA
family的協(xié)同失調(diào)作用第一百五十七頁,共190頁。包含三個miRNA家族mir-125,mir-181和mir-145家族最小的后驗概率為77.4%,表明這些miRNA和前列腺癌相關(guān)這些基因富集的功能有‘pathwaysinprostatecancer’,‘celladhesion’and‘a(chǎn)poptosis’等第一百五十八頁,共190頁。第五節(jié)
復(fù)雜疾病非編碼RNA的計算識別
Section5ComputationalIdentificationofComplexDiseasesAssociatedNon-codingRNAs第一百五十九頁,共190頁。一、概述二、復(fù)雜疾病相關(guān)miRNA的計算識別三、復(fù)雜疾病相關(guān)lncRNA的計算識別四、復(fù)雜疾病相關(guān)非編碼RNA數(shù)據(jù)資源第一百六十頁,共190頁。一、概述系統(tǒng)地識別疾病相關(guān)的ncRNA是在分子水平上理解ncRNA誘導(dǎo)疾病的發(fā)病機(jī)制的前體,是為疾病診斷,治療和預(yù)防設(shè)計有關(guān)特定分子工具的關(guān)鍵。通過實驗方法通常只局限于單一或者少量的ncRNA,難以從系統(tǒng)的角度研究疾病相關(guān)的ncRNA。計算生物學(xué)的方法成為解決這一問題的關(guān)鍵,為未來實驗設(shè)計提供優(yōu)先的對象。第一百六十一頁,共190頁?;趍iRNA-靶基因預(yù)測基于miRNA調(diào)控網(wǎng)絡(luò)預(yù)測miRNA協(xié)同與復(fù)雜疾病二、復(fù)雜疾病相關(guān)miRNA的計算識別第一百六十二頁,共190頁?;趍iR
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 快遞區(qū)域承包合同
- 合伙出資成立公司協(xié)議
- 瀝青水穩(wěn)運(yùn)輸合同協(xié)議書
- 辦公桌椅購銷合同協(xié)議
- 裝修工程勞務(wù)分包合同書
- 建筑工程建設(shè)工程合同與索賠
- 浙教版高中信息技術(shù)必修1教學(xué)設(shè)計-3.3 多媒體信息處理
- 19父愛之舟 教學(xué)設(shè)計-2024-2025學(xué)年語文五年級上冊統(tǒng)編版
- 智能接地狀態(tài)在線監(jiān)測儀用在什么場所
- Unit5Fun clubs.SectionA1a-1d教學(xué)設(shè)計設(shè)計2024-2025學(xué)年人教版英語七年級上冊
- GA 814-2009 警用約束帶標(biāo)準(zhǔn)
- 釘釘考勤休假規(guī)定
- 海氏崗位價值評估法應(yīng)用實踐課件
- 慢性腎病知識講座課件
- 國家自然科學(xué)基金申請經(jīng)驗交流課件
- 領(lǐng)子的分類課件
- 農(nóng)產(chǎn)品的互聯(lián)網(wǎng)營銷課件
- 三年級下冊數(shù)學(xué)課件 兩位數(shù)除兩、三位數(shù) 滬教版 (共15張PPT)
- 《六大茶類》講義
- X會計師事務(wù)所的J城投公司發(fā)債審計項目研究
- 中國傳媒大學(xué)全媒體新聞編輯:案例教學(xué)-課件-全媒體新聞編輯:案例教學(xué)-第7講
評論
0/150
提交評論