高通量測(cè)序科研入門(mén)常用名詞意義整理_第1頁(yè)
高通量測(cè)序科研入門(mén)常用名詞意義整理_第2頁(yè)
高通量測(cè)序科研入門(mén)常用名詞意義整理_第3頁(yè)
高通量測(cè)序科研入門(mén)常用名詞意義整理_第4頁(yè)
高通量測(cè)序科研入門(mén)常用名詞意義整理_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、目錄 TOC o 1-5 h z HYPERLINK l bookmark0 o Current Document 一、OTU分類(lèi)和統(tǒng)計(jì)2 HYPERLINK l bookmark2 o Current Document 二、生物信息分析 2 HYPERLINK l bookmark4 o Current Document 三、16SrRNA 3 HYPERLINK l bookmark6 o Current Document 四、Alpha 多樣性4 HYPERLINK l bookmark8 o Current Document 五、稀疏性分析 r rarefaction analysis

2、 )和稀疏性曲線(rarefaction curve ) 7 HYPERLINK l bookmark10 o Current Document 六、Shannon-Weiner指數(shù)8 HYPERLINK l bookmark12 o Current Document 七、Rank Abundance曲線9 HYPERLINK l bookmark14 o Current Document 八、微生物種屬鑒定及相關(guān)分析 1.0 HYPERLINK l bookmark16 o Current Document 九、OTU群落聚類(lèi)及相關(guān)分析 14 HYPERLINK l bookmark18 o

3、 Current Document 十、Rank Abundance 曲線15 HYPERLINK l bookmark20 o Current Document H一、韋恩圖(Venn ) 1.6-、OTU分類(lèi)和統(tǒng)計(jì)OTU(operationaltaxonomicunits)是在系統(tǒng)發(fā)生學(xué)研究或群體遺傳學(xué)研究中,為了便于進(jìn)行分析,人為給某一個(gè)分類(lèi)單元(品系,種,屬,分組等)設(shè)置的同 一標(biāo)志。通常按照97%勺相似性閾值將序列劃分為不同的 OTU每一個(gè)OTU!常 被視為一個(gè)微生物物種。相似性小于 97瓶可以認(rèn)為屬于不同的種,相似性小于 93%-95%可以認(rèn)為屬于不同的屬。樣品中的微生物多樣性和不

4、同微生物的豐度 都是基于對(duì)OTUB分析。Coverage是指各樣品文庫(kù)的覆蓋率,其數(shù)值越高,則樣本中序列沒(méi)有被測(cè)出的 概率越低。該指數(shù)實(shí)際反映了本次測(cè)序結(jié)果是否代表樣本的真實(shí)情況。計(jì)算公式為:C=1-n1/N其中口1=只含有一條序列的OTU勺數(shù)目;N才由樣中出現(xiàn)的 總的序列數(shù)目。分類(lèi)水平統(tǒng)計(jì)表主要是對(duì)每個(gè)樣本在分類(lèi)學(xué)水平上的數(shù)量進(jìn)行統(tǒng)計(jì), 并且在表格 中列出了在每個(gè)分類(lèi)學(xué)水平上的物種數(shù)目(只顯示前 10個(gè)樣本,如果樣本超過(guò)10個(gè),請(qǐng)查看結(jié)果中taxon_all.txt 文件) 其中SampleNamefe示樣本名稱(chēng);Phylum表示分類(lèi)到門(mén)的 OTIM量;Class表示 分類(lèi)到綱的OTU&量;

5、Order表示分類(lèi)到目的OTU量;Family表示分類(lèi)到科的 OTUJ&量;Genus表示分類(lèi)到屬的OT吸量;Species表示分類(lèi)到種的OT吸量。二、生物信息分析.數(shù)據(jù)統(tǒng)計(jì)分析1)有效測(cè)序數(shù)據(jù)統(tǒng)計(jì)2)可供精準(zhǔn)分析的數(shù)據(jù)統(tǒng)計(jì).數(shù)據(jù)回歸樣品1)根據(jù)tag信息將測(cè)序數(shù)據(jù)回歸各自樣品.單樣品微生物種類(lèi)及豐度分析1)序列聚類(lèi) OTU(OperationalTaxonomicUnits )2)取樣深度判定(RarefactionCurve )3)計(jì)算菌群多樣性和豐度指數(shù)4)單樣品群落結(jié)構(gòu)分析.多樣品間比較分析1)全樣品相似度比對(duì)2)多樣品OTU比較3)多樣品群落結(jié)構(gòu)分析4)PCA (Principalc

6、omponentanalysis )分析5)WeightedunifracPCA 分析6)組間顯著性差異分析16SrRNA為核糖體的RNA勺一個(gè)亞基,16SrDNAft是編碼該亞基的基因。細(xì)菌 rRNA (核糖體RNA按沉降系數(shù)分為3種,分別為5S、16S和23SrRNA 16SrDNAl 細(xì)菌染色體 上編碼16SrRN片目對(duì)應(yīng)的DNAff列,存在于所有細(xì)菌染色體基因中。16SrDNA細(xì)菌的系統(tǒng)分類(lèi)研究中最有用的和最常用的 分子鐘,其種類(lèi)少, 含量大(約占細(xì)菌DNAt量的80% ,分子大小適中,存在于所有的生物中,其 進(jìn)化具有良好的時(shí)鐘性質(zhì),在結(jié)構(gòu)與功能上具有高度的保守性2,素有“細(xì)菌化石”之

7、稱(chēng)。在大多數(shù) 原核生物中rDNA都具有多個(gè)拷貝,5S、16S、23SrDNA勺拷 貝數(shù)相同。16SrDNAS于大小適中,約1.5Kb左右,既能體現(xiàn)不同菌屬之間的差 異,又能利用測(cè)序技術(shù)較容易地得到其序列,故被細(xì)菌學(xué)家和分類(lèi)學(xué)家接受。16SrRNA 16SrDNA勺區(qū)另16S中的S是一個(gè)沉降系數(shù),亦即反映生物大分子在離心場(chǎng)中向下沉降速 度的一個(gè)指標(biāo),值越高,說(shuō)明分子越大。rDNA和rRNA中的小寫(xiě)字母r是 ribosome(核糖體)的縮寫(xiě)。rDNA指的是基因組中編碼核糖體 RNA(rRNA)分子的 對(duì)應(yīng)的DNAff列,也就是編碼16SrRNA勺基因。rRNA指的是rDNA的轉(zhuǎn)錄產(chǎn)物, 它是構(gòu)成核

8、糖體的重要成分,核糖體由許多小的rRNA分子組裝而成,16SrRNA是其中一個(gè)組件.一般所分析的對(duì)象都是16srDNA因?yàn)镈NAE取容易,也比較 穩(wěn)定。16S rRNA具有多項(xiàng)功能。.對(duì)于核糖體蛋白的固定起到腳手架的作用。2.3末端包含反向的 SD序列,用來(lái)與 mRNA的AUG起始密碼子結(jié)合。16S rRNA的 3端與S1、S21的結(jié)合被發(fā)現(xiàn)與蛋白質(zhì)合成的開(kāi)始有關(guān)系。.與23S進(jìn)行交互,幫助兩個(gè) 核糖體子單元的結(jié)合。(50S+30S ).在A site穩(wěn)定密碼子與反密碼子的正確配對(duì)。16SrDNA定方法隨著生物技術(shù)的飛速發(fā)展,傳統(tǒng)的微生物鑒定方法常常難以鑒定眾多的生長(zhǎng) 習(xí)性復(fù)雜的微生物,因而基

9、于基因組序列的分子鑒定受到廣泛關(guān)注。在細(xì)菌基因 組中,編碼16SrRNAW rDNA基因具有良好的進(jìn)化保守性,適宜分析的長(zhǎng)度(約| 為1540bp),以及與進(jìn)化距離相匹配的良好變異性,所以成為細(xì)菌分子鑒定的 標(biāo)準(zhǔn)標(biāo)識(shí)序列。16SrDNA勺序歹U包含9或10個(gè)可變區(qū)(variableregion )和11 個(gè)恒定區(qū)(constantregion )。保守序列區(qū)域反映了生物物種間的親緣關(guān)系,而 高變序列區(qū)域則能體現(xiàn)物種間的差異。16SrDN6子的序列特征為不同分類(lèi)級(jí)別 的近緣種系統(tǒng)分類(lèi)奠定了分子生物學(xué)基礎(chǔ)。目前16SrDNA勺序列信息已經(jīng)廣泛應(yīng) 用于菌種鑒定和系統(tǒng)發(fā)生學(xué)研究。16SrDNAR據(jù)分析

10、初始數(shù)據(jù)層面:質(zhì)量統(tǒng)計(jì),序列長(zhǎng)度及分布統(tǒng)計(jì),數(shù)據(jù)預(yù)處理,有效序列統(tǒng) 計(jì)。QTUU面:OTUb類(lèi)學(xué)統(tǒng)計(jì),Alpha多樣性分析,稀疏性曲線,Shannon-Wiene 曲線,Rankabundance曲線。物種豐度層面:物種分類(lèi)注釋?zhuān)珺eta多樣性分析,樣本問(wèn)OT必異分布分 析,OTU度分布聚類(lèi)分析,主成分分析,顯著性差異分析,樣本組間差異分析。群落結(jié)構(gòu)層面多樣本物種分布比較,群落相似度比較, 群落相似度PCoA 分析,基于組間進(jìn)化的差異顯著性(Un)WeightedUnifrac 分析,RDA/CCA1群與 環(huán)境因子之間的關(guān)系分析,系統(tǒng)發(fā)育樹(shù)的構(gòu)建,含種類(lèi)分級(jí)的進(jìn)化樹(shù)的構(gòu)建。四、Alpha多樣性

11、在微生物多樣性分析的報(bào)告 中主要包括五個(gè)部分:Alpha多樣性分析、Beta 多樣性分析、物種組成分析、進(jìn)化關(guān)系分析、相關(guān)性分析 ,其中Alpha多樣性分 析是生態(tài)學(xué)中生物多樣性的一個(gè)重要的組成部分,也是比較基礎(chǔ)的一部分。Alpha多樣性是指一個(gè)特定區(qū)域或生態(tài)系統(tǒng)內(nèi)的多樣性,是反映豐富度和均勻度的綜合指標(biāo)。Alpha多樣性主要與兩個(gè)因素有關(guān):一是種類(lèi)數(shù)目,即豐富度; 二是多樣性,群落中個(gè)體分配上的均勻性。群落豐富( Communityrichness )的 指數(shù)主要包括Chao指數(shù)和ACE旨數(shù)。群落多樣性(Communitydiversity )的指 數(shù),包括Shannon指數(shù)和Simpson

12、指數(shù)。(Simpson指數(shù)是評(píng)價(jià)優(yōu)勢(shì)度,Shannon 是評(píng)價(jià)多樣性;Simpson指數(shù)越高代表物種多樣性越低;Simpson指數(shù)和Shannon 指數(shù)是相反關(guān)系)匕IDReadg(LOSOTUKEdw3仁口VEI70EshniaKL! andImm21U1Z?3145)128 (1-20.95覦%Z63 wii VW(2.f4( 2C】)Q+2W1 (Ok 1921, & 2082)n 曳 eooom10846154154 143.178)157(13. IM)0.箱76031(2.S9h 2. 6&)Ou 2041 (0L 1988.0. 213S)134, 000000士皿,leA310

13、B0312(194, IE幻14031,1Z】f ) 0. 99TSM2.祐 (2.6f 2.68)0lM2 g 1901, & 204n126.0000001005122130 (125, US)12T (173,140)0. 966072.M1(2. 65, 2.12)0L1969(0l 1EB4, Q. 2fl35)122.00000010004US:3h”27,3)131U23,15EQ. 997BO12.33ft色之3T)OlZ, . 10. 270Sh Q. 2B加i群落豐富度指OTU數(shù)目的指數(shù),chaol在生態(tài)學(xué)中常用來(lái)估計(jì)物種總數(shù),由 Chao(1984)OTU數(shù)目的指數(shù),ch

14、aol在生態(tài)學(xué)中常用來(lái)估計(jì)物種總數(shù),由 Chao(1984)只含有一演序列的口TV數(shù)目f如喇金心V),七只含存商條序列的cti:數(shù)n(如山阿皿”工Ace:用來(lái)估計(jì)群落中含有 OTU數(shù)目的指數(shù),由 Chao提出,是生態(tài)學(xué)中估計(jì)物種總數(shù)的常用指數(shù)之一, 與Chaol的算法不同。 080胃4好該等級(jí)OTU中序列數(shù)的相對(duì)百分含量,即屬于該 OTU的序列數(shù)除以總序列數(shù),縱坐標(biāo)軸上數(shù) 字,例如“108弋表相對(duì)豐度為100%, “1酰表相對(duì)豐度為10%,依次類(lèi)推。八、微生物種屬鑒定及相關(guān)分析分類(lèi)學(xué)分析在之前的分析步驟中,已經(jīng)將序列按照其自身的堿基組成的相似性,分歸到各OTU中。在進(jìn)行分類(lèi)學(xué)分析時(shí), 首先,將

15、每一條優(yōu)質(zhì)序列都與 SILVA 119數(shù)據(jù)庫(kù)進(jìn)行比對(duì), 找出其最相近且 可信度達(dá)80%以上的種屬信息。之后,將每一個(gè)OTU中的所有序列進(jìn)行類(lèi)比,找出同一 OTU中 的不同序列的最近祖先的種屬信息。最后,將得到的結(jié)果記錄在表格文件中。這樣做,可以在保留最可能多的信息量的情況下,確保得出信息的準(zhǔn)確性。使用軟件:mothur10PFl nameA二CQT腐田EKjperidngdomphylimdasaoideirfamilygenusspeciescmji$2639711,SISAl GPXP&.k MTWHjoBxim 域Pm觀s%向GaninfinaMbx“叩fjgSlRlilV-blyWid

16、y口而。珈IEurwult M .回心m uDTU221322C H制的Al第。IP.日盛舊聞rM*upi6*一箱域FiELgESelM中即中ui出uihcuUjiM iuwn bucci ifn01U3102?HU?的AJ GROLP,日就而或 rWXsuiM目TFinicucKAl1小。出10叱*(麻j . jih./iurcult 既ur把nMcuoma1加1J58522577Al樂(lè)琪只Bam伊喇即BaLiena日;th巾蝴fi日和lerdd值存*n*urcult bc urntetc-su12E51E24即驍再Al GROtPr日m MYiupi口齪1時(shí)dFimicub網(wǎng)W r#id5

17、、汕京Eiyvpflal 向Sd 出 Hwiuirurt- ulLi n 15 競(jìng)口 bat 匕ur575276222N由值加r加旌up日?qǐng)F(tuán):中金Fini監(jiān)tk哥蚓皿畛%lwr Q(W岫 1 5V&l jilt 就史&SeliKumtmat% HUiriUf J: biff i.1251:21站d魚(yú)Al GP.3LP.BjHt a加池伊昵呼&Finicj踮H-juLhxl:*恥如IITHMKWE蔚字筆=L,. dsk. lurtult pc rumn bactiiirCfTLfl215245195(7Al GFCiLPBjLir日ad前人日必皿加科Oacls1 adiiuKuHbied iim

18、erl bEeriiTiOTU name 為 OTU 編號(hào);第二列至OTUsize列的前一列為各樣本的序列在所有OTU中的含有情況。例如,第二行第二列的數(shù)字代表樣品 A中有多少序列被劃分入 OTU1中。OTUsize為該OTU中所含序列的數(shù)量;Taxonomy列為OTU對(duì)應(yīng)的種屬信息。種屬信息按照分類(lèi)學(xué)水平分為多列,我們將物種 的門(mén)、綱、目、科、屬、種的信息進(jìn)行了分類(lèi)分析,便于對(duì)數(shù)據(jù)的篩選提取。例如,需要提 取所有含有屬信息的 OTU的相關(guān)信息,可在excel中選取屬這一列,在工具欄的數(shù)據(jù)項(xiàng)中, 點(diǎn)選篩選,查看該列第一行的單元格,在下拉菜單中的文本篩選項(xiàng)下方的區(qū)域內(nèi),取消選擇“空白”,點(diǎn)確定,

19、即得到所有含有屬信息的OTU言息。注:分類(lèi)學(xué)數(shù)據(jù)庫(kù)中會(huì)出現(xiàn)一些分類(lèi)學(xué)譜系中的中間等級(jí)沒(méi)有科學(xué)名稱(chēng),以 norank作 為標(biāo)記。分類(lèi)學(xué)比對(duì)后根據(jù)置信度閾值的篩選,會(huì)有某些分類(lèi)譜系在某一分類(lèi)級(jí)別分值較低,在統(tǒng)計(jì)時(shí)以Unclassified 標(biāo)記。6個(gè)水平分別提取信息,分將OTU6個(gè)水平分別提取信息,分例表:11分黑的熱制z11345e1ag3 UsdjeIpjporkinjd&mi由口 iWIR11?B1920731曄i1531851仃14聊11133icm海phvl 師Prcrf-nnaclPfia41153S304839153S37&6131BD鋁發(fā)181mas晅T - nxjtpgpe69U

20、5812B71&5S99網(wǎng)53395J125K?19S3的53512phyiumFi-micxrle3236郵4乳a117295154i72011S32Biphylumi日各口日療用演三合1:12Ua的5015璇31TMS制4da.GamnroleDbactefia374B3300止.謝13a73119B?10C771420024013日96102751classTherrTotDae33932S351324310225T0叫1T563362204 Heflspoleobadlfai 的324224到470加316172152寸classClOStridiiEi切474a第1居TG5S113力

21、的日閃1日口吐1310T3a弼利S3V,如血10rdMPi?ucflnwia:3l#s10n2410WJI1J17I23BT33802ad中支 H jpqii 引電326bh-io?1?吃11231磔G32也弘597fficrd*TDtiubriarulti3:322129S3?砌打口,d314172Z3T1晶 Nnt1。而啊;iMIhXm2ma1061928oQW.咖cndtfThimcrt&gj et339329152079115243160225TOBJ1T5638622CM7)0 rde*Fl芯川工日3T4J4qD1?DLUrCIms辜而琮d211302J3139215用2491522

22、732126grn哥UnClassrfie-d432的r?0緘2431湖M2M3M24124familyDrear: 5p TillsceBe日0001123113204J3D2613與 rniyHlruTs3n-dacgae25142132159051W33637d32333&胞familyDes uMh b的威 E&e32322429-卻*224SJ3U1722370串門(mén)皿eUnCla&s 市 K2651科l-UUb8466437蔣73258165J34JBZ38孕n加密Maur jbiLterdrrc001123110632皿926砂2genu ePsetidomo-nasa130011

23、41672306S0JtMMJmpeoHth -.iliedt34HdglEd“1M3Dg124bi21業(yè)2? 146EHAlOtJIlr9呼Huncu:uredtplGque-Ua 口 Tn 出口 K AHodin-ium口 g陽(yáng)zcurn口 Annoe&opnryaO 心 yrOdmuiTiDwrF 四皿口一口 小呻3M%Maxiiffiipod 941 %other在圖中顯示other在圖中顯示多樣品相似度樹(shù)與柱狀圖組合分析13左邊是樣品間基于群落組成的層次聚類(lèi)分析( bray-curtis算法),右邊是樣品的群落結(jié)構(gòu)柱狀圖例圖:GyFOOlniumGyFOOlniumpg 即Ani侯廂

24、 hryCochlodin umGonyiuljxColKzoumNsoceratiumHeTerodin(umKirKidm nrr.口l-nplnT+cn小 閂 irtniwtftninnTelonemanFil / OCyStiE一TinseirnisDubciscquella曰ythrqpsidiniiiniIwencielaTeleaulaKtrcKiibidiLmHeraconL&F im:j|kisPrymnesiuniCrry&ociwcmuiinaB jBtDdiiiiuinChytriddniifntixdridiunr口RlvzosptiMflaothers九、OTU群落

25、聚類(lèi)及相關(guān)分析OTU(Operational Taxonomic Units )是在系統(tǒng)發(fā)生學(xué)研究或群體遺傳學(xué)研 究中,為了便于進(jìn)行分析,人為給某一個(gè)分類(lèi)單元(品系,種,屬,分組等)設(shè) 置的同一標(biāo)志。在生物信息分析中,一般來(lái)說(shuō),測(cè)序得到的每一條序列來(lái)自一個(gè) 菌。要了解一個(gè)樣品測(cè)序結(jié)果中的菌種、 菌屬等數(shù)目信息,就需要對(duì)序列進(jìn)行歸 類(lèi)操作(cluster )。通過(guò)歸類(lèi)操作,將序列按照彼此的相似性分歸為許多小組, 一個(gè)小組就是一個(gè)OTU根據(jù)客戶(hù)指定的相似度(96% 97前者98% ,對(duì)所有 序列進(jìn)行OTU劃分并進(jìn)行生物信息統(tǒng)計(jì)分析。通常在97%勺相似水平下的OTU進(jìn) 行生物信息統(tǒng)計(jì)分析。14QTUnawAB口EFGHIJKLOTU sicQT晅*IM10C2104CN6前國(guó).潴222舊詢(xún)aorg7m7M?4WMF11M幅111Q1K3K?OTUSd器4-m33ffl&l俯?85WHKForw139fi而1?ra1-fcXJ1M3-&T3335冊(cè)?FifidS

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論